Ученые из MIT представили модель, которая может генерировать новые лекарства против туберкулеза. Большая часть вариантов алгоритма оказались эффективными.
Исследователи Массачусетского технологического института (MIT) внедрили новую функцию в алгоритмы машинного обучения, улучшив их способность к прогнозированию. Используя новый подход, который позволяет компьютерным моделям учитывать неопределенность в данных, команда института выявила несколько перспективных соединений, которые нацелены на транспортный белок, необходимый бактериям, вызывающим туберкулез. Если он отсутствует или не активен, то бактерии больше не могут размножаться.
Ученые использовали гауссовский процесс для присвоения значений неопределенности данным, по которым обучаются алгоритмы. Таким образом, когда модели анализируют обучающие данные, они также принимают во внимание, насколько надежны эти прогнозы. Исследователи получили совместное распределение всех его случайных величин, поэтому ИИ мог проанализировать все варианты новых соединений.
Еще одним преимуществом такого подхода является то, что алгоритму требует лишь небольшое количество тренировочных данных. В этом исследовании команда MIT тренировала модель с набором данных из 72 малых молекул и их взаимодействием с более чем 400 белками. Затем они смогли использовать этот алгоритм для анализа почти 11 тыс. малых молекул, которые они взяли из базы данных ZINC, общедоступного хранилища, содержащего миллионы химических соединений. Так они определили фермент PknB, который имеет решающее значение для выживания бактерий, но не является мишенью антибиотиков, применяемых в борьбе с туберкулезом.
Затем исследователи экспериментально протестировали некоторые из своих препаратов, чтобы увидеть, насколько хорошо они борются с ними. Среди молекул, которым модель присвоила наивысшую степень эффективности, около 90% из них оказались действительно эффективными.