Ученые из Института искусственного интеллекта AIRI создали и выложили в открытый доступ крупнейший в мире набор данных по квантовой химии, чтобы расширить возможности исследований в области поиска новых материалов и разработки лекарств. Исследование опубликовано в журнале Physical Chemistry Chemical Physics.
Разработка новых лекарственных препаратов и материалов зависит от качества предсказания физических и химических свойств будущего продукта. Один из новых и популярных подходов к решению подобных задач – применение методов на стыке квантовой химии и искусственного интеллекта (ИИ). Однако для обучения моделей ИИ предсказанию свойств молекул необходим доступ к соответствующей информации о каждой из их многочисленных характеристик, а качество предсказания будет зависеть от количества и разнообразия данных.
По словам Артура Кадурина, руководителя научной группы «Глубокое обучение в науках о жизни» AIRI, подавляющее большинство исследований, недавно проведенных в этой области, ограничивается экспериментами на небольшом количестве структур разных веществ, что ставит под сомнение применимость моделей ИИ в реальных задачах индустрий.
С целью решения этой проблемы ученые Института AIRI при поддержке коллег из Сколтеха и ПОМИ РАН собрали 5 340 152 конформаций для 1 004 918 подобных лекарствам молекул, а также их квантовые свойства, и выложили базу данных в открытый доступ на маркетплейс артефактов машинного обучения DataHub. Доступ к датасету возможен через платформу ML Space. В дополнение к данным в набор включили 4 модели для предсказания энергии молекулярной конформации и 2 модели для работы с теорией функционала плотности.
Хотя получить модели, близкие к химической точности, по-прежнему сложно, экспериментальные данные показывают, что большие наборы данных приводят к повышению качества моделей ИИ. Научная группа планирует дальше пополнять уже собранную базу и надеется, что эта работа сделает in silico эксперименты более доступными, а точность предоставляемых результатов приблизится к качеству лабораторных исследований.
Источник: https://goo.su/m7zz
Изображение для превью новости предоставлено: https://goo.su/xxlP50t