Исследование: мультимодальная ИИ-модель Mammal расширяет использование ИИ в разработке препаратов и генетических технологий

08 мая 2026
ФОТО: magnific.com /автор: freepik

Исследователи из подразделения искусственного интеллекта (ИИ) и биомедицины американской технологической корпорации IBM, а также из ряда академических и индустриальных центров США и Израиля представили мультимодальную ИИ-модель Mammal для задач разработки лекарств. С результатами исследования знакомит публикация в журнале Drug Discovery.

Разработанная система, указывается в работе, объединяет данные о белках, антителах, малых молекулах и экспрессии генов и, по данным авторов, показывает более высокую точность по сравнению с рядом специализированных моделей при прогнозировании токсичности препаратов, взаимодействия молекул и проектировании антител.

Модель была предварительно обучена на 2 млрд образцов из шести открытых биомедицинских наборов данных, включая UniProt, PubChem, ZINC, STRING и CELLxGENE. Архитектура поддерживает задачи классификации, регрессии и генерации, что позволяет использовать ее на разных этапах разработки препаратов - от поиска терапевтических мишеней и прогнозирования токсичности до проектирования антител и оценки связывания препаратов с белками, подчеркивают исследователи.

Для оценки эффективности Mammal протестировали l на 11 бенчмарках, охватывающих разные этапы разработки лекарств. В девяти задачах модель показала лучший результат по сравнению с ранее опубликованными специализированными системами, а еще в двух - сопоставимый уровень качества.

В задаче прогнозирования проникновения препаратов через гематоэнцефалический барьер точность модели достигла 95,7%, а в тесте ClinTox, связанном с оценкой токсичности и вероятности одобрения препаратов, - 98,6%. В задаче аннотации типов клеток улучшение F1-метрики составило 7,5% по сравнению с предыдущими моделями.

Отдельно исследователи проверили способность Mammal прогнозировать чувствительность опухолевых клеток к лекарствам. Для этого использовались профили экспрессии генов и данные о структуре молекул. В тестировании на четырех препаратах, отсутствовавших в обучающей выборке, модель правильно воспроизвела порядок их активности, который затем подтвердился в лабораторных экспериментах.

Авторы также протестировали систему на задачах проектирования антител, в частности, при восстановлении участков, отвечающих за связывание с антигенами. Для наиболее вариабельного участка точность предсказания аминокислотной последовательности оказалась на 19% выше по сравнению с предыдущими моделями.

Отдельное внимание ученые уделили возможности использования модели в генеративных задачах. Архитектура поддерживает как анализ данных, так и генерацию новых последовательностей, включая проектирование антител и моделирование молекулярных взаимодействий. Разработчики считают, что это может сократить объем дорогостоящих лабораторных тестов на ранних этапах разработки препаратов.