OpenFold3: Открытая революция в предсказании белковых взаимодействий

OpenFold3 — открытая модель ИИ, предсказывающая взаимодействие белков с лекарствами. Это прорыв для разработки новых препаратов, доступный всем ученым и компаниям.

OpenFold3: Открытая революция в предсказании белковых взаимодействий

В мире молекулярной биологии и разработки лекарств произошло долгожданное событие: крупный консорциум исследователей под руководством Мохаммеда Аль-Курайши из Колумбийского университета представил модель искусственного интеллекта OpenFold3.

Эта система, запущенная 28 октября, представляет собой открытую и доступную для всех реконструкцию знаменитой, но закрытой модели AlphaFold3 от Google DeepMind.

Если AlphaFold2 в 2024 году принес своей команде Нобелевскую премию по химии, решив проблему предсказания формы одиночных белков, то его преемник сделал следующий шаг — научился предсказывать, как белки взаимодействуют с другими молекулами: ДНК, РНК, другими белками и, что особенно важно, с небольшими молекулами лекарственных препаратов.

Почему это так важно?

Биология — это не набор изолированных молекул. Клетка похожа на высокоорганизованный город, где белки, эти «рабочие лошадки» организма, постоянно взаимодействуют друг с другом и с тысячами других соединений. Чтобы создать эффективное лекарство, ученым нужно понять, как его молекула будет связываться с белком-мишенью, например, блокируя вредоносную активность или, наоборот, усиливая полезную функцию.

«Биология — это не изолированные белки. Это биомолекулы, взаимодействующие друг с другом», — подчеркивает Вуди Шерман, директор по инновациям компании Psivant Therapeutics и глава исполнительного комитета OpenFold.

Именно эту сложную задачу и решает OpenFold3. С её помощью можно увидеть, как предсказания модели (синие ленты) с высочайшей точностью совпадают с экспериментально установленными структурами (серые). Вот белок PDE10 — мишень для лекарств от шизофрении — со встроенной в него ингибирующей молекулой. А вот фактор регуляции интерферона, связывающийся с ДНК, и антитело, захватывающее другой белок.

Открытость против закрытости

Главное отличие OpenFold3 от его прототипа — доступность. DeepMind изначально не раскрывала код AlphaFold3, что вызвало волну критики в научном сообществе. Сотни исследователей подписали петицию с требованием прозрачности.

«Трудно оценить вычислительный продукт, не видя исходных данных», — говорит Стефани Ванкович, специалист по вычислительной структурной биологии из Университета Вандербильта. Без открытого кода невозможно проверить точность прогнозов, понять ограничения модели и определить, какие данные нужны для ее улучшения.

Создание OpenFold3 было непростой задачей. Как отмечают эксперты, воспроизвести тонкие настройки и архитектурные решения, которые есть «в головах» создателей AlphaFold3, но не отражены в публикациях, крайне сложно. Команда OpenFold3 проделала титаническую работу, чтобы создать максимально близкий аналог, но некоторые различия остались.

Будущее за федеративным обучением

OpenFold3 уже взяли на вооружение фармацевтические гиганты. Пять компаний объединились в инициативу Federated OpenFold3, чтобы совместно обучать модель на своих собственных, закрытых данных, не раскрывая коммерческой тайны.

Проблема общедоступных баз данных, на которых обучались AlphaFold3 и OpenFold3, в их ограниченности. Как поясняет Робин Рём, генеральный директор компании Apheris, управляющей платформой для консорциума, лишь около 2% структур в этих базах связаны с молекулами, похожими на лекарства. В то же время в частных библиотеках фармкомпаний хранятся тысячи таких структур.

Каждый участник федерации обучает свою версию OpenFold3 на 4-8 тысячах пар «белок-лекарство». Apheris затем агрегирует полученные знания в одну глобальную модель, которая содержит информацию о примерно 20 000 взаимодействий, но не раскрывает сами конфиденциальные данные. Эта улучшенная модель возвращается компаниям для следующего цикла обучения, создавая все более мощный инструмент.

Что дальше?

Следующая цель команды OpenFold3 — добавить в модель воду и динамические движения. В реальной клетке белки не статичны, они плавают в водной среде, окружены ионами, вибрируют и меняют форму. Учет этой динамики позволит создавать еще более точные и реалистичные модели, приближая виртуальное проектирование лекарств к тому, как белки ведут себя в живой природе.

OpenFold3 — это не просто копия передового инструмента. Это демократизация технологий, открывающая путь к ускоренной разработке новых методов лечения для самых разных заболеваний, от шизофрении до рака, для исследователей и компаний по всему миру.

Создано: 20.11.2025 12:27:39