В четверг компания OpenAI объявила о разработке крупной языковой модели, специально обученной для работы с биологическими процессами. Модель получила название GPT-Rosalind в честь Розалинд Франклин. В отличие от большинства научных моделей, разработанных крупными технологическими компаниями, которые обычно имеют более универсальный подход, подходящий для различных областей, GPT-Rosalind ориентирована именно на биологию. На пресс-брифинге Юнюнь Ван, руководитель направления продуктов в области биологических наук OpenAI, отметила, что система создана для решения двух основных проблем, с которыми сталкиваются современные биологи. Первая проблема заключается в огромных объемах данных, накопленных за десятилетия секвенирования геномов и биохимических исследований белков, которые одному исследователю сложно обработать. Вторая проблема связана с тем, что биология включает множество узкоспециализированных подполей, каждое из которых имеет свои методы и терминологию. Например, генетик, изучающий ген, активный в клетках мозга, может испытывать трудности с пониманием обширной нейробиологической литературы.

Ван сообщила, что компания взяла крупную языковую модель и обучила её на 50 наиболее распространённых биологических процессах, а также на использовании основных публичных баз данных биологической информации. Дополнительное обучение привело к созданию системы, способной предлагать вероятные биологические пути и определять приоритетные цели для разработки лекарств. "Мы связываем генотип с фенотипом через известные пути и регуляторные механизмы, выводим вероятные структурные или функциональные свойства белков и действительно используем это механистическое понимание", — сказала Ван.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *