В марте 2023 года выход GPT-4 ознаменовал новую веху не только в обработке текстов, но и в автоматизации фундаментальной науки. Профессор Университета Карнеги-Меллона (CMU) Гейб Гомес (Gabe Gomes) и его команда за рекордные сроки создали CoScientist — автономную систему на базе больших языковых моделей (LLM), способную планировать и проводить сложные химические эксперименты в реальном мире, используя удалённые роботизированные лаборатории.
🧪 От «дилера» до учёного: почему науке нужна автоматизация 2:13
Ведущий подкаста Натан Лабенц делится личным опытом работы в лаборатории под руководством профессора М. Кристины Уайт. Его работа в качестве ассистента-исследователя заключалась в оптимизации палладиевого катализатора для органических реакций . По его словам, 90% времени занимала рутинная «черновая» работа: взвешивание порошков на сверхточных весах.
Основные тезисы о проблеме современной экспериментальной науки:
- Низкий КПД: Лабенц вспоминает, что за год работы он лишь однажды столкнулся с неожиданным результатом, давшим новое знание. Остальное время он «чувствовал себя скорее низкоуровневым наркодилером, чем учёным», постоянно отвешивая по 4,5 мг ацетата палладия .
- Барьер входа: Гейб Гомес отмечает, что многие талантливые люди уходят из химии именно из-за отсутствия интеллектуальной стимуляции в рутинных процессах .
- Культурная стагнация: Если сравнить фото лабораторий 100-летней давности и современные, они будут выглядеть почти одинаково. Гомес утверждает, что прогресс городов и технологий огромен, но ручной труд химика за верстаком почти не изменился .
По мнению Гейба Гомеса, автоматизация через облачные лаборатории — это путь к демократизации науки. Это позволит учёным фокусироваться на формировании гипотез, а не на физическом манипулировании атомами .
🏗️ Архитектура CoScientist: мозг на базе GPT-4 и руки-роботы 5:20
Команда Гомеса начала работать над тонкой настройкой (fine-tuning) моделей вроде GPT-2 и BERT для научных задач ещё в октябре 2022 года, но результаты были разочаровывающими . Прорыв случился с выходом GPT-4.
Система CoScientist построена по модульному принципу «агентов» :
- Центральный планировщик (Planner): «Мозг» системы, принимающий запросы на естественном языке. На основе GPT-4 он координирует работу других модулей.
- Модуль веб-поиска: Ищет информацию о химических соединениях и реакциях в открытых источниках (например, Wikipedia или специализированные базы данных) .
- Поиск по документации: Обученный на спецификациях лабораторного оборудования модуль. Позволяет ИИ понимать, как управлять конкретным роботом, даже если данные о нём появились после даты отсечки обучения модели .
- Исполнитель кода: Запускает Python-скрипты в защищённой среде (Docker) для проведения расчётов стехиометрии и других математических операций .
- API физического мира: Отправляет команды роботизированным системам.
Гейб Гомес подчёркивает, что LLM всё ещё плохо справляются с арифметикой «в уме», поэтому возможность системы самой писать и запускать код для расчётов была критически важна .
☁️ Emerald Cloud Lab: «AWS для химии» 9:46
Ключевым партнёром проекта выступила компания Emerald Cloud Lab (ECL), основанная выпускниками CMU. Это огромный склад в Сан-Франциско, заполненный сотнями типов научных приборов (на сумму около $50 млн), которыми можно управлять дистанционно через код .
Особенности работы с облачной лабораторией:
- Эксперимент как код: Учёный не касается пробирок; он отправляет скрипт (форк Mathematica или Python), и роботы или технические специалисты выполняют его .
- Преодоление когнитивной нагрузки: Основной барьер для химиков — необходимость изучать сложные языки программирования для управления роботами. CoScientist переводит команды с английского («Синтезируй аспирин») в исполняемый код для ECL .
- Круглосуточная работа: По мнению Гомеса, природа не подчиняется графику работы детских садов или сну учёного. Роботы могут охлаждать реакцию ровно 12 часов без участия человека .
🚀 Шесть уровней возможностей ИИ-учёного 46:13
В своей статье в Nature команда Гомеса выделила шесть ключевых задач, с которыми CoScientist справился успешно:
- Планирование синтеза известных веществ: Поиск путей получения таких соединений, как аспирин или парацетамол .
- Навигация по документации: ИИ способен сам разобраться в управлении новым оборудованием, просто прочитав инструкцию .
- Управление через высокоуровневые команды: Перевод абстрактных задач в конкретные действия приборов.
- Низкоуровневое микроуправление: Точная настройка параметров работы механизмов.
- Создание комплексных рабочих процессов: Сочетание разных приборов для многоэтапных задач.
- Оптимизация (задача «Морской бой»): Нахождение условий для максимального выхода продукта .
Особое внимание Гейб Гомес уделяет шестому пункту. В одном из экспериментов ИИ нужно было оптимизировать реакцию из пространства в 6000 возможных комбинаций переменных. CoScientist справился с этим за 20 итераций, показав результат на уровне (а иногда и лучше) специализированных алгоритмов байесовской оптимизации .
⚖️ Риски, безопасность и «двойное назначение» 1:27:09
Гомес признаёт, что технология вызывает у него опасения. Некоторое время после создания прототипа он «не мог спать по ночам» .
Основные вызовы:
- Злоупотребление: ИИ может помочь в синтезе токсичных веществ или биологического оружия. Поэтому команда Гомеса сознательно не опубликовала часть промптов и кодов в открытом доступе .
- Отсутствие «защитных перил»: Гость отмечает, что текущие LLM недостаточно защищены от манипуляций в области химии .
- Позиция «Скаута»: Гейб Гомес видит свою роль в том, чтобы информировать политиков и специалистов по этике о реальных возможностях технологии, не впадая в алармизм, но и не будучи беспечным .
По словам профессора, он поддерживает усилия Великобритании (UK AI Safety Institute) и США по созданию формальных стандартов безопасности для ИИ в науке .
🔮 Будущее: «Netflix для энзимов» и конец междисциплинарных барьеров 1:46:41
Гейб Гомес с оптимизмом смотрит в будущее, где PhD в химии станет короче, а открытия — чаще.
Ключевые прогнозы и проекты:
- «Netflix для энзимов»: Текущий проект группы Гомеса, направленный на масштабное исследование белков .
- Стирание границ: ИИ позволит биологу проводить сложнейшие химические синтезы, а химику — работать с клеточными культурами, не тратя годы на освоение узкоспециальных техник .
- Eureka-моменты: Гомес уверен, что ИИ скоро сможет не только оптимизировать старое, но и предлагать принципиально новые лекарства. В ранних версиях статьи был раздел о поиске лекарств от рака, который удалили для фокусировки на химии, но потенциал там огромен .
Гость заключает, что мы находимся в начале революции, сопоставимой с появлением AlphaFold, и призывает ИИ-инженеров приходить в физические науки, чтобы решать реальные мировые проблемы .