Профессор Гейб Гомес о CoScientist: как GPT-4 и роботы-лаборатории меняют облик современной науки

В марте 2023 года выход GPT-4 ознаменовал новую веху не только в обработке текстов, но и в автоматизации фундаментальной науки. Профессор Университета Карнеги-Меллона (CMU) Гейб Гомес (Gabe Gomes) и его команда за рекордные сроки создали CoScientist — автономную систему на базе больших языковых моделей (LLM), способную планировать и проводить сложные химические эксперименты в реальном мире, используя удалённые роботизированные лаборатории.

🧪 От «дилера» до учёного: почему науке нужна автоматизация 2:13

Ведущий подкаста Натан Лабенц делится личным опытом работы в лаборатории под руководством профессора М. Кристины Уайт. Его работа в качестве ассистента-исследователя заключалась в оптимизации палладиевого катализатора для органических реакций . По его словам, 90% времени занимала рутинная «черновая» работа: взвешивание порошков на сверхточных весах.

Основные тезисы о проблеме современной экспериментальной науки:

Низкий КПД: Лабенц вспоминает, что за год работы он лишь однажды столкнулся с неожиданным результатом, давшим новое знание. Остальное время он «чувствовал себя скорее низкоуровневым наркодилером, чем учёным», постоянно отвешивая по 4,5 мг ацетата палладия .
Барьер входа: Гейб Гомес отмечает, что многие талантливые люди уходят из химии именно из-за отсутствия интеллектуальной стимуляции в рутинных процессах .
Культурная стагнация: Если сравнить фото лабораторий 100-летней давности и современные, они будут выглядеть почти одинаково. Гомес утверждает, что прогресс городов и технологий огромен, но ручной труд химика за верстаком почти не изменился .

По мнению Гейба Гомеса, автоматизация через облачные лаборатории — это путь к демократизации науки. Это позволит учёным фокусироваться на формировании гипотез, а не на физическом манипулировании атомами .

🏗️ Архитектура CoScientist: мозг на базе GPT-4 и руки-роботы 5:20

Команда Гомеса начала работать над тонкой настройкой (fine-tuning) моделей вроде GPT-2 и BERT для научных задач ещё в октябре 2022 года, но результаты были разочаровывающими . Прорыв случился с выходом GPT-4.

Система CoScientist построена по модульному принципу «агентов» :

Центральный планировщик (Planner): «Мозг» системы, принимающий запросы на естественном языке. На основе GPT-4 он координирует работу других модулей.
Модуль веб-поиска: Ищет информацию о химических соединениях и реакциях в открытых источниках (например, Wikipedia или специализированные базы данных) .
Поиск по документации: Обученный на спецификациях лабораторного оборудования модуль. Позволяет ИИ понимать, как управлять конкретным роботом, даже если данные о нём появились после даты отсечки обучения модели .
Исполнитель кода: Запускает Python-скрипты в защищённой среде (Docker) для проведения расчётов стехиометрии и других математических операций .
API физического мира: Отправляет команды роботизированным системам.

Гейб Гомес подчёркивает, что LLM всё ещё плохо справляются с арифметикой «в уме», поэтому возможность системы самой писать и запускать код для расчётов была критически важна .

☁️ Emerald Cloud Lab: «AWS для химии» 9:46

Ключевым партнёром проекта выступила компания Emerald Cloud Lab (ECL), основанная выпускниками CMU. Это огромный склад в Сан-Франциско, заполненный сотнями типов научных приборов (на сумму около $50 млн), которыми можно управлять дистанционно через код .

Особенности работы с облачной лабораторией:

Эксперимент как код: Учёный не касается пробирок; он отправляет скрипт (форк Mathematica или Python), и роботы или технические специалисты выполняют его .
Преодоление когнитивной нагрузки: Основной барьер для химиков — необходимость изучать сложные языки программирования для управления роботами. CoScientist переводит команды с английского («Синтезируй аспирин») в исполняемый код для ECL .
Круглосуточная работа: По мнению Гомеса, природа не подчиняется графику работы детских садов или сну учёного. Роботы могут охлаждать реакцию ровно 12 часов без участия человека .

🚀 Шесть уровней возможностей ИИ-учёного 46:13

В своей статье в Nature команда Гомеса выделила шесть ключевых задач, с которыми CoScientist справился успешно:

Планирование синтеза известных веществ: Поиск путей получения таких соединений, как аспирин или парацетамол .
Навигация по документации: ИИ способен сам разобраться в управлении новым оборудованием, просто прочитав инструкцию .
Управление через высокоуровневые команды: Перевод абстрактных задач в конкретные действия приборов.
Низкоуровневое микроуправление: Точная настройка параметров работы механизмов.
Создание комплексных рабочих процессов: Сочетание разных приборов для многоэтапных задач.
Оптимизация (задача «Морской бой»): Нахождение условий для максимального выхода продукта .

Особое внимание Гейб Гомес уделяет шестому пункту. В одном из экспериментов ИИ нужно было оптимизировать реакцию из пространства в 6000 возможных комбинаций переменных. CoScientist справился с этим за 20 итераций, показав результат на уровне (а иногда и лучше) специализированных алгоритмов байесовской оптимизации .

⚖️ Риски, безопасность и «двойное назначение» 1:27:09

Гомес признаёт, что технология вызывает у него опасения. Некоторое время после создания прототипа он «не мог спать по ночам» .

Основные вызовы:

Злоупотребление: ИИ может помочь в синтезе токсичных веществ или биологического оружия. Поэтому команда Гомеса сознательно не опубликовала часть промптов и кодов в открытом доступе .
Отсутствие «защитных перил»: Гость отмечает, что текущие LLM недостаточно защищены от манипуляций в области химии .
Позиция «Скаута»: Гейб Гомес видит свою роль в том, чтобы информировать политиков и специалистов по этике о реальных возможностях технологии, не впадая в алармизм, но и не будучи беспечным .

По словам профессора, он поддерживает усилия Великобритании (UK AI Safety Institute) и США по созданию формальных стандартов безопасности для ИИ в науке .

🔮 Будущее: «Netflix для энзимов» и конец междисциплинарных барьеров 1:46:41

Гейб Гомес с оптимизмом смотрит в будущее, где PhD в химии станет короче, а открытия — чаще.

Ключевые прогнозы и проекты:

«Netflix для энзимов»: Текущий проект группы Гомеса, направленный на масштабное исследование белков .
Стирание границ: ИИ позволит биологу проводить сложнейшие химические синтезы, а химику — работать с клеточными культурами, не тратя годы на освоение узкоспециальных техник .
Eureka-моменты: Гомес уверен, что ИИ скоро сможет не только оптимизировать старое, но и предлагать принципиально новые лекарства. В ранних версиях статьи был раздел о поиске лекарств от рака, который удалили для фокусировки на химии, но потенциал там огромен .

Гость заключает, что мы находимся в начале революции, сопоставимой с появлением AlphaFold, и призывает ИИ-инженеров приходить в физические науки, чтобы решать реальные мировые проблемы .