Профессор Гейб Гомес о CoScientist: как GPT-4 и роботы-лаборатории меняют облик современной науки

The Cognitive Revolution 1,5 тыс. 1 ч 50 мин 5 мин 12.01.2024
Главное

В марте 2023 года выход GPT-4 ознаменовал новую веху не только в обработке текстов, но и в автоматизации фундаментальной науки. Профессор Университета Карнеги-Меллона (CMU) Гейб Гомес (Gabe Gomes) и его команда за рекордные сроки создали CoScientist — автономную систему на базе больших языковых моделей (LLM), способную планировать и проводить сложные химические эксперименты в реальном мире, используя удалённые роботизированные лаборатории.

🧪 От «дилера» до учёного: почему науке нужна автоматизация 2:13

Ведущий подкаста Натан Лабенц делится личным опытом работы в лаборатории под руководством профессора М. Кристины Уайт. Его работа в качестве ассистента-исследователя заключалась в оптимизации палладиевого катализатора для органических реакций . По его словам, 90% времени занимала рутинная «черновая» работа: взвешивание порошков на сверхточных весах.

Основные тезисы о проблеме современной экспериментальной науки:

По мнению Гейба Гомеса, автоматизация через облачные лаборатории — это путь к демократизации науки. Это позволит учёным фокусироваться на формировании гипотез, а не на физическом манипулировании атомами .

🏗️ Архитектура CoScientist: мозг на базе GPT-4 и руки-роботы 5:20

Команда Гомеса начала работать над тонкой настройкой (fine-tuning) моделей вроде GPT-2 и BERT для научных задач ещё в октябре 2022 года, но результаты были разочаровывающими . Прорыв случился с выходом GPT-4.

Система CoScientist построена по модульному принципу «агентов» :

  1. Центральный планировщик (Planner): «Мозг» системы, принимающий запросы на естественном языке. На основе GPT-4 он координирует работу других модулей.
  2. Модуль веб-поиска: Ищет информацию о химических соединениях и реакциях в открытых источниках (например, Wikipedia или специализированные базы данных) .
  3. Поиск по документации: Обученный на спецификациях лабораторного оборудования модуль. Позволяет ИИ понимать, как управлять конкретным роботом, даже если данные о нём появились после даты отсечки обучения модели .
  4. Исполнитель кода: Запускает Python-скрипты в защищённой среде (Docker) для проведения расчётов стехиометрии и других математических операций .
  5. API физического мира: Отправляет команды роботизированным системам.

Гейб Гомес подчёркивает, что LLM всё ещё плохо справляются с арифметикой «в уме», поэтому возможность системы самой писать и запускать код для расчётов была критически важна .

☁️ Emerald Cloud Lab: «AWS для химии» 9:46

Ключевым партнёром проекта выступила компания Emerald Cloud Lab (ECL), основанная выпускниками CMU. Это огромный склад в Сан-Франциско, заполненный сотнями типов научных приборов (на сумму около $50 млн), которыми можно управлять дистанционно через код .

Особенности работы с облачной лабораторией:

🚀 Шесть уровней возможностей ИИ-учёного 46:13

В своей статье в Nature команда Гомеса выделила шесть ключевых задач, с которыми CoScientist справился успешно:

  1. Планирование синтеза известных веществ: Поиск путей получения таких соединений, как аспирин или парацетамол .
  2. Навигация по документации: ИИ способен сам разобраться в управлении новым оборудованием, просто прочитав инструкцию .
  3. Управление через высокоуровневые команды: Перевод абстрактных задач в конкретные действия приборов.
  4. Низкоуровневое микроуправление: Точная настройка параметров работы механизмов.
  5. Создание комплексных рабочих процессов: Сочетание разных приборов для многоэтапных задач.
  6. Оптимизация (задача «Морской бой»): Нахождение условий для максимального выхода продукта .

Особое внимание Гейб Гомес уделяет шестому пункту. В одном из экспериментов ИИ нужно было оптимизировать реакцию из пространства в 6000 возможных комбинаций переменных. CoScientist справился с этим за 20 итераций, показав результат на уровне (а иногда и лучше) специализированных алгоритмов байесовской оптимизации .

⚖️ Риски, безопасность и «двойное назначение» 1:27:09

Гомес признаёт, что технология вызывает у него опасения. Некоторое время после создания прототипа он «не мог спать по ночам» .

Основные вызовы:

По словам профессора, он поддерживает усилия Великобритании (UK AI Safety Institute) и США по созданию формальных стандартов безопасности для ИИ в науке .

🔮 Будущее: «Netflix для энзимов» и конец междисциплинарных барьеров 1:46:41

Гейб Гомес с оптимизмом смотрит в будущее, где PhD в химии станет короче, а открытия — чаще.

Ключевые прогнозы и проекты:

Гость заключает, что мы находимся в начале революции, сопоставимой с появлением AlphaFold, и призывает ИИ-инженеров приходить в физические науки, чтобы решать реальные мировые проблемы .

💬 Цитаты

«Я чувствовал себя скорее низкоуровневым наркодилером, чем учёным, взвешивая порошки по 1000 раз в год.»

Натан Лабенц 02:52

«Если вы посмотрите на фото лаборатории 100 лет назад и сейчас, они почти не отличаются. Мы всё ещё поклоняемся ручному труду.»

Гейб Гомес 23:09

«CoScientist — это не серебряная пуля, он совершает ошибки. Но он освобождает когнитивный ресурс учёного.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Стехиометрия
Раздел химии о соотношениях масс и объёмов реагентов в химических реакциях.
RAG (Retrieval-Augmented Generation)
Метод, при котором ИИ ищет информацию во внешних базах перед генерацией ответа.
Палладиевый катализ
Использование палладия для ускорения органических реакций, критически важно для создания лекарств.
📊 Цифры
🗓 Хронология
  1. Октябрь 2022 Начало работы группы Гомеса над обучением моделей для химии.
  2. 14 марта 2023 Выход GPT-4 и публикация white paper.
  3. 11 апреля 2023 Публикация препринта статьи о CoScientist на arXiv.
  4. Октябрь 2023 Исполнительный указ президента Байдена по безопасности ИИ.
⚖️ Другая сторона
Искусственный интеллект CoScientist Гейб Гомес Carnegie Mellon University GPT-4 Emerald Cloud Lab