Анима Анандкумар: «ИИ ускоряет научные симуляции в 700 000 раз»

ИИ как новая лаборатория: Анима Анандкумар об «AI for Science» 🧬 1:05

Развитие искусственного интеллекта вышло далеко за пределы генерации текстов и изображений, открывая принципиально новые горизонты для фундаментальной науки. В недавнем выпуске подкаста The TWIML AI Podcast ведущий Сэм Черингтон обсудил с Анимой Анандкумар, профессором Caltech и старшим директором по исследованиям ИИ в NVIDIA, как генеративные модели и «нейронные операторы» становятся ключевыми инструментами в расшифровке кода жизни и прогнозировании сложных физических процессов.

🔬 От тензоров к генерации жизни 1:17

Анима Анандкумар отмечает, что её путь в области машинного обучения начался с работы над теоретическими основами статистики и тензорных методов в эпоху, когда ИИ считался чисто академической концепцией. Главным прорывом последних лет стало осознание того, что генеративные модели способны выйти за рамки тренировочных данных через экстраполяцию.

Генерация молекул: Аналогично тому, как Stable Diffusion создает несуществующие изображения, модели могут проектировать новые лекарственные молекулы, способные связываться с конкретными белками.
Сложность биологии: Исследователи переходят от простого моделирования статических структур белков к изучению их динамики в момент взаимодействия с малыми молекулами (лигандами).
Язык генома: Группа Анандкумар создала модель с 25 миллиардами параметров, обученную на 110 миллионах последовательностей бактерий и вирусов. Модель успешно предсказала варианты коронавируса (Delta, Omicron), не видя их ранее.

По мнению Анандкумар, чтобы понять функцию белка, необходимо подняться на уровень выше — к геному, который является «кодом жизни» и содержит эволюционные закономерности. В этом помогают иерархические модели, объединяющие архитектуры GPT и диффузионные процессы в латентном пространстве.

🌪️ Нейронные операторы: революция в симуляциях 21:19

Одной из главных проблем при использовании ИИ в науке является неспособность стандартных нейросетей работать с произвольным разрешением данных. Анандкумар подчеркивает, что для физических систем (например, турбулентности) критически важны мелкие детали, которые традиционные методы фильтрации просто «сглаживают».

Для решения этой задачи были предложены нейронные операторы (в частности, Fourier Neural Operator — FNO):

Гибкость: Обучив модель на определенной сетке, можно выполнять инференс (вычисления) на любом другом разрешении, даже более высоком, чем исходное.
Скорость: В задачах прогнозирования погоды нейронные операторы обеспечивают точность современных численных моделей на горизонте до 2 недель, работая при этом в 45 000 раз быстрее.
Экономия: Традиционные численные методы требуют огромных вычислительных затрат; по словам коллеги Анандкумар, Тапио Шнайдера (Tapio Schneider) из Caltech, для моделирования облаков с разрешением 1 метр потребовалось бы в 100 миллиардов раз больше ресурсов, чем доступно сегодня.

🌍 Климат, углерод и будущее HPC 33:36

ИИ-методы находят применение в критически важных экологических инициативах. При моделировании процесса закачки углекислого газа под землю (carbon capture and storage) исследователи достигли ускорения в 700 000 раз по сравнению с традиционными солверами, что позволяет учитывать сложные многофазные потоки (взаимодействие газа и воды).

Анима Анандкумар прогнозирует слияние HPC (высокопроизводительных вычислений) и ИИ в единую дисциплину:

ИИ позволяет использовать исторические данные (например, метеорологические архивы с 1970-х), которые численные методы задействуют лишь частично.
Нейронные операторы объединяют математические свойства преобразования Фурье с нелинейными активациями нейросетей, что делает их универсальными аппроксиматорами в пространствах функций.

🎮 Mind Dojo: ИИ против Minecraft 56:53

В завершение дискуссии Анандкумар рассказала о проекте Mind Dojo — бенчмарке для обучения агентов в открытом мире Minecraft.

Суть вызова: В отличие от AlphaZero, где цель и правила жестко заданы, в Minecraft агент должен «понимать» текст инструкций, уметь пользоваться инструментами и проявлять креативность, используя базу знаний из Wiki, Reddit и YouTube.
Значение: Это попытка сделать шаг к созданию универсальных агентов, которые могут обучаться в динамических средах.
Статус: Проект получил награду NeurIPS за лучшую статью, но лидерборд пока не запущен — задача остается «крепким орешком» для текущего поколения моделей.

По словам Анимы Анандкумар, сейчас самое подходящее время для масштабирования этих подходов, так как ИИ перерос стадию узкоспециализированных задач и готов к роли фундаментального научного инструмента.