В Стэнфордском университете в рамках курса ECON295/CS323 состоялось выступление Анимы Анандкумар — профессора вычислительной техники Калифорнийского технологического института (Caltech) и бывшего ведущего специалиста в NVIDIA и Amazon Web Services. В своей лекции Анандкумар представила концепцию перехода от ИИ, оперирующего только языком, к «научному ИИ», способному моделировать физическую реальность, предсказывать мутации вирусов и ускорять сложные инженерные расчеты в миллионы раз.
🧬 От текста к действию: Новая эра генеративного ИИ 0:35
Традиционное представление о генеративном ИИ чаще всего ограничивается языковыми моделями (LLM). Однако, по мнению Анимы Анандкумар, истинная революция происходит в области высокомерных распределений, где ИИ учится генерировать не только слова, но и сложные физические структуры: молекулы, белки и геномы вирусов .
Принципиальное различие между прошлым и нынешним десятилетием в сфере ИИ заключается в переходе от дискриминативных моделей к генеративным:
- Дискриминативный ИИ (прошлое десятилетие): решал задачи классификации (например, отличить кошку от собаки на картинке) .
- Генеративный ИИ (настоящее время): создает новые образцы из заданных спецификаций, переводя простые промпты в сложные многомерные объекты .
Тем не менее, Анандкумар подчеркивает, что языковым моделям не хватает «воплощения» (embodiment) — способности переводить слова в действия в физическом мире . В качестве примера она привела проект Voyager, реализованный совместно со Стэнфордом, где агент ИИ использовал LLM для непрерывного обучения навыкам в игре Minecraft, самостоятельно выстраивая учебную программу от простых задач к сложным .
🧪 ИИ в борьбе с пандемиями: Предсказание мутаций 12:25
Одним из наиболее впечатляющих применений технологий Анандкумар стало создание первой геномной языковой модели. Вместо английского словаря модель обучалась на «алфавите» ДНК — нуклеотидах A, T, G и C .
Ключевые факты исследования:
- Масштаб данных: Модель была обучена на 110 млн геномных последовательностей вирусов и бактерий из UK Biobank .
- Успех прогноза: Обучившись на вариантах коронавируса первого года пандемии (Альфа и Бета), модель точно предсказала динамику появления штаммов Дельта и Омикрон еще до того, как они возникли в реальности .
- Механика: Система позволила ученым понять не только последовательность генов, но и силу связывания спайкового белка вируса с мишенями в человеческом теле (чем сильнее связь, тем выше патогенность) .
Анандкумар утверждает, что такой подход позволяет создавать вакцины на опережение, имея готовый препарат до того, как опасный вариант вируса начнет распространяться в популяции .
⚛️ Нейронные операторы: Ускорение физики в миллионы раз 18:17
Главной технической проблемой современного моделирования физических процессов (погода, динамика жидкостей, термоядерный синтез) является вычислительная сложность. По словам спикера, для точного квантового моделирования молекулы из 100 атомов традиционными методами потребовалось бы время, превышающее возраст Вселенной .
Для решения этой задачи команда Анандкумар разработала нейронные операторы (Neural Operators).
- Суть технологии: В отличие от обычных нейросетей, работающих с фиксированным разрешением (дискретными токенами или пикселями), нейронные операторы работают в непрерывном пространстве .
- Аналогия с графикой: Анандкумар сравнивает это с переходом от растровой графики (которая размывается при увеличении) к векторной (сохраняющей четкость на любом масштабе) .
Результаты применения нейронных операторов:
- Термоядерный синтез: Скорость расчета эволюции плазмы в токамаке выросла в 1 000 000 раз .
- Прогноз погоды: Модель FourCastNet работает в 45 000 раз быстрее традиционных численных методов .
- Доступность: То, что раньше требовало суперкомпьютера, теперь можно запустить на домашнем игровом ПК с одной GPU .
🌦️ Метеорология и борьба со скепсисом 39:26
Внедрение ИИ в метеорологию столкнулось с серьезным сопротивлением «старой гвардии». Анандкумар вспоминает, что многие эксперты считали Deep Learning неспособным предсказывать редкие экстремальные события, такие как ураганы .
Однако практика показала обратное: модель FourCastNet предсказала траектории некоторых ураганов точнее, чем суперкомпьютерные модели. Это привело к тому, что крупнейшие организации, такие как ECMWF (Европа) и NOAA (США), начали внедрять эти ИИ-модели в свою работу .
Огромным преимуществом стала работа с неопределенностью. Традиционные модели из-за дороговизны запускают всего 50 сценариев развития погоды («ансамблей») . Использование ИИ позволяет прогонять миллионы сценариев почти бесплатно, что критически важно для оценки вероятности того, ударит ли ураган по конкретному городу или пройдет мимо .
🏗️ Проектирование будущего: Катетеры и микросхемы 11:00
ИИ меняет не только научные расчеты, но и физический дизайн объектов (Inverse Design). Анандкумар представила пример медицинского катетера, разработанного в Caltech с помощью ИИ .
- Проблема: Бактерии часто проникают в организм пациента, поднимаясь вверх по стенкам трубки катетера против течения жидкости.
- Решение ИИ: Модель предложила создать внутри катетера микроскопические треугольные выступы. Они создают микро-вихри, которые блокируют движение бактерий .
- Результат: Тесты показали 100-кратное снижение бактериального загрязнения. ИИ предложил дизайн, его распечатали на 3D-принтере, и он заработал с первого раза .
Также технология применяется для оптимизации фотошаблонов в литографии при производстве полупроводников, где физические эффекты дифракции на наноуровне становятся критическим препятствием для закона Мура .
🎓 Математика как предохранитель от галлюцинаций 8:42
Одной из самых острых проблем LLM остаются «галлюцинации» — уверенные, но ложные утверждения. В научной сфере это недопустимо. Решение Анандкумар заключается в связке языковых моделей с формальными верификаторами (например, языком Lean) .
В этой связке:
- ИИ (LLM) выступает как «интуитивный математик», предлагая шаги доказательства теоремы.
- Lean выступает как строгий цензор, проверяя каждый шаг на соответствие логическим законам. Если доказательство проходит через верификатор, оно гарантированно является истинным . Анандкумар считает, что такой «нейросимволический» подход со временем позволит ИИ не просто угадывать ответы, а обладать полноценным логическим рассуждением .
В завершение лекции Анима Анандкумар выразила надежду на создание «единой физической базовой модели» (Physical Foundation Model), которая будет понимать законы природы (гравитацию, термодинамику, электромагнетизм) так же естественно, как современные чат-боты понимают человеческий язык .