Perimeter Institute: как искусственный интеллект совершает революцию в физике и математике

Человечество совершило невероятный технологический скачок, научившись превращать очищенный песок в кремниевые чипы, объединять их в нейросети и обучать эти искусственные структуры мыслить. В лекции, представленной на канале Perimeter Institute, физик-теоретик и разработчик ИИ делится своим видением того, как большие языковые модели (LLM) меняют ландшафт фундаментальной науки. Спикер объясняет, почему он оставил написание теоретических статей ради создания «машин по производству знаний», и описывает путь искусственного интеллекта от решения школьных задач до доказательства нерешенных математических гипотез.

🖥️ От кремния к искусственному интеллекту: почему физики уходят в IT 0:01

Спикер лекции рассказывает, что за свою научную карьеру написал около 40 статей по теоретической физике, однако принял решение прекратить эту деятельность . По его признанию, ручное написание научных работ казалось ему эгоистичным удовольствием на фоне глобальной технологической революции: гораздо важнее внести непосредственный вклад в создание машины, которая сможет генерировать новые знания в промышленных масштабах .

На протяжении десятилетий ученые использовали компьютеры как вспомогательные инструменты — от карманных калькуляторов до систем компьютерной алгебры . Однако большие языковые модели принципиально отличаются от них: они способны выполнять абсолютно любую часть работы физика-теоретика, становясь субстратом для создания сильного искусственного интеллекта (AGI) .

В основе современных LLM лежат нейросети, структура которых вдохновлена человеческим мозгом . В начале текущего десятилетия крупнейшие модели содержали около 1 миллиарда параметров . Сегодня этот показатель вырос до нескольких триллионов . Хотя это все еще меньше 100 триллионов синапсов в человеческом мозге, этого объема параметров уже достаточно для сложной интеллектуальной деятельности .

Спикер подчеркивает ключевую особенность нейросетей: их не программируют в традиционном смысле, а выращивают . Процесс обучения строится на предсказании следующего слова в тексте . На начальном этапе модель выдает бессмысленный набор слов, но при каждой верной догадке синаптические связи укрепляются, а при ошибках — ослабляются . Пройдя стадию предварительного обучения (pre-training) на триллионах слов из интернета и последующую «полировку» (post-training) для обеспечения вежливости и полезности , модель приобретает способность вести осмысленный диалог на любые темы.

📈 Законы масштабирования и три драйвера прогресса 6:48

Участие физиков в развитии искусственного интеллекта началось задолго до нынешнего бума, и одним из главных их вкладов стало открытие законов масштабирования (scaling laws) для нейросетей . В физике законы масштабирования играют ключевую роль — от простого анализа размерностей до сложных биологических закономерностей, таких как закон Клайбера, связывающий массу животного со скоростью его метаболизма .

В 2020 году группа физиков эмпирически обнаружила закон масштабирования для LLM: зависимость между затраченной вычислительной мощностью (compute) и точностью предсказания следующего слова на логарифмическом графике представляет собой прямую линию . По ироничному замечанию спикера, этот график оказался настолько простым, что его смогли понять даже венчурные капиталисты, что и спровоцировало лавинообразный приток инвестиций в индустрию .

По оценке спикера, развитие ИИ в последние годы определяют три основных фактора:

Рост вычислительных мощностей: количество операций с плавающей запятой (flops), затрачиваемых на обучение передовых моделей, увеличивается в 4 раза каждый год начиная с 2010 года .
Финансовые вливания: объем средств, направляемых на обучение ИИ, растет примерно на 2.7x в год . Затраты на одну крупную тренировочную сессию выросли с $500 тысяч в 2020 году до $330 миллионов в прошлом году .
Алгоритмический прогресс: оптимизация архитектур и методов обучения силами инженеров и исследователей . Именно этот фактор спикер называет главным драйвером качественного роста систем.

Спикер убежден, что экономический лимит масштабирования еще далеко не исчерпан: при мировом ВВП в десятки триллионов долларов затраты на вычисления могут расти еще на протяжении нескольких десятилетий, если это будет оправдано ростом производительности моделей .

📊 Смерть бенчмарков: от дошкольника до уровня PhD 14:46

Развитие способностей ИИ происходит с невероятной скоростью. Если в 2019 году возможности моделей в области науки находились на уровне дошкольника , то затем начался стремительный подъем. Спикер приводит эмпирическое правило: развитие ИИ в среднем идет в 4 раза быстрее, чем обучение человека (один календарный год равен четырем годам академического прогресса) .

В качестве примера приводится история математического теста MATH, составленного из школьных задач различного уровня сложности . Для сравнения: аспиранты компьютерных наук, не специализирующиеся на математике, решают его в среднем на 40%, а золотые медалисты Международной математической олимпиады (IMO) — на 90% . Четыре года назад лучшие ИИ-модели набирали на этом тесте всего 6% , главным образом из-за неспособности правильно интерпретировать текстовые условия задач . Создатели теста прогнозировали, что планка в 50% будет преодолена к 2025 году, выражая крайний скептицизм по поводу более быстрых темпов . Однако система Minerva достигла этого результата почти сразу, а к середине 2024 года модель Max Math преодолела отметку в 90% . На сегодняшний день стандартные коммерческие модели решают этот тест практически безошибочно, что делает его бесполезным для оценки дальнейшего прогресса .

Аналогичная судьба постигла и бенчмарк GPQA, состоящий из вопросов уровня первого курса аспирантуры (PhD) по физике, химии и биологии . Эксперты с ученой степенью PhD набирают в нем около 70% . Модели ИИ совершили скачок от случайного угадывания в начале 2024 года до фактически идеального прохождения теста к 2026 году .

Чтобы исключить подозрения в простом зазубривании ответов из интернета, разработчики проводят тесты на измененных задачах из закрытых выборок (held out test sets), где модели демонстрируют аналогичные высокие результаты . Спикер подтверждает это личным опытом: он протестировал ИИ на собственных экзаменационных вопросах по общей теории относительности и квантовой механике для студентов Стэнфорда, которых никогда не было в открытом доступе. За 18 месяцев, начиная с конца 2023 года, точность ответов ИИ поднялась до 100% .

Наконец, ИИ преодолел барьер Международной математической олимпиады (IMO), которая считается вершиной школьной математики и требует нестандартного творческого мышления . Летом прошлого года модель от Google DeepMind завоевала условную золотую медаль, решив 5 из 6 задач . При этом президент IMO подтвердил, что решения ИИ были ясными, точными и легко читаемыми для экспертов-людей .

🛠️ Инструменты мышления: как заставить ИИ думать лучше 20:45

Успехи ИИ в математике — это не магия, а результат применения набора логичных инженерных подходов. Спикер подробно останавливается на нескольких ключевых методах:

«Горький урок» (The Bitter Lesson): гипотеза Ричарда Саттона о том, что простое увеличение масштаба вычислений со временем всегда побеждает любые сложные эвристики и правила, заложенные в модель человеком . Все уникальные человеческие ухищрения, созданные для улучшения работы моделей, быстро нивелируются следующим поколением более масштабных нейросетей .
Цепочка рассуждений (Chain of Thought): удивительный феномен, при котором добавление фразы «думай шаг за шагом» перед отправкой запроса существенно повышает точность ответа . Модели ИИ представляют собой гибкую диалоговую среду, на которую можно влиять текстовым внушением . При этом фразы-стимулы вроде «Давай, парень, ты сможешь, просто делай!» ухудшают результат на 20% .
Долгое размышление: обучение моделей рассуждать на протяжении тысяч слов (как в проекте Strawberry в конце 2024 года) вместо моментальной выдачи наиболее вероятного ответа .
Мультиагентные системы: организация автоматического диалога между несколькими экземплярами ИИ, где каждому назначается своя роль — критик, планировщик, генератор идей или скептик .

Тем не менее, у моделей остаются специфические слабости, обусловленные методами их обучения. В качестве примера спикер приводит классическую загадку об автокатастрофе, где отец погибает, а хирург в больнице отказывается оперировать мальчика, говоря: «Это мой сын» . В стандартном сценарии ИИ мгновенно дает правильный ответ (хирург — мать мальчика) . Однако если изменить условие задачи и прямо написать в скобках «хирург, который является отцом мальчика, восклицает...», модель все равно шаблонно отвечает, что хирург — это мать, демонстрируя слепое следование паттернам из обучающей выборки .

🔬 Кентавры в действии: первые научные открытия 35:39

Переломным моментом стало использование ИИ для получения принципиально новых научных результатов. До недавнего времени модели лишь воспроизводили уже известные решения. Теперь же речь идет о формате «кентавра» — совместной работе ученого и искусственного интеллекта .

В рамках совместного проекта с участием профессора Стэнфордского университета и президента Американского математического общества, запущенного осенью 2024 года, модель Gemini была использована для поиска новых математических доказательств . По отзыву одного из соавторов, аргументация ИИ не была простой перепаковкой известных доказательств, а представляла собой глубокое оригинальное прозрение, которым мог бы гордиться любой математик . Роль людей сводилась к ведению диалога, оценке промежуточных вариантов и направлению фокуса ИИ на перспективные идеи .

В начале 2026 года произошло еще более значимое событие: модель от OpenAI фактически автономно доказала гипотезу Эрдеша о единичных расстояниях — известную и сложную открытую проблему комбинаторной геометрии . Математик Тим Гауэрс, обладатель Филдсовской премии, заявил, что это решение является исторической вехой для ИИ-математики . По его мнению, если бы эта работа была представлена человеком в престижный журнал Annals of Mathematics, ее следовало бы принять к публикации без колебаний .

🔮 Взгляд в будущее: от инструментов к автономным ученым 38:15

Спикер выделяет несколько направлений, где ИИ уже сегодня кардинально меняет работу ученых:

Терпеливый репетитор: ИИ изучил все учебники мира и готов без устали объяснять сложные концепции в 3 часа ночи, не выказывая раздражения или осуждения .
Автономный программист: ИИ превращает написание кода в условно «бесплатный» ресурс, позволяя переводить чисто физические задачи на язык программирования .
Интеллектуальный поиск по литературе: способность мгновенно сопоставлять новые идеи с миллионами опубликованных научных статей .

Проводя аналогию с развитием шахматных компьютеров, спикер отмечает, что они прошли четыре стадии: игрушка, инструмент, совместная игра (кентавр) и суперчеловеческий уровень . Шахматные программы обучаются гораздо дольше людей (потребовались миллионы партий), но делают это за считанные дни календарного времени благодаря методу обучения с подкреплением . Кроме того, появление сильного компьютерного соперника сделало сильнее и самих людей, которые стали учиться у машин .

По словам спикера, вопреки скептическим заявлениям о том, что LLM способны лишь на интерполяцию данных и простое сопоставление шаблонов, в Кремниевой долине доминирует мнение о достаточности текущей архитектуры нейросетей для достижения сильного ИИ (AGI) . Масштабирование существующих систем и их алгоритмическая доработка неизбежно приведут к созданию автономного ИИ-ученого . Учитывая, что стоимость запуска готовых моделей стремительно падает, человечество сможет запустить миллиарды виртуальных «ИИ-Эйнштейнов» одновременно . Это откроет невиданный ранее золотой век для физики и математики, обещая ответы на фундаментальные вопросы вселенной уже в ближайшие годы .