Начало взрыва интеллекта? Как AlphaEvolve оптимизирует обучение Gemini и чипы TPU

На этой неделе подразделение Google DeepMind опубликовало научную работу, посвященную системе AlphaEvolve. По мнению автора канала Веса Рота, этот документ может стать историческим, так как он описывает «беспрецедентный случай», когда искусственный интеллект не просто решает задачи, а напрямую оптимизирует алгоритмы собственного обучения и проектирует оборудование, на котором работает .

🧬 AlphaEvolve: ИИ, который строит сам себя 0:00

AlphaEvolve — это не просто чат-бот, а специализированный ИИ-агент, предназначенный для проектирования и развития передовых алгоритмов. В его основе лежат модели семейства Gemini (в частности, Gemini 2.0 Pro и Flash), однако система дополнена инструментами автоматической оценки и эволюционными механизмами .

Ключевой тезис исследования заключается в том, что Gemini через возможности AlphaEvolve впервые продемонстрировала способность оптимизировать собственный процесс обучения . Вес Рот характеризует это как важный шаг к реализации концепции «рекурсивного самосовершенствования». По его мнению, это событие подтверждает теорию «взрыва интеллекта» (Intelligence Explosion), которую активно продвигает бывший сотрудник OpenAI Леопольд Ашенбреннер .

Ашенбреннер и другие сторонники этой теории полагают, что:

В ближайшие годы ИИ начнет самостоятельно проводить исследования в области машинного обучения .
Точкой перегиба может стать 2027 год, когда автоматизация ИИ-исследований станет эффективнее работы инженеров-людей .
ИИ сможет работать над алгоритмическими прорывами круглосуточно, запуская экспоненциальный рост интеллектуальных способностей .

⚙️ Механика эволюции: как работает AlphaEvolve 8:16

Система разделяет процесс разработки на две зоны ответственности: человек-ученый определяет «что» нужно сделать (ставит задачу), а AlphaEvolve берет на себя вопрос «как» это реализовать .

Процесс функционирования агента напоминает биологическую эволюцию:

Генерация идей: Ансамбль моделей Gemini (Flash для скорости и Pro для глубоких инсайтов) предлагает множество вариантов кода или алгоритма .
Каскадная оценка: Новые решения проходят через автоматизированные тесты. Чтобы не тратить ресурсы, тесты идут от простых к сложным — это позволяет быстро отсеивать нежизнеспособные варианты .
Обратная связь от LLM: Помимо жестких метрик, ИИ использует другие модели для оценки качественных характеристик, таких как «простота кода» или «элегантность решения» .
Селекция и мутация: Самые удачные версии алгоритмов «выживают» и становятся основой для следующего поколения предложений .

Вес Рот сравнивает этот процесс с игрой в тетрис или упаковкой вещей в грузовик: система перебирает тысячи вариантов расстановки, пока не найдет тот, который экономит максимум пространства .

🚀 Практические успехи: от математики 1969 года до чипов TPU 6:57

Хотя AlphaEvolve может показаться чисто теоретическим инструментом, Google уже внедрила результаты его работы в реальное производство.

Наиболее впечатляющие достижения системы:

Улучшение алгоритма Штрассена: Этот алгоритм умножения матриц был опубликован в 1969 году и считался эталонным. За более чем 50 лет никто не смог найти значимого улучшения, пока AlphaEvolve не обнаружила новый способ оптимизации вычислений для матриц 4x4 .
Оптимизация дата-центров: Один из алгоритмов, предложенных системой, уже более года работает в производственной среде Google. Он помогает управлять системой Borg (оркестратор дата-центров) и в среднем возвращает компании около 0,7% вычислительных ресурсов по всему миру .
Проектирование чипов (TPU): AlphaEvolve внесла первый прямой вклад в дизайн схем Tensor Processing Unit (TPU) — специализированных чипов Google для обучения ИИ .

По словам Веса Рота, проектирование таких чипов обычно занимает месяцы и требует работы высококвалифицированных инженеров. AlphaEvolve смогла сократить время оптимизации определенных ядер с нескольких месяцев до нескольких дней автоматизированных экспериментов .

📉 Экономия в масштабах Google 15:04

Несмотря на то, что цифры в 1% или 0,7% могут показаться незначительными, в масштабах инфраструктуры Google они превращаются в колоссальные суммы.

Вес Рот приводит следующие данные из научной работы:

Система ускорила критически важную часть архитектуры Gemini на 23% .
Это привело к сокращению общего времени обучения Gemini на 1% .
Внедрение оптимизаций позволяет экономить миллионы долларов на капитальных затратах и электроэнергии .

Автор отмечает, что использование AlphaEvolve освобождает инженеров от рутинной низкоуровневой оптимизации, позволяя им сосредоточиться на более стратегических задачах .

🔮 Будущее: саморазвивающиеся системы и новые горизонты 20:01

По мнению исследователей Google DeepMind, возможности AlphaEvolve выходят далеко за пределы написания кода. Технология может быть трансформирующей в таких областях, как материаловедение, разработка лекарств и экологическая устойчивость .

Основное условие для применения системы — возможность количественно оценить результат. Если задачу можно свести к метрике, которую ИИ способен проверить автоматически, AlphaEvolve сможет найти в ней скрытые возможности для оптимизации .

В завершение обзора Вес Рот задается вопросом: не являемся ли мы свидетелями начала «интеллектуального взрыва»? . Он указывает на то, что сейчас создается замкнутый цикл:

Текущие модели (версия 1.0) улучшают архитектуру и железо для следующего поколения.
Новое поколение (версия 2.0) становится еще мощнее и быстрее.
Оно вставляется обратно в систему AlphaEvolve для проектирования версии 3.0.

Хотя автор признает, что процесс находится в самом начале, сам факт «первого прямого вклада» ИИ в собственное оборудование кажется ему крайне важным сигналом для всей индустрии .