Начало взрыва интеллекта? Как AlphaEvolve оптимизирует обучение Gemini и чипы TPU

Wes Roth 103 тыс. 24 мин 4 мин 15.05.2025
Главное

На этой неделе подразделение Google DeepMind опубликовало научную работу, посвященную системе AlphaEvolve. По мнению автора канала Веса Рота, этот документ может стать историческим, так как он описывает «беспрецедентный случай», когда искусственный интеллект не просто решает задачи, а напрямую оптимизирует алгоритмы собственного обучения и проектирует оборудование, на котором работает .

🧬 AlphaEvolve: ИИ, который строит сам себя 0:00

AlphaEvolve — это не просто чат-бот, а специализированный ИИ-агент, предназначенный для проектирования и развития передовых алгоритмов. В его основе лежат модели семейства Gemini (в частности, Gemini 2.0 Pro и Flash), однако система дополнена инструментами автоматической оценки и эволюционными механизмами .

Ключевой тезис исследования заключается в том, что Gemini через возможности AlphaEvolve впервые продемонстрировала способность оптимизировать собственный процесс обучения . Вес Рот характеризует это как важный шаг к реализации концепции «рекурсивного самосовершенствования». По его мнению, это событие подтверждает теорию «взрыва интеллекта» (Intelligence Explosion), которую активно продвигает бывший сотрудник OpenAI Леопольд Ашенбреннер .

Ашенбреннер и другие сторонники этой теории полагают, что:

⚙️ Механика эволюции: как работает AlphaEvolve 8:16

Система разделяет процесс разработки на две зоны ответственности: человек-ученый определяет «что» нужно сделать (ставит задачу), а AlphaEvolve берет на себя вопрос «как» это реализовать .

Процесс функционирования агента напоминает биологическую эволюцию:

  1. Генерация идей: Ансамбль моделей Gemini (Flash для скорости и Pro для глубоких инсайтов) предлагает множество вариантов кода или алгоритма .
  2. Каскадная оценка: Новые решения проходят через автоматизированные тесты. Чтобы не тратить ресурсы, тесты идут от простых к сложным — это позволяет быстро отсеивать нежизнеспособные варианты .
  3. Обратная связь от LLM: Помимо жестких метрик, ИИ использует другие модели для оценки качественных характеристик, таких как «простота кода» или «элегантность решения» .
  4. Селекция и мутация: Самые удачные версии алгоритмов «выживают» и становятся основой для следующего поколения предложений .

Вес Рот сравнивает этот процесс с игрой в тетрис или упаковкой вещей в грузовик: система перебирает тысячи вариантов расстановки, пока не найдет тот, который экономит максимум пространства .

🚀 Практические успехи: от математики 1969 года до чипов TPU 6:57

Хотя AlphaEvolve может показаться чисто теоретическим инструментом, Google уже внедрила результаты его работы в реальное производство.

Наиболее впечатляющие достижения системы:

По словам Веса Рота, проектирование таких чипов обычно занимает месяцы и требует работы высококвалифицированных инженеров. AlphaEvolve смогла сократить время оптимизации определенных ядер с нескольких месяцев до нескольких дней автоматизированных экспериментов .

📉 Экономия в масштабах Google 15:04

Несмотря на то, что цифры в 1% или 0,7% могут показаться незначительными, в масштабах инфраструктуры Google они превращаются в колоссальные суммы.

Вес Рот приводит следующие данные из научной работы:

Автор отмечает, что использование AlphaEvolve освобождает инженеров от рутинной низкоуровневой оптимизации, позволяя им сосредоточиться на более стратегических задачах .

🔮 Будущее: саморазвивающиеся системы и новые горизонты 20:01

По мнению исследователей Google DeepMind, возможности AlphaEvolve выходят далеко за пределы написания кода. Технология может быть трансформирующей в таких областях, как материаловедение, разработка лекарств и экологическая устойчивость .

Основное условие для применения системы — возможность количественно оценить результат. Если задачу можно свести к метрике, которую ИИ способен проверить автоматически, AlphaEvolve сможет найти в ней скрытые возможности для оптимизации .

В завершение обзора Вес Рот задается вопросом: не являемся ли мы свидетелями начала «интеллектуального взрыва»? . Он указывает на то, что сейчас создается замкнутый цикл:

  1. Текущие модели (версия 1.0) улучшают архитектуру и железо для следующего поколения.
  2. Новое поколение (версия 2.0) становится еще мощнее и быстрее.
  3. Оно вставляется обратно в систему AlphaEvolve для проектирования версии 3.0.

Хотя автор признает, что процесс находится в самом начале, сам факт «первого прямого вклада» ИИ в собственное оборудование кажется ему крайне важным сигналом для всей индустрии .

💬 Цитаты

«Этот запуск знаменует собой новый случай, когда Gemini через возможности AlphaEvolve оптимизирует собственный процесс обучения.»

Вес Рот (цитируя статью Google) 00:27

«Это первый прямой вклад Gemini в схемы TPU. Новое исследование показывает, что эволюция кода с помощью LLM помогает в проектировании оборудования.»

«AlphaEvolve сократила время оптимизации ядра с нескольких месяцев работы инженеров до нескольких дней автоматизированных экспериментов.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📊 Цифры
🗓 Хронология
  1. 1969 Публикация алгоритма Штрассена для умножения матриц.
  2. 2017 Google публикует статью 'Attention Is All You Need', запуская эпоху LLM.
  3. 2024 Решения AlphaEvolve уже год находятся в промышленной эксплуатации в дата-центрах Google.
  4. 2025 Официальная публикация научной статьи об AlphaEvolve.
  5. 2027 Прогнозируемая Леопольдом Ашенбреннером точка перегиба, когда ИИ-исследования станут полностью автоматизированными.
⚖️ Другая сторона
Искусственный интеллект Google DeepMind AlphaEvolve Gemini 2.0 TPU рекурсивное самосовершенствование