Ориоль Виньялс: «Масштабирование — это не единственный путь к интеллекту»

Будущее ИИ: как масштабирование и «набор инструментов» меняют науку

Масштабирование моделей и поиск универсальных методов обучения — главные драйверы развития современного машинного обучения. О том, как архитектурные инновации, такие как трансформеры, и накопление данных трансформируют научные дисциплины и какие этические вопросы встают перед сообществом, рассуждает Ориоль Виньялс, ведущий специалист DeepMind по глубокому обучению, в интервью подкасту The TWIML AI Podcast .

🛠 «Инструментарий» глубокого обучения: от перевода к сворачиванию белков

В основе современного подхода к искусственному интеллекту лежит идея «инструментария» (toolbox) — набора общих принципов и архитектур, которые можно применять к самым разным задачам. По мнению Виньялса, ключевой принцип здесь — сквозное обучение (end-to-end learning), где модель сама выучивает всё, от входных данных до конечного результата, через градиентный спуск.

Развитие этих методов проходит через несколько стадий:

Специализация: В начале карьеры исследователям приходилось доказывать эффективность глубокого обучения в узких областях, таких как распознавание речи или классификация изображений.
Универсализация: Сейчас, когда методология отработана, один и тот же «фундаментальный» подход применяется к задачам самого разного профиля — от перевода текста до генерации изображений и предсказания структуры белков (как в случае с AlphaFold).
Масштабируемость: Ориоль Виньялс полагает, что в идеале любое представление данных можно свести к последовательности байтов, что делает трансформеры мощным универсальным инструментом, хотя они и не являются финальной точкой развития архитектур.

🧠 Ограничения трансформеров и поиск иерархической памяти

Несмотря на доминирование трансформеров, Виньялс отмечает их существенные ограничения. Главная проблема заключается в их симметричности при обработке данных: трансформер «смотрит» на все данные сразу, тогда как человеческое восприятие информации иерархично.

Гипотеза Виньялса: Будущее за разработкой более эффективных форм иерархической памяти, которые позволят сжимать входящую информацию, подобно тому, как это делает человеческий мозг.
Компромисс: Хотя машины не обязаны копировать человеческий механизм мышления, текущие вычислительные ограничения трансформеров требуют поиска более эффективных решений для параллельной обработки данных.

🕹 Уроки обучения в игровых средах: AlphaStar и за его пределами

Проекты DeepMind, такие как AlphaStar (для игры StarCraft II), стали важным этапом в демонстрации возможностей глубокого обучения. Виньялс подчеркивает, что такие игры — это сложнейшие среды с частичной наблюдаемостью и асинхронным мышлением, которые позволяют тестировать границы способностей ИИ.

Офлайн-обучение (offline RL): Сейчас исследовательская группа сфокусирована на развитии обучения с подкреплением без взаимодействия со средой. Виньялс указывает, что использование огромных архивов человеческих игр (как в случае с AlphaStar) позволяет моделям имитировать стратегическое поведение, достигая результатов выше человеческих.
Перенос знаний: Методы, наработанные на играх (например, distillation loss), всё чаще находят применение в других областях, включая работу с языковыми моделями, где важно удерживать модель от «отклонения» от качественной базовой политики.

⚖️ Концепция «фундаментальных моделей» и доступность исследований

На панели конференции NeurIPS Виньялс планирует поднять вопрос о последствиях гонки масштабирования. По его словам, требование рецензентов проверять идеи исключительно на «масштабе» становится барьером для творчества.

Проблема ресурсов: В то время как крупным компаниям доступны огромные вычислительные мощности, академическому сообществу может не хватать инструментов для проверки передовых идей.
Урок внимания: Виньялс напоминает, что механизм «внимания» (attention) — основа современных трансформеров — был изобретён именно потому, что группа исследователей в Монреале не имела доступа к тем же вычислительным мощностям, что и Google. Это доказывает, что ограничения ресурсов могут стимулировать прорывные научные идеи.
Модель CERN: Виньялс предполагает, что для прогресса в ИИ, возможно, потребуется создание своего рода «CERN для машинного обучения», где вычислительные мощности будут доступны академическому сообществу на основе консенсуса и грантов.

В завершение Виньялс отмечает: хотя масштабирование — часть решения, оно не является полным ответом на вопрос о природе интеллекта. Существование человека как разумного вида — уже доказательство того, что развитие интеллекта требует иных, более комплексных механизмов, нежели простое наращивание вычислительных мощностей.