Тяньминь Шу: «Мировые модели учат ИИ понимать законы физики»

Eye on AI 6,6 тыс. 47 мин 3 мин 10.03.2024
Главное

Новая эра искусственного интеллекта: Как мировые модели меняют правила игры 0:32

Современный искусственный интеллект стремительно эволюционирует от простых чат-ботов к интеллектуальным агентам, способным взаимодействовать с физическим миром. В недавнем выпуске подкаста «Eye on AI» ведущий Крейг Смит обсудил эту трансформацию с Тяньминем Шу, исследователем ИИ, который вскоре возглавит направление в Университете Джонса Хопкинса. Центральной темой беседы стали «мировые модели» (world models) — архитектуры, позволяющие ИИ симулировать физическую реальность, прогнозировать последствия своих действий и обучаться подобно человеку.

🧠 Истоки концепции: От психологии к программному коду 5:08

По мнению Тяньминя Шу, концепция мировых моделей уходит корнями в когнитивную психологию и теорию развития. Еще в работах профессора Гарварда Лиз Спелке описывалась идея «базовых знаний» (core knowledge), которыми люди обладают с раннего детства.

В техническом плане, как объясняет Шу, эти модели можно реализовать с помощью вероятностных программ (probabilistic programs). Они описывают генеративный процесс, где после применения определенной силы (действия) система выдает прогноз состояния объектов в будущем. Это позволяет ИИ не просто «угадывать» следующий токен в тексте, а проводить вероятностный вывод и планировать действия в условиях неопределенности.

🤖 Архитектура LAW: Язык, агенты и модели мира 11:36

Шу представил фреймворк, который называет LAW (Language model, Agent model, World model). Суть подхода заключается в интеграции сильных сторон языковых моделей (LLM) с предиктивными возможностями мировых моделей.

В отличие от классического обучения с подкреплением (RL), которое требует бесконечных проб и ошибок в реальном мире, этот подход опирается на «планирование на основе моделей». Это похоже на работу AlphaGo: система «представляет» множество вариантов развития событий перед тем, как совершить реальное действие.

🏠 От «умного дома» к реальным роботам 29:54

На данный момент исследования Шу сфокусированы на бытовых средах. В Массачусетском технологическом институте (MIT) была создана симуляция Visual Home, где агенты обучаются взаимодействию с объектами в квартире.

🔮 Прогнозы и будущее ИИ 43:43

Когда речь заходит о сроках внедрения таких агентов в реальные продукты, Шу проявляет осторожность.

  1. Сложность манипуляции: Физическое манипулирование объектами (например, захват предметов) остается крайне сложной задачей, на решение которой могут уйти десятилетия.
  2. Виртуальные помощники: Шу полагает, что агенты для работы с веб-интерфейсами и виртуальные ассистенты могут появиться гораздо раньше, так как они не требуют сложной физической моторики.
  3. Социальное обучение: Важнейшим направлением исследований для Шу является «социальное обучение» — создание агентов, которые могут учиться вместе с людьми и от них, имитируя человеческие механизмы передачи знаний.

Хотя на текущий момент коммерческих продуктов, полностью реализующих этот подход, по словам Шу, еще нет, он считает развитие мировых моделей наиболее многообещающим путем к созданию по-настоящему полезных «коллег-роботов» и интеллектуальных систем, способных работать в неструктурированной среде.

💬 Цитаты

«Человеческий разум обладает интуитивным физическим движком, который позволяет симулировать происходящее в мире.»

Тяньминь Шу 07:38

«Для ИИ недостаточно просто читать книги, чтобы понять, как работает физический мир.»

Тяньминь Шу 30:40
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Мировая модель (World Model)
Система ИИ, способная прогнозировать будущие состояния среды на основе текущих действий.
Вероятностная программа (Probabilistic Program)
Программный код, описывающий генеративный процесс с учетом неопределенности и вероятностей событий.
Граф сцены (Scene Graph)
Структурное представление мира, где объекты — это узлы, а их пространственные отношения — ребра.
Обучение с подкреплением (RL)
Метод машинного обучения, где агент учится принимать решения через получение наград или наказаний за действия.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Тяньминь Шу world models LLM AI agents MIT