Киртхана Гопалакришнан и Тед Сяо о прорывах в робототехнике

The Cognitive Revolution 3,1 тыс. 1 ч 23 мин 3 мин 22.04.2024
Главное

Будущее робототехники: от специализированных машин к общим интеллектуальным системам 0:00

Исследователи из Google DeepMind Киртхана Гопалакришнан и Тед Сяо в интервью подкасту The Cognitive Revolution подвели итоги года активных разработок в области робототехники. За последний год команда совершила качественный скачок, объединив архитектуры больших мультимодальных моделей с физическим управлением роботами. По мнению спикеров, индустрия сейчас находится в «точке перегиба», сопоставимой с переходом от GPT-2 к GPT-3 в области языковых моделей. Если раньше компоненты роботизированных систем работали успешно лишь в 20–30% случаев, то интеграция фундаментальных моделей позволила поднять этот показатель до 60–70%, что радикально ускорило темпы исследований.

🧠 RT-2 и слияние интернет-знаний с робототехникой 9:46

RT-2 — это развитие системы RT-1, которая демонстрировала отличную производительность в узкоспециализированных задачах внутри конкретных доменов. Ключевым нововведением RT-2 стала способность к генерализации на основе знаний, накопленных в интернете.

🤖 RTX: модель для всех типов роботов 24:10

Проект RTX (Robotics Transformer Cross-embodiment) стал результатом масштабной коллаборации с академическими лабораториями США.

📐 RT-Trajectory: управление через наброски 41:11

RT-Trajectory внедряет возможность «промптинга» робота с помощью простых визуальных инструкций.

🛡️ Auto RT и Конституция робота 50:23

С ростом количества роботов, работающих автономно в реальной среде, встает вопрос безопасности и эффективного контроля.

🚀 Будущее «оживления» AI 1:03:04

Среди будущих задач исследователи выделяют:

  1. Повышение выборки (Sample Efficiency): Как сделать так, чтобы роботы учились быстрее, используя меньше человеческих демонстраций?
  2. Декстерная робототехника: Развитие способностей для выполнения сложных манипуляций, таких как складывание одежды или открывание дверей, где важна высокая точность.
  3. Понимание физики: Гопалакришнан и Сяо задаются вопросом, является ли понимание причинно-следственных связей и физики мира чем-то, что можно «вытащить» из текущих LLM, или это требует совершенно иных подходов к данным.

По мнению спикеров, индустрия находится на пороге эры «воплощенного AI» (embodied AI). Они подчеркивают, что, несмотря на успехи, до коммерчески доступных универсальных домашних роботов еще требуется совершить несколько фундаментальных прорывов.

💬 Цитаты

«Раньше роботов считали разными, как языки английский и китайский. Теперь мы понимаем, что все роботы во многом схожи.»

Киртхана Гопалакришнан 28:50

«Прогресс в робототехнике — это мост между специфическими данными роботов и гигантским массивом знаний из интернета.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Embodied AI
Область AI, направленная на создание интеллекта, который функционирует в физическом теле (роботе) и взаимодействует с реальным миром.
Zero-shot
Способность модели выполнять задачу без предварительного специфического обучения или примеров в контексте.
Ко-файнтюнинг
Процесс совместного дообучения модели на разных типах данных для сохранения общих знаний и обучения новым специфическим навыкам.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Google DeepMind RT-2 RTX Auto RT Embodied AI