Figure 02 и «исход» из OpenAI: Уэс Рот о будущем гуманоидных роботов

Wes Roth 56,6 тыс. 44 мин 4 мин 07.08.2024
Главное

Мир искусственного интеллекта и робототехники переживает переломный момент: стартап Figure представил второе поколение своего гуманоида Figure 02, пока в руководстве OpenAI происходят тектонические сдвиги. В этом материале Уэс Рот анализирует технические возможности новых машин, перспективы создания миллиардной армии роботов и причины массового ухода лидеров из главной ИИ-лаборатории мира.

🤖 Figure 02: Робот на базе нейросетей OpenAI 0:00

Компания Бретта Эдкока Figure AI представила обновленную версию своего гуманоида — Figure 02. По мнению Уэса Рота, этот запуск подтверждает давний тренд: пересечение робототехники и больших языковых моделей (LLM) становится реальностью. Робот фактически использует систему GPT-4 (или её кастомную версию) от OpenAI в качестве «мозга», способного к визуальному мышлению и логическим выводам.

В Figure 02 реализован ряд значимых обновлений:

Одной из ключевых особенностей стала возможность «speech-to-speech» взаимодействия. Хотя технически это пока выглядит как цепочка из преобразования речи в текст, обработки моделью OpenAI и последующего синтеза голоса, робот способен понимать сложные контекстные запросы. Например, на фразу «я проголодался» машина может самостоятельно идентифицировать яблоко на столе среди несъедобных предметов и передать его человеку.

📉 «Мелтдаун» в OpenAI: Исход основателей 1:10

Одновременно с технологическим триумфом Figure, её партнер OpenAI столкнулся с тем, что в медиа называют «экзодусом» топ-менеджмента. Уэс Рот отмечает, что термин «мелтдаун» (крах) может быть излишне драматичным, но масштаб перестановок впечатляет.

Ключевые кадровые изменения:

  1. Грег Брокман: Президент и один из основателей компании уходит в бессрочный отпуск до конца года.
  2. Джон Шульман: Сооснователь и лидер направления выравнивания ИИ (alignment) покинул OpenAI, чтобы присоединиться к главному конкуренту — Anthropic.
  3. Питер Денг: Продукт-лидер, ранее работавший в Meta и Uber, также оставил пост.
  4. Илья Суцкевер: Ранее покинул компанию, чтобы основать собственный стартап SSI (Safe Superintelligence), нацеленный на безопасный сверхинтеллект.

Уэс Рот считает, что за этим может стоять банальное выгорание: эти люди находились в эпицентре революции ИИ с самого начала, прошли через корпоративные перевороты и глобальное давление регуляторов. С другой стороны, переход талантов в Anthropic усиливает конкуренцию, что, по мнению ведущего, идет на пользу всей индустрии.

💰 Экономика роботруда: $3 за час работы 10:00

Одним из самых интригующих моментов дискуссии стал расчет стоимости эксплуатации гуманоидных роботов. Если предположить, что робот стоимостью $100 000 берется в лизинг за $2000 в месяц и работает по 20 часов в сутки (с 4 часами на подзарядку), то стоимость одного часа его физического труда составит всего $3.33.

Преимущества использования роботов вместо людей:

Уэс Рот подчеркивает, что при снижении цены робота до $50 000, стоимость часа упадет до $1.66, что делает человеческий труд в складской логистике и производстве экономически нецелесообразным.

🏭 Спор о масштабировании: Миллиард или ничего? 12:12

Илон Маск и Бретт Эдкок предсказывают, что в будущем спрос на роботов составит около 1 миллиарда единиц, что сопоставимо с мировым рынком автомобилей. Однако не все эксперты разделяют этот оптимизм.

Профессор Мэтт Бин из MIT выступает с критикой таких прогнозов. По его мнению, «железо — это не софт», и масштабирование физического производства сталкивается с огромными барьерами:

Уэс Рот, в свою очередь, указывает на «эффект маховика»: чем больше роботов работает в реальном мире, тем больше данных они собирают. Эти данные обучают нейросети, делая роботов умнее, что ведет к еще большему распространению. Илон Маск считает, что симуляции не заменят реальность, и победит тот, чей флот первым начнет массово «собирать реальный мир».

🛠 Инженерные вызовы: Провода и скелеты 16:02

Создание гуманоида — это прежде всего борьба с физикой. Уэс Рот приводит аналогию Илона Маска, сравнившего человеческую руку со «скелетной куклой на ниточках». Большинство сухожилий проходят через узкий запястный канал, и попытка разместить все моторы непосредственно в кисти робота делает её комично огромной и неуклюжей.

Другая проблема — разводка кабелей. В отличие от статичных машин, гуманоид постоянно меняет форму, его конечности вращаются и сгибаются 20 часов в сутки. Малейший перегиб провода может вывести из строя всю систему. Именно поэтому Figure 02 перешла на архитектуру экзоскелета, как в авиации, где внешняя оболочка является несущей и защищает внутренние коммуникации.

🏠 Будущее в наших домах 32:16

В завершение Уэс Рот задается вопросом о бытовом применении технологий. Он провел опрос среди зрителей: сколько они готовы платить за робота-помощника, способного на уровне 12-летнего ребенка убирать дом, складывать белье и готовить простую еду?

Автор вспоминает забавные и пугающие кейсы автоматизации: от первого автономного робота-стоматолога до печального опыта «автоматической стрижки овец», где отсутствие «кнопки паники» приводило к инцидентам. По мнению Рота, именно доверие и безопасность станут главными факторами, определяющими, увидим ли мы роботов в своих гостиных в ближайшее десятилетие.

💬 Цитаты

«Если вы платите $2000 в месяц за лизинг робота, который работает 600 часов, это эквивалентно $3.33 за час его работы.»

«Мэтт Бин считает, что по сравнению с софтом, универсальные роботы едва ли повлияют на экономику в ближайшие 10 лет.»

«Реальность масштабируется до реальности. Когда роботы выйдут в мир, они начнут собирать данные, которые бесконечно улучшают их обучение.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
VLM (Vision Language Model)
Модель ИИ, способная понимать одновременно и текст, и визуальную информацию с камер.
AGI (Artificial General Intelligence)
Искусственный интеллект, способный выполнить любую интеллектуальную задачу, доступную человеку.
Экзоскелет (в робототехнике)
Конструкция, где внешняя оболочка робота является несущим каркасом, защищающим внутренности.
Flywheel effect (Эффект маховика)
Процесс, когда небольшие улучшения в данных ведут к улучшению модели, что привлекает больше пользователей и данных, ускоряя развитие.
📊 Цифры
🗓 Хронология
  1. Август 2024 Анонс робота Figure 02 и новости о массовых перестановках в OpenAI.
  2. 2024 (в планах) Внедрение роботов Figure на заводы BMW для производства автомобилей.
  3. Ближайшие 10 лет Период, в который, по мнению Мэтта Бина, роботы еще не окажут значимого влияния на мировую экономику.
⚖️ Другая сторона
Искусственный интеллект OpenAI Figure AI Figure 02 Уэс Рот гуманоидные роботы