Питер Чен: «Мы строим фундаментальный мозг для роботов»

Eye on AI 2,6 тыс. 51 мин 3 мин 03.12.2023
Главное

Робототехника как новая глава AI: взгляд Питера Чена 2:11

Питер Чен, генеральный директор и сооснователь компании Covariant, уверен, что развитие искусственного интеллекта в робототехнике повторяет путь больших языковых моделей (LLM). По его мнению, создание универсального «фундаментального мозга» для роботов — это не просто теоретическая задача, а технологический сдвиг, который уже меняет промышленность, позволяя машинам понимать физический мир и действовать в нем автономно.

🛠 Путь к Covariant и философия «фундаментальных моделей» 3:04

Путь Питера Чена начался с глубокого интереса к программированию и машинному обучению в UC Berkeley под руководством профессора Питера Аббеля. Работая на заре OpenAI, когда команда еще трудилась в квартире Грега Брокмана, Чен впитал ключевые принципы, ставшие фундаментом успеха всей современной индустрии ИИ:

Основав в 2017 году компанию Covariant, Чен перенес эти идеи в сферу робототехники. Он утверждает, что, в отличие от языка, где мы пытаемся сжать все человеческие знания, в робототехнике есть преимущество — единый физический мир. Это позволяет создать универсальную модель, способную управлять разными типами оборудования, независимо от выполняемых задач.

🌍 Что такое «мировая модель» в робототехнике? 14:06

Чен полагает, что обучение «мировой модели» — это единственный способ создать по-настоящему автономные системы. Вместо того чтобы полагаться на случайные пробы и ошибки, робот должен обладать «пониманием» физики:

Собеседник отмечает, что чистые видеоданные из интернета (например, с YouTube) недостаточны для обучения. Для высокой точности Covariant комбинирует три источника: данные из открытых источников, синтетические данные и, что важнее всего, реальный опыт работы роботов в производственных условиях 24/7.

🤖 Архитектура и будущее индустрии 30:21

Отвечая на вопрос о внутреннем устройстве моделей, Чен подчеркивает, что в робототехнике скорость и стоимость вывода (inference) критически важны. Поэтому архитектура Covariant — это не чистый «трансформер», а комбинация сверточных нейронных сетей, механизмов внимания и графовых моделей, оптимизированная под конкретные аппаратные ограничения.

По мнению Чена, мы находимся на пороге значительного качественного скачка. Несмотря на то что массовое внедрение роботов сдерживается не столько ИИ, сколько сложностями физического оборудования (hardware), текущие темпы масштабирования данных и вычислительных мощностей ведут к появлению всё более «умных» и способных систем.

🏭 Будущее складов: от автоматизации к «темным» фабрикам 42:26

Питер Чен видит развитие складов как постепенную эволюцию:

  1. Augmentation (Дополнение): Человек перестает выполнять однотипные движения 8 часов подряд, переходя к роли «оператора флота», управляющего группой из 10 роботов.
  2. Скейлинг: Со временем один человек сможет курировать 50 или 100 машин.
  3. Автономия: В долгосрочной перспективе возможны «темные» фабрики (без освещения и людей), где роботы работают круглосуточно, а вмешательство человека требуется лишь в исключительных случаях.

Чен убежден: хотя до «космических заводов на Луне» еще далеко, технология уже сегодня решает насущные проблемы нехватки рабочей силы и делает труд людей более интересным и продуктивным.

💬 Цитаты

«В робототехнике стоимость вывода и скорость очень важны.»

Питер Чен 00:30

«ИИ может стать самой важной новой компьютерной технологией в истории.»

Крейг Смит 00:45

«Сингулярность может быть еще не близка, но ИИ уже меняет ваш мир.»

Крейг Смит 51:11
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Фундаментальная модель (Foundation model)
Крупная модель ИИ, обученная на обширных наборах данных, которая может адаптироваться к широкому спектру задач.
Мировая модель (World model)
Система ИИ, которая учится понимать принципы физического мира и предсказывать результаты своих действий в нем.
Обучение с подкреплением (Reinforcement learning)
Метод обучения ИИ, при котором модель учится принимать правильные решения, получая награды или штрафы за свои действия.
Инференс (Inference)
Процесс использования уже обученной нейросети для получения результатов или принятия решений в реальном времени.
📊 Цифры
🗓 Хронология
  1. 2017–2018 Питер Чен и Питер Аббель создали первый курс по генеративному ИИ в Berkeley.
  2. Конец 2017 Основание компании Covariant группой выходцев из OpenAI.
  3. Сегодня Covariant эксплуатирует роботизированную фундаментальную модель на трех континентах.
⚖️ Другая сторона
Искусственный интеллект Peter Chen Covariant Robotics World Models Foundation Models