# Дженсен Хуанг: «2025 год станет моментом ChatGPT для всей робототехники»

Источник: https://www.youtube.com/watch?v=rI4nUYq01eo
Канал: Wes Roth
Опубликовано: 08.01.2025

---

На выставке CES 2025 генеральный директор NVIDIA Дженсен Хуанг представил стратегию развития компании, которая выходит далеко за рамки производства видеокарт. Центральной темой презентации стало превращение 2025 года в «момент ChatGPT» для робототехники — переломную точку, после которой физический ИИ начнет массово проникать в реальный мир. Глава технологического гиганта уверен, что мы стоим на пороге рождения крупнейшей индустрии в истории человечества.

## 🤖 2025 — год «физического ИИ» и робототехники
[[JUMP:0:00]]

Дженсен Хуанг начал свое выступление с амбициозного прогноза: если 2024 год и всё, что было до него, можно назвать эпохой «до роботов», то 2025-й станет точкой невозврата [0:51]. Ведущий канала Wes Roth отмечает, что обещания о «домашних роботах-помощниках» звучали десятилетиями, но именно сейчас технологии достигли нужной степени зрелости [1:05].

Ключевым отличием нового поколения систем Хуанг называет переход от языковых моделей (LLM) к моделям действия. Если ChatGPT получает текст и генерирует текстовые токены, то робот будущего будет получать визуальный контекст и генерировать «токены действий» [2:35]. По мнению главы NVIDIA, для этого ИИ должен овладеть «языком мира», который включает в себя:

*   Понимание физической динамики (гравитация, трение, инерция) [3:02].
*   Осознание геометрических и пространственных отношений.
*   Понимание причинно-следственных связей (например, падение предмета при толчке) [3:16].
*   Концепцию постоянства объекта: знание того, что если мяч укатился под стол, он не перестал существовать [3:30].

## 🌌 NVIDIA Cosmos: «Мировая модель» нового поколения
[[JUMP:3:44]]

Для реализации этого видения NVIDIA представила **Cosmos** — первую в мире фундаментальную «модель мира» (World Foundation Model) [3:57]. В отличие от нейросетей, создающих креативный контент, Cosmos разработана для глубокого понимания законов физики.

Технические характеристики и возможности Cosmos:

*   **Обучение:** Модель натренирована на 20 миллионах часов видео, запечатлевших движение людей, манипуляции руками и сложные динамические сцены [4:11].
*   **Функционал:** Она способна генерировать синтетические данные для обучения других моделей, предсказывать физически возможные сценарии будущего («делать как Доктор Стрэндж», по выражению Хуанга) и описывать видео с невероятной точностью для обучения мультимодальных ИИ [4:51].
*   **Архитектура:** Платформа включает авторегрессионную модель для работы в реальном времени и диффузионную модель для генерации высококачественных изображений [5:32].
*   **Доступность:** Хуанг объявил, что Cosmos будет иметь открытую лицензию и станет доступна на GitHub [6:18]. Он выразил надежду, что Cosmos сделает для робототехники то же самое, что архитектура Llama 3 сделала для корпоративного ИИ [6:31].

## 🏗️ Концепция «Трёх компьютеров» и цифровая промышленность
[[JUMP:6:48]]

Дженсен Хуанг подчеркнул, что для создания полноценной робототехники недостаточно одной нейросети. Требуется связка Cosmos с системой **Omniverse** — симулятором, основанным на строгих алгоритмических принципах физики [7:00]. Это решение Хуанг сравнил с технологией RAG (Retrieval Augmented Generation): Omniverse служит для Cosmos «источником истины», предотвращая ошибки в понимании физики [7:28].

Согласно стратегии NVIDIA, любая робототехническая компания (будь то завод или производитель автомобилей) должна использовать систему из трёх компьютеров:

1.  **DGX** — мощный сервер на базе GPU для первичного обучения ИИ [8:22].
2.  **Omniverse (Цифровой двойник)** — среда, где ИИ практикуется, проходит через обучение с подкреплением (RL) и генерирует синтетические данные [8:49].
3.  **AGX** — автономный компьютер «на борту» (внутри робота, машины или складского погрузчика) для исполнения задач в реальности [8:36].

Этот подход уже внедряется в индустрию с оборотом в $50 триллионов [9:42]. NVIDIA объявила о партнерстве с компаниями **Kion** (автоматизация складов) и **Accenture** для цифровизации сотен тысяч заводов и складов по всему миру [9:55].

## 🏎️ Три столпа крупнейшей индустрии в истории
[[JUMP:11:06]]

Хуанг выделил три типа «роботов», которые изменят мировую экономику, поскольку они не требуют радикальной перестройки существующей инфраструктуры (так называемых Green Fields) и могут работать в среде, созданной для людей [11:46]:

1.  **Агентивный ИИ (Agentic AI):** Информационные работники будущего, способные действовать автономно в офисной среде [12:11].
2.  **Беспилотные автомобили:** Готовая инфраструктура дорог строилась последние 100 лет, и ИИ-водители — логичное завершение этого процесса [12:25].
3.  **Гуманоидные роботы:** Вершина робототехники, способная выполнять любые человеческие задачи.

Главной проблемой в создании гуманоидов Хуанг считает сложность сбора данных. Если для обучения машин достаточно просто водить их, то человеческие движения копировать сложнее [12:53]. Решение NVIDIA заключается в преобразовании нескольких сотен «человеческих демонстраций» в миллионы синтетических движений внутри Omniverse, на которых ИИ сможет оттачивать мастерство [13:19].

Wes Roth резюмирует, что чип NVIDIA Blackwell, продемонстрированный на выставке, способен обрабатывать объем данных, сопоставимый со всем мировым интернет-трафиком, что дает техническую базу для реализации этих амбиций [0:26]. По прогнозам автора, 2025 год станет отправной точкой для появления роботов, которые наконец-то выйдут за пределы лабораторий и начнут помогать людям в быту.