Дженсен Хуанг представил архитектуру Vera Rubin и систему Alpamo на CES 2025

NVIDIA 23,9 млн 1 ч 31 мин 4 мин 05.01.2026
Главное

Дженсен Хуанг на выставке CES 2025 заявил о модернизации вычислительной инфраструктуры стоимостью 10 триллионов долларов . По его словам, компьютерная индустрия переживает одновременный переход к ускоренным вычислениям и генеративному ИИ, что требует перестройки всех пяти уровней системного стека .

🏛️ Философия платформ и истоки стратегии 4:52

Компьютерная индустрия проходит через смену платформ каждые 10–15 лет . Дженсен Хуанг выделяет этапы перехода от мейнфреймов к ПК, затем к интернету, облаку и мобильным устройствам. Текущий этап отличается тем, что софт больше не программируют вручную, а обучают на данных .

Процессоры общего назначения (CPU) уступают место графическим ускорителям (GPU). Приложения перестали быть предварительно скомпилированным кодом. Теперь они генерируют каждый пиксель и текстовый токен в реальном времени с учетом контекста .

NVIDIA инвестирует в эту трансформацию сотни миллиардов долларов ежегодно через венчурные фонды и собственные разработки . Около 100 триллионов долларов мировых расходов на НИОКР смещаются в сторону ИИ-методов. Это объясняет высокую загрузку мощностей компании в последние годы .

🔄 Переломные моменты: от BERT до систем рассуждения 7:47

В 2015 году модель BERT показала потенциал языковых систем, а в 2017 году появились трансформеры . Настоящий перелом в восприятии технологий произошел в 2022 году с выходом ChatGPT. Однако Хуанг считает ключевым событием 2023 года появление модели o1, представившей концепцию масштабирования во время вывода (test-time scaling) .

Этот подход позволяет ИИ «думать» перед ответом, используя обучение с подкреплением для поиска оптимальных решений. В 2024 году начали появляться агентные системы, способные планировать действия и использовать инструменты . Одной из таких систем внутри NVIDIA стала Cursor, которая изменила процесс написания программного кода .

Развитие открытых моделей, таких как DeepSeek R1, активировало инновации во всех отраслях одновременно . Хуанг подчеркивает, что открытые модели теперь отстают от закрытых флагманов всего на шесть месяцев. Это заставляет рынок постоянно ускоряться .

🚗 Уроки восьмилетней разработки: Физический ИИ 39:24

NVIDIA начала работу над беспилотными автомобилями восемь лет назад . Этот проект стал для компании полигоном для понимания того, как ИИ взаимодействует с законами физики. Хуанг усвоил урок: для создания физического ИИ недостаточно только данных, нужна симуляция .

Система физического ИИ требует работы трех разных компьютеров одновременно:

Для обучения систем компания использует синтетические данные, генерируемые в среде Omniverse . Модель мира Cosmos обучается на огромных массивах видео и симуляций, чтобы ИИ понимал инерцию, гравитацию и причинно-следственные связи .

Результатом этой восьмилетней работы стала система Alpamo — ИИ для автономного вождения с возможностью рассуждения . Она не просто крутит руль, а объясняет свои действия текстом в реальном времени . Первые автомобили Mercedes-Benz с этой технологией появятся на дорогах в первом квартале 2025 года .

📉 Ошибка масштабирования и концепция «экстремального со-проектирования» 1:03:04

Замедление закона Мура стало главным вызовом для индустрии . Количество транзисторов больше не растет темпами, необходимыми для обучения моделей, которые увеличиваются в 10 раз ежегодно . Хуанг пришел к выводу: нельзя просто покупать новые чипы, нужно проектировать всю систему целиком.

NVIDIA внедрила принцип экстремального со-проектирования (extreme co-design). Это означает одновременную разработку чипов, сетевого оборудования, софта и систем охлаждения . В новой архитектуре Vera Rubin количество транзисторов выросло всего в 1,6 раза по сравнению с Blackwell, но производительность выросла кратно за счет новых тензорных ядер и форматов данных .

Инженеры разработали формат данных NV FP4, который адаптивно меняет точность вычислений внутри процессора . Это позволило обойти физические ограничения полупроводников и обеспечить рост скорости генерации токенов в пять раз за год .

⚡ Текущий этап: Архитектура Vera Rubin 55:29

Новая вычислительная платформа названа в честь астронома Веры Рубин, открывшей темную материю . Архитектура объединяет шесть различных типов чипов в единую систему . Центральный процессор Vera CPU потребляет в два раза меньше энергии на ватт по сравнению с предыдущими решениями при росте производительности .

Технические характеристики стойки Vera Rubin MVL72:

Для решения проблемы передачи данных NVIDIA представила технологию Bluefield 4. Она управляет KV-кешем (рабочей памятью ИИ) прямо внутри стойки, добавляя 16 терабайт памяти на каждый GPU . Это позволяет ИИ «помнить» всю историю диалогов с пользователем без задержек в сети .

🏭 Индустриальная революция и партнерства 53:26

NVIDIA интегрирует свои технологии в платформы Siemens, Cadence и Synopsys для создания заводов-роботов . Хуанг утверждает, что будущие предприятия будут сначала полностью спроектированы и протестированы в симуляции, прежде чем столкнутся с гравитацией в реальности .

Партнерство с Siemens позволяет использовать библиотеки CUDA X и Omniverse для создания цифровых двойников промышленных объектов . Агентные системы теперь помогают инженерам не только писать код, но и проектировать сложные микросхемы и производственные линии .

Дженсен Хуанг резюмирует, что NVIDIA перестала быть просто производителем чипов, превратившись в разработчика полного стека инфраструктуры для новой промышленной эпохи .

💬 Цитаты

«Вы больше не программируете программное обеспечение, вы обучаете программное обеспечение.»

Дженсен Хуанг 05:46

«Мы создаем эти суперкомпьютеры DGX для собственного использования. Оказывается, у нас работают суперкомпьютеры на миллиарды долларов.»

Дженсен Хуанг 12:03

«Каждая машина в будущем будет иметь возможности автономного вождения и работать на базе ИИ.»

Дженсен Хуанг 41:10
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
KV-кеш
Временная память ИИ-модели, в которой хранятся промежуточные данные контекста диалога.
Test-time scaling
Метод увеличения вычислительной мощности в момент генерации ответа для повышения качества рассуждений ИИ.
Agentic AI
Системы ИИ, способные самостоятельно планировать действия, использовать внешние инструменты и выполнять сложные задачи.
Extreme co-design
Подход к разработке, при котором чипы, софт и сетевая инфраструктура проектируются одновременно как единое целое.
📊 Цифры
🗓 Хронология
  1. 2015 Выход языковой модели BERT, показавшей потенциал глубокого обучения.
  2. 2017 Начало работы NVIDIA над физическим ИИ и архитектурой трансформеров.
  3. 2022 Выход ChatGPT, ставший моментом массового осознания возможностей ИИ.
  4. 2023 Появление модели o1 и концепции рассуждающего ИИ.
  5. 2025 Запуск в серийное производство архитектуры Vera Rubin и выход беспилотников Mercedes-Benz с ИИ Alpamo.
⚖️ Другая сторона
Технологии и IT Дженсен Хуанг Nvidia Vera Rubin Alpamo Omniverse