Дженсен Хуанг представил архитектуру Vera Rubin и систему Alpamo на CES 2025

Дженсен Хуанг на выставке CES 2025 заявил о модернизации вычислительной инфраструктуры стоимостью 10 триллионов долларов . По его словам, компьютерная индустрия переживает одновременный переход к ускоренным вычислениям и генеративному ИИ, что требует перестройки всех пяти уровней системного стека .

🏛️ Философия платформ и истоки стратегии 4:52

Компьютерная индустрия проходит через смену платформ каждые 10–15 лет . Дженсен Хуанг выделяет этапы перехода от мейнфреймов к ПК, затем к интернету, облаку и мобильным устройствам. Текущий этап отличается тем, что софт больше не программируют вручную, а обучают на данных .

Процессоры общего назначения (CPU) уступают место графическим ускорителям (GPU). Приложения перестали быть предварительно скомпилированным кодом. Теперь они генерируют каждый пиксель и текстовый токен в реальном времени с учетом контекста .

NVIDIA инвестирует в эту трансформацию сотни миллиардов долларов ежегодно через венчурные фонды и собственные разработки . Около 100 триллионов долларов мировых расходов на НИОКР смещаются в сторону ИИ-методов. Это объясняет высокую загрузку мощностей компании в последние годы .

🔄 Переломные моменты: от BERT до систем рассуждения 7:47

В 2015 году модель BERT показала потенциал языковых систем, а в 2017 году появились трансформеры . Настоящий перелом в восприятии технологий произошел в 2022 году с выходом ChatGPT. Однако Хуанг считает ключевым событием 2023 года появление модели o1, представившей концепцию масштабирования во время вывода (test-time scaling) .

Этот подход позволяет ИИ «думать» перед ответом, используя обучение с подкреплением для поиска оптимальных решений. В 2024 году начали появляться агентные системы, способные планировать действия и использовать инструменты . Одной из таких систем внутри NVIDIA стала Cursor, которая изменила процесс написания программного кода .

Развитие открытых моделей, таких как DeepSeek R1, активировало инновации во всех отраслях одновременно . Хуанг подчеркивает, что открытые модели теперь отстают от закрытых флагманов всего на шесть месяцев. Это заставляет рынок постоянно ускоряться .

🚗 Уроки восьмилетней разработки: Физический ИИ 39:24

NVIDIA начала работу над беспилотными автомобилями восемь лет назад . Этот проект стал для компании полигоном для понимания того, как ИИ взаимодействует с законами физики. Хуанг усвоил урок: для создания физического ИИ недостаточно только данных, нужна симуляция .

Система физического ИИ требует работы трех разных компьютеров одновременно:

Компьютер для обучения моделей.
Компьютер для логического вывода (внутри робота или машины).
Компьютер для симуляции цифрового двойника мира.

Для обучения систем компания использует синтетические данные, генерируемые в среде Omniverse . Модель мира Cosmos обучается на огромных массивах видео и симуляций, чтобы ИИ понимал инерцию, гравитацию и причинно-следственные связи .

Результатом этой восьмилетней работы стала система Alpamo — ИИ для автономного вождения с возможностью рассуждения . Она не просто крутит руль, а объясняет свои действия текстом в реальном времени . Первые автомобили Mercedes-Benz с этой технологией появятся на дорогах в первом квартале 2025 года .

📉 Ошибка масштабирования и концепция «экстремального со-проектирования» 1:03:04

Замедление закона Мура стало главным вызовом для индустрии . Количество транзисторов больше не растет темпами, необходимыми для обучения моделей, которые увеличиваются в 10 раз ежегодно . Хуанг пришел к выводу: нельзя просто покупать новые чипы, нужно проектировать всю систему целиком.

NVIDIA внедрила принцип экстремального со-проектирования (extreme co-design). Это означает одновременную разработку чипов, сетевого оборудования, софта и систем охлаждения . В новой архитектуре Vera Rubin количество транзисторов выросло всего в 1,6 раза по сравнению с Blackwell, но производительность выросла кратно за счет новых тензорных ядер и форматов данных .

Инженеры разработали формат данных NV FP4, который адаптивно меняет точность вычислений внутри процессора . Это позволило обойти физические ограничения полупроводников и обеспечить рост скорости генерации токенов в пять раз за год .

⚡ Текущий этап: Архитектура Vera Rubin 55:29

Новая вычислительная платформа названа в честь астронома Веры Рубин, открывшей темную материю . Архитектура объединяет шесть различных типов чипов в единую систему . Центральный процессор Vera CPU потребляет в два раза меньше энергии на ватт по сравнению с предыдущими решениями при росте производительности .

Технические характеристики стойки Vera Rubin MVL72:

Вес системы составляет более двух тонн .
Внутри проложено более трех километров медных кабелей .
Система охлаждается водой с температурой 45 градусов Цельсия, что исключает нужду в чиллерах .
Общая производительность достигает 220 триллионов транзисторов в одной стойке .

Для решения проблемы передачи данных NVIDIA представила технологию Bluefield 4. Она управляет KV-кешем (рабочей памятью ИИ) прямо внутри стойки, добавляя 16 терабайт памяти на каждый GPU . Это позволяет ИИ «помнить» всю историю диалогов с пользователем без задержек в сети .

🏭 Индустриальная революция и партнерства 53:26

NVIDIA интегрирует свои технологии в платформы Siemens, Cadence и Synopsys для создания заводов-роботов . Хуанг утверждает, что будущие предприятия будут сначала полностью спроектированы и протестированы в симуляции, прежде чем столкнутся с гравитацией в реальности .

Партнерство с Siemens позволяет использовать библиотеки CUDA X и Omniverse для создания цифровых двойников промышленных объектов . Агентные системы теперь помогают инженерам не только писать код, но и проектировать сложные микросхемы и производственные линии .

Дженсен Хуанг резюмирует, что NVIDIA перестала быть просто производителем чипов, превратившись в разработчика полного стека инфраструктуры для новой промышленной эпохи .