Джим Фан из NVIDIA: «У нас эмоции палеолита и технологии богов»

Wes Roth 95,4 тыс. 41 мин 5 мин 01.01.2025
Главное

2024 год стал переломным моментом, когда фантастические видения начали обретать плоть, а искусственный интеллект перестал быть просто текстом на экране, превратившись в «двигатель физического мира». Ведущий канала Уэс Рот анализирует знаковые итоги года и прогнозы на 2025-й, опираясь на выводы ведущего исследователя NVIDIA доктора Джима Фана (Dr. Jim Fan), который предрекает наступление эпохи «божественных технологий» и повсеместной автономизации.

🤖 Эпоха «роботов-аборигенов»: от симуляции к реальности 1:46

Джим Фан утверждает, что нынешнее поколение людей — последнее, которое живет в мире без продвинутых автономных машин. По его мнению, «все, что движется, станет автономным» . Ключевой тренд 2024 года — взрывное развитие гуманоидных роботов. Выбор именно человекоподобной формы обусловлен прагматизмом: вся мировая инфраструктура, инструменты и приборы сконструированы под человеческую анатомию.

Среди лидеров индустрии выделяются несколько ключевых проектов:

Важнейшим технологическим прорывом стал метод Sim-to-Real (перенос обучения из симуляции в реальность). В симуляциях NVIDIA время течет в 10 000 раз быстрее, чем в нашей вселенной, при этом законы физики, трения и гравитации соблюдаются неукоснительно . Роботы проходят миллионы циклов обучения за считанные часы, после чего их «нейронные мозги» переносятся в физические тела.

🏠 Доступная робототехника для среднего класса 4:35

По прогнозам Уэса Рота и Джима Фана, высокотехнологичные роботы скоро станут доступнее автомобилей. Модель Unitree G1 стоимостью около $40 000 уже сейчас весит всего 35 кг и обладает впечатляющей маневренностью .

Особое внимание уделено проекту Aloha от Google DeepMind и Стэнфорда. Это набор для создания робота-помощника, который учится готовить и стирать через телеуправление .

🧠 Проект GR00T и «сознание» машин 10:20

NVIDIA запустила инициативу Project GR00T — амбициозную попытку создать универсальный «мозг» для роботов. В рамках этого проекта была разработана базовая модель Hover на 1,5 миллиона параметров . Несмотря на малый размер по сравнению с LLM (языковыми моделями), Hover выполняет критическую роль: она координирует моторы робота, имитируя работу человеческого мозжечка на уровне подсознательных рефлексов .

Другой прорыв — Dr. Eureka. Эта система использует GPT-4 для написания кода вознаграждения в симуляциях. В ходе экспериментов выяснилось, что алгоритмы, написанные ИИ, зачастую превосходят по эффективности те, что созданы лучшими инженерами-людьми . По мнению Фана, это означает, что в будущем робототехника будет развиваться преимущественно за счет усилий самого ИИ, а не человеческого интеллекта.

🌍 Моделирование мира вместо генерации видео 17:00

Обсуждая модель Sora от OpenAI и аналоги, Уэс Рот подчеркивает, что называть их просто видеогенераторами — значит недооценивать их суть. Это «симуляторы мира» . Исследование Гарварда «Beyond Surface Statistics» подтвердило, что модели обучаются глубине и 3D-геометрии объектов, даже если им скармливают только обычные 2D-изображения .

Эффект «нейронного моделирования» зашел так далеко, что исследователям удалось запустить классическую игру Doom внутри диффузионной модели без единой строчки исходного игрового кода. Нейросеть просто предсказывает следующий кадр на основе нажатий кнопок игрока .

📈 Гонка сверхмощных LLM и прорыв в логике 24:23

2024 год принес существенные изменения в архитектуре языковых моделей. Модель Claude 3.5 Sonnet шокировала сообщество своими способностями к программированию, а Gemini 1.5 Pro представила контекстное окно в 10 миллионов токенов .

🧬 ИИ в науке и медицине: Нобелевские горизонты 36:06

Джим Фан и Уэс Рот отмечают историческое признание ИИ научным сообществом: Нобелевские премии по физике и химии (за AlphaFold) в 2024 году фактически были вручены за достижения в области нейросетей .

Демис Хассабис, основатель DeepMind, полагает, что использование ИИ для моделирования протеинов может привести к «искоренению большинства болезней» . Тезис Джима Фана звучит радикально: «Сначала решите задачу создания ИИ, а затем используйте ИИ, чтобы решить всё остальное» .

🧠 Нейроинтерфейсы и интерфейс будущего 29:54

Ведущий считает тему взаимодействия человека и ИИ «критически недооцененной». Современные UI/UX (пользовательские интерфейсы) сильно отстают от возможностей самих моделей .

🏛 Резюме: Старые эмоции и технологии богов 39:17

В завершение Уэс Рот цитирует биолога Эдварда Уилсона, чьи слова Джим Фан считает девизом современной эпохи:

«Настоящая проблема человечества заключается в следующем: у нас эмоции палеолита, институты средневековья и технологии богов» .

Оба участника дискуссии сходятся во мнении, что 2025 год станет временем еще более глубокой интеграции «божественных технологий» в нашу жизнь. Несмотря на страхи, Джим Фан оптимистичен: технология неизбежна, но именно люди определяют роль, которую она будет играть в культуре и обществе.

💬 Цитаты

«Мы — последнее поколение без продвинутых роботов повсюду. Все, что движется, будет автономным.»

«Проблема человечества в том, что у нас эмоции палеолита, институты средневековья и технологии богов.»

Эдвард Уилсон (цитирует Джим Фан) 39:30

«Сначала решите задачу создания ИИ, а затем используйте ИИ, чтобы решить всё остальное.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Sim-to-Real
Процесс переноса алгоритмов управления, обученных в виртуальной симуляции, на физического робота.
In-context learning
Способность модели обучаться новым навыкам прямо в окне диалога без дообучения весов нейросети.
Inference time scaling
Метод повышения качества ответа ИИ за счет выделения модели большего времени на «размышление» перед выдачей результата.
📊 Цифры
🗓 Хронология
  1. Ноябрь 2022 Дебют ChatGPT, начало новой эры ИИ
  2. Ноябрь 2023 Первые слухи о проекте Q* (будущий o1) и способностях ИИ к рассуждению
  3. 2024 Вручение Нобелевских премий за достижения, связанные с нейросетями
⚖️ Другая сторона
Искусственный интеллект Nvidia Project GR00T Tesla Optimus OpenAI o1 Jim Fan