Мартин Касадо о DeepSeek: «Урок не в Спутнике, а в истории интернета»

a16z (Andreessen Horowitz) 10,9 тыс. 44 мин 5 мин 06.02.2025
Главное

Появление китайской нейросети DeepSeek вызвало тектонические сдвиги в индустрии искусственного интеллекта, спровоцировав панику на фондовых рынках и жаркие дискуссии о будущем американского технологического лидерства. В новом выпуске подкаста «Андрессен Горовиц» (Andreessen Horowitz) ветераны индустрии — генеральный партнер Мартин Касадо и партнер совета директоров Стивен Синофски — анализируют, является ли этот релиз «моментом Спутника» для США или же мы наблюдаем начало новой эры «Интернета в кармане», где эффективность важнее грубой силы вычислений.

🚀 Феномен DeepSeek: сигнал в море шума 0:00

Релиз модели DeepSeek R1 стал кульминацией полутора лет последовательной работы китайской команды, которая, по мнению Мартина Касадо, долгое время оставалась незамеченной западным мейнстримом . Несмотря на внезапность успеха для широкой публики, эксперты подчеркивают, что DeepSeek уже выпускала сильные модели (например, V3), которые по своим возможностям были сопоставимы с GPT-4 .

Главным триггером обсуждений стала невероятно низкая стоимость обучения — в сети фигурировала цифра в 5–6 миллионов долларов . Стивен Синофски считает реакцию рынка, стершего триллион долларов капитализации технологических компаний в один понедельник, «полным безумием и чрезмерной коррекцией» . По его словам, финансовые рынки просто не понимали технических нюансов и поддались панике.

Ключевые факторы взрывного роста популярности:

🧠 Инженерные ограничения против «грубой силы» 4:08

Мартин Касадо выдвигает тезис, что успех DeepSeek — это триумф инженерной мысли в условиях ограничений. В то время как американские гиганты (OpenAI, Google, Meta) шли по пути экстенсивного развития — больше данных, больше вычислительных мощностей, больше капитала — китайские разработчики были вынуждены оптимизировать алгоритмы .

Стивен Синофски отмечает, что западные компании попали в ловушку «гигантомании». Он вспоминает времена работы в Microsoft, когда компания перестала понимать «малые и средние» задачи, фокусируясь только на «огромных» и «колоссальных» проектах просто потому, что могла себе это позволить . DeepSeek же показала, что можно добиться аналогичных результатов, используя «умный» подход к обучению.

Основные теории эффективности DeepSeek:

  1. Инженерная оптимизация: Использование открытых архитектурных решений, которые команда смогла агрегировать и улучшить .
  2. Доступ к данным: По мнению Касадо, у DeepSeek есть преимущество в виде доступа к «внутреннему» китайскому интернету, который более структурирован и богат на данные для обучения, недоступные западным лабораториям .
  3. Дешевая разметка: Китай обладает огромным ресурсом высокообразованных специалистов, которые могут дешево аннотировать данные для этапа Chain of Thought (цепочки рассуждений) .

🔓 Лицензионная революция и дистилляция знаний 9:33

Одним из самых значимых аспектов релиза R1, который упустили многие СМИ, Касадо называет невероятно либеральную лицензию MIT . В отличие от закрытых моделей конкурентов, DeepSeek позволяет использовать свои наработки практически без ограничений, что Касадо называет «бесплатным пивом в реальности» .

Вторым критическим моментом стала публикация «цепочек рассуждений» (reasoning steps). Когда OpenAI выпустила модель o1, она скрыла внутренний процесс мышления нейросети . DeepSeek сделала их публичными, что открыло путь к массовой дистилляции.

Дистилляция в ИИ — это процесс, при котором большая «модель-учитель» обучает маленькую «модель-ученика». Благодаря открытым цепочкам рассуждений теперь можно обучать крошечные модели, способные работать локально на смартфонах или ноутбуках, сохраняя при этом высокий уровень «интеллекта» .

По мнению Синофски, это напоминает ранние годы интернета, когда велись битвы за открытые стандарты HTML и HTTP . Он утверждает, что американские компании потеряли из виду важность открытости, превратив «open source» в маркетинговый ярлык для бизнеса .

📊 Инвестиционный тезис: Модели как комодити 14:18

В дискуссии о ценности ИИ-компаний участники выделяют два сценария развития:

Стивен Синофски проводит параллель с историей ПО: сначала все думали, что нужно владеть операционной системой (Windows), чтобы заработать, но потом появился поиск (Google) — приложение, которое не владело ОС, но изменило мир . Он считает, что приложения будущего, которые действительно будут иметь значение, сегодня еще даже не изобретены .

Инвестиционные тезисы участников:

🏛️ Крах политики экспортного контроля 35:40

Мартин Касадо подвергает жесткой критике текущую регуляторную политику США в области ИИ . Он утверждает, что попытки ограничить экспорт чипов (Nvidia) и запретить open source модели для «сдерживания Китая» оказались полностью провальными .

Основные аргументы против жесткого регулирования:

Стивен Синофски призывает правительство не пытаться стать «контролером», а стать «ускорителем», проводя аналогию с Элом Гором, который создал регуляторную среду, позволившую интернету процветать, а не задушил его в интересах телеком-гигантов типа AT&T .

🔮 Прогноз: AGI в кармане и новая экономика 41:50

Участники сходятся во мнении, что DeepSeek — это не кризис для Nvidia или OpenAI, а «звонок будильника» . Касадо по-прежнему оптимистичен в отношении американских лабораторий, но считает, что им нужно прекратить «слоняться без дела» и начать быстрее строить реальные продукты .

Будущее ИИ, по мнению экспертов Андрессен Горовиц:

В завершение Стивен Синофски напоминает, что великие инновации часто приходят из неожиданных мест: интернет вышел из университетов, а протоколы TCP/IP — из лабораторий, которые крупные корпорации считали неудачными . DeepSeek, созданная на базе хедж-фонда, подтверждает это историческое правило.

💬 Цитаты

«Урок DeepSeek не в Спутнике, урок в интернете. Это еще один шаг к AGI в вашем кармане.»

Мартин Касадо 00:00

«Попытки экспортного контроля — это как объявление математики вне закона. Это просто не работает в глобальном мире.»

Стивен Синофски 38:16
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Дистилляция
Процесс обучения компактной ИИ-модели на основе ответов более крупной и мощной модели.
Chain of Thought (CoT)
Метод, заставляющий нейросеть прописывать последовательные шаги рассуждения перед выдачей финального ответа.
Scale-out
Стратегия масштабирования за счет увеличения количества узлов (устройств), а не мощности одного центрального узла.
📊 Цифры
🗓 Хронология
  1. 1994 Зимние Олимпийские игры в Лиллехаммере, когда Синофски показывал видео на Mac через ранний интернет.
  2. 2022 Релиз ChatGPT, начало текущей волны ИИ.
  3. Январь 2025 Релиз DeepSeek R1, вызвавший обвал акций технологических компаний.
⚖️ Другая сторона
Искусственный интеллект DeepSeek Andreessen Horowitz Nvidia OpenAI Мартин Касадо