В новом выпуске своего блога популярный технологический обозреватель Уэс Рот анализирует недавнее резонансное заявление сооснователя Anthropic и бывшего вице-президента OpenAI Дарио Амодеи. В центре внимания — детальный разбор его эссе, посвященного китайской нейросети DeepSeek и критической важности экспортных ограничений на чипы. Уэс Рот рассматривает масштабный сдвиг парадигмы в разработке искусственного интеллекта и предупреждает о геополитических рисках, с которыми сталкивается западный мир в гонке за суперинтеллект.
🌍 Раскол в лагере AI Safety и новая позиция Дарио Амодеи 0:00
Дарио Амодеи долгое время считался в ИИ-сообществе одним из главных защитников безопасности искусственного интеллекта. В свое время он и его команда покинули OpenAI именно из-за разногласий по вопросам коммерциализации и безопасности, чтобы основать собственную компанию Anthropic. Однако в последнее время взгляды Амодеи начали расходиться с позицией традиционного сообщества AI Safety. Поводом для жесткой критики послужило официальное партнерство Anthropic с компаниями Palantir и Amazon с целью предоставления облачных моделей Claude оборонным ведомствам и спецслужбам США.
По словам Уэса Рота, в сообществе эта новость вызвала бурные споры:
- Пользователи профильных ресурсов создают мемы о том, что Амодеи «стал злодеем, которого поглотил Молох».
- Исследователь Конор Лихи выразил глубокое разочарование тем, что Anthropic открыто призывает к созданию систем рекурсивного самосовершенствования ИИ.
Уэс Рот подчеркивает, что не принимает чью-либо сторону в данном конфликте, но отмечает: именно в такой напряженной атмосфере Дарио Амодеи выступил со своими программными тезисами об угрозе со стороны Китая.
📈 Экономика ИИ: Законы масштабирования и парадокс Джевонса 2:11
В основе современного прогресса ИИ лежат так называемые законы масштабирования (Scaling Laws), которые Дарио Амодеи и его партнеры начали детально документировать еще во время работы в OpenAI. Согласно этим законам, простое увеличение объемов данных, вычислительной мощности и времени обучения приводит к предсказуемому и плавному улучшению когнитивных способностей моделей на широком спектре задач.
Уэс Рот приводит наглядный пример действия этих законов в индустрии:
- Модель стоимостью $1 млн способна решить около 20% важных задач по программированию.
- Модель за $10 млн поднимает планку прохождения тестов до 40%.
- Инвестиции в размере $100 млн позволяют решать уже 60% таких когнитивных задач.
Каждое десятикратное увеличение бюджета может означать качественный скачок возможностей — например, от уровня студента бакалавриата до уровня доктора наук (PhD). Именно поэтому такие гиганты, как Meta и Microsoft, вливают колоссальные средства в закупку графических процессоров Nvidia, которые сегодня фактически правят бал в сфере обучения ИИ.
Вторым важным фактором Амодеи называет алгоритмический прогресс, или «сдвиг кривой» эффективности. Индустрия регулярно находит новые архитектурные решения и методы оптимизации кода, которые выступают в роли «вычислительных множителей» (compute multipliers). Если алгоритмическое улучшение дает двукратный множитель, то компания может получить точно такую же точность модели за $5 млн вместо $10 млн. Каждая передовая лаборатория регулярно открывает мелкие (на 20%) и средние (в 2 раза) множители, а изредка — крупные прорывы, увеличивающие эффективность в 10 раз.
По оценкам Амодеи, если в 2020 году темп алгоритмического прогресса составлял около 1,68 раза в год, то сегодня он ускорился примерно до 4 раз в год. Исследовательская организация Epoch также подтверждает в своей работе, что вычислительная эффективность больших языковых моделей удваивается каждые 5–14 месяцев. На рынке это выражается в стремительном падении цен: например, модель Claude 3.5 Sonnet, выпущенная через 15 месяцев после GPT-4, превосходит ее по бенчмаркам, но стоит в 10 раз дешевле для клиентов по API.
Однако здесь вступает в силу парадокс Джевонса: когда производство ресурса (в данном случае интеллекта) становится дешевле и эффективнее, его потребление не падает, а лавинообразно растет. Амодеи утверждает, что вместо экономии бюджетов компании направляют все сэкономленные средства на обучение еще более мощных и умных моделей. Спрос на интеллект со стороны бизнеса (создание роботов, кодинг-инструментов, переводчиков) выглядит практически безграничным. Как только вычисления дешевеют, технологические лидеры (включая Сэма Альтмана и Имада Муштака) предпочитают двигаться по кривой масштабирования быстрее, задействуя все доступные чипы.
🧠 Новый технологический уклад: Обучение с подкреплением и вычисления на этапе вывода 7:48
В индустрии ИИ происходит важнейший сдвиг парадигмы. Если раньше основным объектом масштабирования выступал этап предварительного обучения (pre-training) на гигантских массивах данных, то теперь фокус сместился на этап вывода. Речь идет о масштабировании вычислений во время тестирования (test-time compute) с использованием обучения с подкреплением (Reinforcement Learning, RL) для генерации цепочек рассуждений (chains of thought).
[Image of reinforcement learning feedback loop with agent and environment]
Подобные технологии рассуждений применяются в моделях OpenAI o1 и DeepSeek R1. Уэс Рот замечает, что у Anthropic в модели Claude тоже есть скрытые цепочки мыслей, активируемые через функцию "thinking", однако, по его мнению, китайская компания DeepSeek фактически обогнала Anthropic, первой выпустив полноценную открытую модель рассуждений, эквивалентную o1.
Чтобы объяснить суть обучения с подкреплением, Уэс Рот обращается к примерам из игровой индустрии:
- Нейросеть GameNGen от Google: Исследователи создали нейросеть, которая генерирует игровой процесс классической игры Doom в реальном времени на основе действий игрока. Поскольку качественных записей игры не хватало, разработчики обучили тысячи ИИ-агентов играть в Doom круглосуточно. Обучение строилось на функции вознаграждения: за попадание во врага агент получал +300 очков, за убийство — +1000 очков, а за потерю здоровья или смерть штрафовался на огромные суммы (до -5000 очков за гибель персонажа). В итоге ИИ самостоятельно выработал успешные игровые стратегии без участия человека.
- Эксперимент OpenAI с игрой в прятки: Агенты (синие и красные) играли в виртуальном пространстве миллиарды раз. Модели не обучали конкретным действиям, им просто начисляли очки за удержание противника в поле зрения (или за успешное скрытие от него). На первом этапе они двигались хаотично, но со временем ИИ самостоятельно изобрел сложные скоординированные действия: строительство укрытий из блоков, блокирование дверей и даже использование багов физического движка для «серфинга» на коробках ради преодоления стен.
Известный ИИ-эксперт Андрей Карпати (экс-Tesla и экс-OpenAI) подчеркивает, что для сторонников открытого исходного кода создание разнообразных сред для обучения с подкреплением — это самый высокоэффективный путь. По мнению Карпати, построение таких распределенных «тренажерных залов» (gyms) для когнитивных задач позволит силами большого сообщества создать мощные открытые модели рассуждений.
Дарио Амодеи подчеркивает, что этот новый этап RL-масштабирования находится в самом начале своей кривой. Сейчас расходы на обучение рассуждениям у всех игроков относительно малы, но компании стремительно разворачивают инфраструктуру, чтобы масштабировать этот этап до сотен миллионов и миллиардов долларов. По мнению Уэса Рота, именно слияние общей языковой логики LLM и методов обучения с подкреплением является тем самым «топливом», которое способно вывести человечество на прямую траекторию к созданию суперинтеллекта.
🇨🇳 Феномен DeepSeek: Технический прорыв или закономерная эволюция стоимости? 19:55
Недавние релизы китайской компании DeepSeek вызвали шок на мировом рынке, спровоцировав падение капитализации Nvidia на полтриллиона долларов за один день. Сначала компания выпустила базовую модель DeepSeek V3, а затем представила рассуждающую модель R1.
Дарио Амодеи делится неожиданным выводом: по его мнению, настоящей инновацией был именно релиз V3, в то время как R1 — это лишь качественное воспроизведение того, что OpenAI уже сделала в своей модели o1. В архитектуре DeepSeek V3 глава Anthropic выделяет две важные инженерные находки:
- Эффективное использование кэша ключей и значений (key-value cache).
- Прорыв в оптимизации архитектуры Mixture of Experts (MoE — смесь экспертов), когда на каждый запрос отвечает не вся огромная нейросеть, а лишь специализированные субмодели, выводимые на передний план.
В то же время Амодеи категорически не согласен с утверждениями, будто DeepSeek совершила чудо и сделала за $6 млн то, на что американские лаборатории тратят миллиарды. Он указывает, что модель Claude 3.5 Sonnet — это среднеразмерная модель, обучение которой обошлось Anthropic всего в «несколько десятков миллионов долларов» (ориентировочно $20–30 млн). При этом Sonnet обучалась без дистилляции знаний из более крупных моделей почти год назад и до сих пор опережает DeepSeek по ряду внутренних тестов.
Таким образом, Амодеи утверждает, что модель DeepSeek V3 отстает от американских аналогов на 7–10 месяцев. Ее создание стоило дешевле, но разрыв в затратах совершенно не соответствует тем фантастическим пропорциям, о которых трубят медиа. По мнению руководителя Anthropic, DeepSeek V3 — это не уникальный экономический слом, а ожидаемая точка на стандартной кривой снижения стоимости технологий ИИ. Уникальность ситуации лишь в том, что эту точку впервые заняла китайская компания, что придает событию колоссальный геополитический вес.
Помимо этого, Амодеи комментирует слухи об инфраструктуре DeepSeek. По разным оценкам, китайская компания оперирует кластером примерно из 50 000 чипов архитектуры Hopper от Nvidia (включая урезанные для китайского рынка версии H20 и H800). Это в 2–3 раза меньше, чем у американского мегакластера xAI Colossus Илона Маска, а рыночная стоимость такого объема оборудования составляет около $1 млрд. Это доказывает, что реальные совокупные расходы DeepSeek как компании вполне сопоставимы с бюджетами ведущих лабораторий США.
🔮 Два сценария будущего: Многополярный мир гениев в дата-центрах против монополии США 26:37
Дарио Амодеи убежден, что любые алгоритмические оптимизации и инженерные хитрости не остановят гонку бюджетов. Компании продолжат тратить запланированные миллиарды и десятки миллиардов долларов, просто на выходе они будут получать значительно более умные системы, чем предполагалось ранее. По прогнозам главы Anthropic, этот процесс неостановим и приведет к созданию искусственного интеллекта, превосходящего большинство людей практически во всех сферах, уже в 2026–2027 годах.
Уэс Рот напоминает, что с такими радикальными сроками согласны далеко не все. Например, известный критик ИИ Гари Маркус назвал эти даты «взятыми с потолка» и публично предложил Амодеи пари на $100 000, утверждая, что до конца 2027 года полноценный суперинтеллект создан не будет. Однако Амодеи настаивает, что его прогнозы остаются в силе, поскольку успехи DeepSeek уже были заложены в его экономические расчеты.
По мнению Амодеи, к 2026–2027 годам мир неминуемо разделится по одному из двух путей в зависимости от жесткости экспортного контроля США на поставку полупроводников в КНР:
- Двуполярный мир («Страна гениев в дата-центре»): Если Китай сможет обойти ограничения и получить миллионы производительных чипов, человечество столкнется с ситуацией, когда и США, и КНР будут обладать эквивалентными технологиями суперинтеллекта. Амодеи описывает это как появление целой виртуальной страны, состоящей исключительно из гениальных ученых, работающих внутри дата-центров 24/7. При этом баланс сил вряд ли будет долговечным: Дарио опасается, что авторитарный Китай сможет направить гораздо больший процент этого ИИ-интеллекта, капитала и ресурсов напрямую на военные нужды и оборонные разработки, чем демократические страны.
- Однополярный мир стабильного преимущества США: Если экспортный контроль сработает и лишит Китай возможности закупать чипы миллионами штук, США и их союзники получат временное, но устойчивое технологическое лидерство. Поскольку развитые ИИ-системы будут напрямую помогать проектировать следующие, еще более умные поколения ИИ, этот стартовый отрыв может превратиться в постоянное и непреодолимое преимущество. Уэс Рот комментирует это метафорой: «Идет игра на все фишки». Ошибка на этом этапе может навсегда зафиксировать либо очень хороший, либо катастрофический сценарий для мирового порядка.
Подводя итог, Амодеи подчеркивает, что жесткий экспортный контроль — единственный инструмент влияния на эту развилку. Спрятать закупки на $1 млрд (как текущий кластер DeepSeek) еще возможно через серые схемы, но скрыть или контрабандным путем ввезти миллионы чипов стоимостью в $10 млрд или $100 млрд физически нереально. При этом Дарио отмечает, что не считает самих китайских исследователей из DeepSeek врагами: в интервью они производят впечатление умных и искренне увлеченных ученых. Однако они полностью подконтрольны авторитарному правительству КНР, и если то получит паритет с США в сфере ИИ, его действия на мировой арене станут гораздо более агрессивными и непредсказуемыми.