Уэс Рот: «График прогресса Claude Opus 4.6 — самый пугающий в истории ИИ»

Wes Roth 81,2 тыс. 24 мин 5 мин 23.02.2026
Главное

В индустрии искусственного интеллекта появился график, который многие эксперты называют «самым пугающим» за всю историю наблюдений. Новые данные о производительности модели Claude Opus 4.6 от компании Anthropic показывают, что скорость развития нейросетевых агентов не просто сохраняется, а переходит в фазу резкого ускорения. Ведущий канала Уэс Рот анализирует последние достижения в области автоматизации интеллектуального труда и объясняет, почему ведущие лаборатории мира считают, что человечество не готово к грядущим переменам.

📈 График, меняющий представление о прогрессе 0:00

Центральным объектом обсуждения стал график, подготовленный некоммерческой организацией METR (ранее известной как Alignment Research Center). Эта организация занимается оценкой рисков и возможностей передовых моделей ИИ .

Суть метрики METR часто понимают превратно. Она измеряет прогресс не в скорости работы процессоров, а в часах человеческого труда:

Существует два основных порога успеха: 50% и 80%. На текущий момент обсуждаются результаты модели, которая справляется с задачами экспертного уровня с вероятностью 50% в «один заход» . По мнению Уэса Рота, скачок от предыдущих версий к Opus 4.6 выглядит пугающим, так как он явно выходит за рамки старой тренд-линии .

🚀 Ускорение темпов: от месяцев к дням 3:26

Ранее считалось, что возможности ИИ удваиваются примерно каждые семь месяцев. Однако последние данные заставляют пересмотреть этот прогноз.

Уэс Рот отмечает следующие изменения в динамике:

  1. Согласно анализу недавних достижений, период удвоения сократился до 123 дней — это примерно четыре месяца .
  2. Адам Бинксмит (AI Village) был одним из первых, кто указал на то, что реальный прогресс идет значительно быстрее, чем предсказывали консервативные модели .
  3. Темпы не просто стабильны, они демонстрируют экспоненциальное ускорение .

Ведущий приводит личный пример: он полностью перестроил свой сайт-агрегатор новостей natural20.com с помощью агентов на базе Opus 4.6. То, что раньше требовало ручного развертывания GitHub-проектов и настройки хостинга, ИИ выполнил за 4 часа, пока автор спал . По оценке Рота, человеку-эксперту на этот объем работы потребовалось бы минимум один-два дня .

⚠️ «Мир не готов»: мнения лидеров индустрии 5:25

Руководители ведущих AI-лабораторий в последнее время выступают с крайне серьезными предупреждениями.

Общим местом в прогнозах становится неизбежное решение проблемы программирования. Создатель инструмента Claude Code прямо заявляет: «Программирование решено» (coding is solved) . Сэм Альтман подтверждает это мнение, считая, что навыки ручного написания кода на C++ становятся нерелевантными .

🏦 Личный опыт: автоматизация бухгалтерии за игрой в видеоигры 8:55

Уэс Рот делится историей о том, как он делегировал ИИ-агенту сложную бухгалтерскую задачу, которую откладывал месяцами из-за её запутанности .

Процесс выглядел следующим образом:

Особо Рот подчеркивает «интуитивное» понимание модели: она смогла расшифровать личные пометки автора и контекст чисел, работая как «идеально выспавшийся и сосредоточенный эксперт» . Более того, ИИ не просто выполнил разовую задачу, а создал SQL-базу данных, автоматизировав этот процесс навсегда .

📜 Аналогия с печатным станком: от кодеров к «строителям» 11:58

Обсуждая будущее профессий, Уэс Рот проводит историческую параллель с изобретением печатного станка Гутенберга.

До его появления существовала каста писцов — профессионалов, чей труд был редким и дорогим . После распространения печати грамотность стала массовой, и профессия писца исчезла, уступив место писателям.

⚖️ Скептицизм и контраргументы 15:00

Несмотря на впечатляющие цифры, существуют серьезные причины для осторожности. Уэс Рот призывает не ставить «всю жизнь на один график», приводя доводы критиков .

Основные пункты скептиков:

  1. Огромные доверительные интервалы: Хотя среднее значение Opus 4.6 — 14,5 часов, разброс составляет от 6 до 98 часов . Это означает высокую степень неопределенности в реальных результатах.
  2. Смешение времени и сложности: Иниолува Дебора Раджи (UC Berkeley) утверждает, что длительность выполнения задачи человеком не всегда напрямую коррелирует с её сложностью для робота . То, что трудно для нас, может быть легким для кода, и наоборот.
  3. Проблема «галлюцинаций»: ИИ по-прежнему совершает глупые ошибки. Критики полагают, что это станет непреодолимым плато . Уэс Рот возражает на это, считая, что при такой высокой ценности результата (замена недель труда) лучшие умы мира неизбежно найдут способы создания «защитных барьеров» и систем проверки .

🔮 Прогноз до 2035 года: миллионнократная эффективность 21:41

В завершение Уэс Рот приводит долгосрочные прогнозы METR, которые выглядят еще более радикально.

По оценкам исследователей:

Хотя споры о том, означают ли эти цифры реальный интеллект или просто продвинутую статистику, продолжаются, Рот уверен в одном: траектория неизменна . Даже скептики больше не говорят, что ИИ не станет лучше; они лишь спорят о деталях того, как именно он изменит мир и с какой скоростью.

💬 Цитаты

«Мир не готов. Взлет возможностей моделей будет гораздо более быстрым, чем я предполагал.»

Сэм Альтман 05:38

«Почти 100% задач по разработке программного обеспечения внутри Anthropic уже выполняются моделями.»

Дарио Амодеи 08:01

«Профессия писца исчезла с приходом печатного станка. То же самое произойдет с кодерами — мы все станем «строителями».»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
METR
Некоммерческая организация (ранее ARC), оценивающая возможности и риски безопасности передовых моделей ИИ.
Сингулярность
Гипотетический момент, когда технологический прогресс становится неуправляемым и необратимым, порождая интеллект, превосходящий человеческий.
AGI
Общий искусственный интеллект, способный выполнить любую интеллектуальную задачу, доступную человеку.
📊 Цифры
🗓 Хронология
  1. Ноябрь 2024 Начало «новой волны» моделей, вызвавшей резкое ускорение графиков прогресса.
  2. Январь 2026 Заявление Илона Маска о входе человечества в фазу сингулярности.
  3. Февраль 2027 Прогнозируемая дата, когда ИИ сможет заменять 3 рабочие недели труда эксперта за один раз.
  4. 2032 Ожидаемая полная автоматизация R&D в сфере искусственного интеллекта.
⚖️ Другая сторона
Искусственный интеллект Claude Opus 4.6 METR Sam Altman Anthropic экспоненциальный рост