Уэс Рот: «График прогресса Claude Opus 4.6 — самый пугающий в истории ИИ»

В индустрии искусственного интеллекта появился график, который многие эксперты называют «самым пугающим» за всю историю наблюдений. Новые данные о производительности модели Claude Opus 4.6 от компании Anthropic показывают, что скорость развития нейросетевых агентов не просто сохраняется, а переходит в фазу резкого ускорения. Ведущий канала Уэс Рот анализирует последние достижения в области автоматизации интеллектуального труда и объясняет, почему ведущие лаборатории мира считают, что человечество не готово к грядущим переменам.

📈 График, меняющий представление о прогрессе 0:00

Центральным объектом обсуждения стал график, подготовленный некоммерческой организацией METR (ранее известной как Alignment Research Center). Эта организация занимается оценкой рисков и возможностей передовых моделей ИИ .

Суть метрики METR часто понимают превратно. Она измеряет прогресс не в скорости работы процессоров, а в часах человеческого труда:

Ось Y на графике показывает, сколько времени потребовалось бы живому эксперту (например, в кибербезопасности или программировании) для выполнения конкретной задачи .
Если модель Opus 4.6 находится на отметке 14,5 часов, это означает, что она способна решить задачу, на которую у квалифицированного специалиста ушло бы почти два полных рабочих дня .
При этом само устройство может выполнить эту работу за минуты или часы — для графика важна именно ценность заменяемого человеческого ресурса .

Существует два основных порога успеха: 50% и 80%. На текущий момент обсуждаются результаты модели, которая справляется с задачами экспертного уровня с вероятностью 50% в «один заход» . По мнению Уэса Рота, скачок от предыдущих версий к Opus 4.6 выглядит пугающим, так как он явно выходит за рамки старой тренд-линии .

🚀 Ускорение темпов: от месяцев к дням 3:26

Ранее считалось, что возможности ИИ удваиваются примерно каждые семь месяцев. Однако последние данные заставляют пересмотреть этот прогноз.

Уэс Рот отмечает следующие изменения в динамике:

Согласно анализу недавних достижений, период удвоения сократился до 123 дней — это примерно четыре месяца .
Адам Бинксмит (AI Village) был одним из первых, кто указал на то, что реальный прогресс идет значительно быстрее, чем предсказывали консервативные модели .
Темпы не просто стабильны, они демонстрируют экспоненциальное ускорение .

Ведущий приводит личный пример: он полностью перестроил свой сайт-агрегатор новостей natural20.com с помощью агентов на базе Opus 4.6. То, что раньше требовало ручного развертывания GitHub-проектов и настройки хостинга, ИИ выполнил за 4 часа, пока автор спал . По оценке Рота, человеку-эксперту на этот объем работы потребовалось бы минимум один-два дня .

⚠️ «Мир не готов»: мнения лидеров индустрии 5:25

Руководители ведущих AI-лабораторий в последнее время выступают с крайне серьезными предупреждениями.

Сэм Альтман (OpenAI): В интервью от 20 февраля 2026 года (согласно контексту обсуждения будущих дат или версий) Альтман заявил: «Мир не готов» . По его словам, взлет возможностей моделей будет гораздо более быстрым, чем он сам предполагал ранее, что вызывает у него стресс и тревогу .
Дарио Амодеи (Anthropic): В недавних подкастах он отметил, что мы приближаемся к «эндгейму» экспоненциального роста . По утверждению Амодеи, почти 100% задач по разработке программного обеспечения внутри самой компании Anthropic уже автоматизированы с помощью ИИ .
Илон Маск: В январе он заявил, что человечество уже вошло в состояние сингулярности, и 2026 год станет её полноценным воплощением .

Общим местом в прогнозах становится неизбежное решение проблемы программирования. Создатель инструмента Claude Code прямо заявляет: «Программирование решено» (coding is solved) . Сэм Альтман подтверждает это мнение, считая, что навыки ручного написания кода на C++ становятся нерелевантными .

🏦 Личный опыт: автоматизация бухгалтерии за игрой в видеоигры 8:55

Уэс Рот делится историей о том, как он делегировал ИИ-агенту сложную бухгалтерскую задачу, которую откладывал месяцами из-за её запутанности .

Процесс выглядел следующим образом:

Ведущий просто выгрузил все финансовые данные, счета и отчеты в агента на базе Opus 4.6.
Пока ИИ разбирался в цифрах, автор играл в видеоигру Mega Bonk на основном мониторе .
За 30–40 минут агент полностью сопоставил платежи, выявил задолженности и организовал данные .

Особо Рот подчеркивает «интуитивное» понимание модели: она смогла расшифровать личные пометки автора и контекст чисел, работая как «идеально выспавшийся и сосредоточенный эксперт» . Более того, ИИ не просто выполнил разовую задачу, а создал SQL-базу данных, автоматизировав этот процесс навсегда .

📜 Аналогия с печатным станком: от кодеров к «строителям» 11:58

Обсуждая будущее профессий, Уэс Рот проводит историческую параллель с изобретением печатного станка Гутенберга.

До его появления существовала каста писцов — профессионалов, чей труд был редким и дорогим . После распространения печати грамотность стала массовой, и профессия писца исчезла, уступив место писателям.

Тезис автора: В будущем не будет «программистов» в нынешнем понимании. Все станут «грамотными» в создании софта .
Роль эксперта: Как массовая грамотность не сделала каждого великим писателем, так и доступ к ИИ не сделает каждого гениальным разработчиком. Разрыв между теми, кто потратил 10 000 часов на освоение работы с агентами, и новичками сохранится .
Новая идентичность: Людей будут называть не «кодерами», а «строителями» (builders), чьим инструментом является создание систем через ИИ .

⚖️ Скептицизм и контраргументы 15:00

Несмотря на впечатляющие цифры, существуют серьезные причины для осторожности. Уэс Рот призывает не ставить «всю жизнь на один график», приводя доводы критиков .

Основные пункты скептиков:

Огромные доверительные интервалы: Хотя среднее значение Opus 4.6 — 14,5 часов, разброс составляет от 6 до 98 часов . Это означает высокую степень неопределенности в реальных результатах.
Смешение времени и сложности: Иниолува Дебора Раджи (UC Berkeley) утверждает, что длительность выполнения задачи человеком не всегда напрямую коррелирует с её сложностью для робота . То, что трудно для нас, может быть легким для кода, и наоборот.
Проблема «галлюцинаций»: ИИ по-прежнему совершает глупые ошибки. Критики полагают, что это станет непреодолимым плато . Уэс Рот возражает на это, считая, что при такой высокой ценности результата (замена недель труда) лучшие умы мира неизбежно найдут способы создания «защитных барьеров» и систем проверки .

🔮 Прогноз до 2035 года: миллионнократная эффективность 21:41

В завершение Уэс Рот приводит долгосрочные прогнозы METR, которые выглядят еще более радикально.

По оценкам исследователей:

К 2032 году до 99% всех исследований и разработок в области самого искусственного интеллекта будут автоматизированы .
Это может привести к росту эффективности разработки ИИ в диапазоне от 1000 до 10 000 000 раз к 2035 году .
Уже к февралю 2027 года модели могут достичь уровня, позволяющего заменять три рабочие недели человеческого труда в рамках одной сессии .

Хотя споры о том, означают ли эти цифры реальный интеллект или просто продвинутую статистику, продолжаются, Рот уверен в одном: траектория неизменна . Даже скептики больше не говорят, что ИИ не станет лучше; они лишь спорят о деталях того, как именно он изменит мир и с какой скоростью.