Уэс Рот: «Anthropic Opus 4.6 запускает новую модель труда как услуги»

Компания Anthropic представила новую флагманскую модель Claude Opus 4.6, совершив очередной рывок в гонке вооружений между лабораториями искусственного интеллекта. Ведущий канала Wes Roth Уэс Рот анализирует последствия этого релиза, который уже вызвал серьезные колебания на фондовом рынке и обозначил переход индустрии от простых чат-ботов к концепции «труда как услуги» (Labor as a Service), где ИИ-агенты способны выполнять сложные многодневные задачи в автономном режиме.

🚀 Новая эра автономности: Claude Opus 4.6 0:00

Компания Anthropic выпустила модель Opus 4.6, которая, по мнению Уэса Рота, вызывает «ударные волны» по всей индустрии . Несмотря на то что Anthropic меньше многих других ведущих лабораторий, её влияние на сектор ИИ остается колоссальным. Ведущий отмечает, что недавний выпуск плагинов для Claude Co-work (инструмента для повседневной работы) привел к заметному падению акций технологических компаний, работающих по модели SaaS (программное обеспечение как услуга), так как инвесторы осознали потенциал новых инструментов .

Ключевые особенности Opus 4.6:

Контекстное окно объемом 1 миллион токенов (на данный момент в режиме бета-тестирования) .
Способность удерживать в памяти огромные массивы данных, что критически важно для программирования и работы с крупными кодовыми базами .
Переход от инкрементальных улучшений к «агентному планированию» (agentic planning) .

По словам Рота, в отличие от версии 4.5, которая просто следовала инструкциям, Opus 4.6 способна к самокоррекции: она самостоятельно находит ошибки в сгенерированном коде и исправляет их до выдачи финального результата .

📊 Прорыв в тестах и «последний экзамен человечества» 4:34

Эффективность новой модели подтверждается значительным ростом показателей в специализированных бенчмарках. Opus 4.6 ориентирована на задачи с «длинным горизонтом» (long horizon tasks), выполнение которых у человека могло бы занять часы или дни .

Результаты тестов, приведенные в видео:

На тесте «Humanity's Last Exam» (Последний экзамен человечества) показатели выросли с 30% до 40% (без использования инструментов) и с 43% до 53% (с использованием инструментов) .
В тесте RGI2 результат подскочил с 37,6 до 68,8 .
Зафиксированы значительные успехи в агентном использовании терминала, компьютера, поиске информации и применении инструментов .

🏢 «Труд как услуга» и обвал акций SaaS-компаний 2:10

Уэс Рот вводит новый термин — «Labor as a Service» (LaaS, труд как услуга). По его мнению, если раньше индустрия прошла путь от SaaS к «интеллекту как услуге», то теперь frontier-лаборатории начинают предоставлять полноценных ИИ-сотрудников . Эти системы смогут выполнять работу за компьютером так же, как это делает живой наемный работник.

Ведущий подчеркивает последствия этого перехода:

Релиз плагинов Claude Co-work спровоцировал распродажу акций в технологическом секторе .
Особенно пострадали компании, чья бизнес-модель строится на классическом SaaS, который теперь рискует быть замещенным автономными агентами .
Инструмент Claude Code, который ранее отпугивал «нормисов» своим интерфейсом в виде терминала, теперь интегрирован в более дружелюбную среду Co-work .

🕵️ Шпионские игры и загадочная Sonnet 5 5:27

Помимо Opus 4.6, Anthropic подтвердила скорый выход Claude Sonnet 5, которая внутри компании, как сообщается, носила кодовое имя «Fenic» (Феник) . Рот выдвигает интересную теорию относительно утечек даты релиза этой модели.

По мнению автора канала, Anthropic могла применить тактику Тириона Ланнистера из «Игры престолов»: дать разным людям разную информацию о дате выхода, чтобы вычислить «шпиона» среди сотрудников по тому, какая именно дата попадет в сеть .

Ожидаемые характеристики Sonnet 5 (на уровне слухов):

Превосходит текущую Opus 4.5 по многим параметрам .
На 50% дешевле и значительно быстрее предшественников .
Способность запускать параллельные субагенты («рои» агентов) для одновременной работы над разными подзадачами .

🐝 ИИ как Factorio: командная работа агентов 7:24

Anthropic представила функцию «Agent Teams» (команды агентов), которая на данный момент находится в статусе исследовательского превью . Это позволяет запускать несколько агентов параллельно для работы над одним проектом.

Уэс Рот называет это «оркестрированными мультиагентными системами» и сравнивает процесс с игрой Factorio . Основное преимущество такого подхода — устранение «последовательного узкого места» (sequential bottleneck). То, на что раньше требовалось 30 минут диалога с чат-ботом, теперь может быть выполнено за 5 минут благодаря параллельной работе нескольких сущностей .

⚔️ Конкуренция с OpenAI: ИИ в роли операционной системы 8:40

Почти одновременно с релизом Anthropic, компания OpenAI представила свой проект Frontier . Рот считает, что обе компании стремятся к одной цели — стать своего рода «операционной системой», на которой будет работать весь бизнес .

Другая метафора, которую предлагает ведущий: ИИ-платформы будущего станут аналогом «HR-отдела для ИИ-агентов» . Они будут управлять наймом, распределением задач и контролем автономных цифровых сотрудников внутри корпораций.

В завершение Уэс Рот поделился личным опытом: он попросил своего агента (на базе Open Claude) обновиться до версии Opus 4.6. После того как агент согласился и «ушел» выполнять задачу, в эфире наступила тишина . Ведущий с иронией отметил, что отсутствие вестей от агента в течение 20 минут начинает его беспокоить, но выразил надежду, что процесс обновления проходит успешно .