Компания Anthropic представила новую флагманскую модель Claude Opus 4.6, совершив очередной рывок в гонке вооружений между лабораториями искусственного интеллекта. Ведущий канала Wes Roth Уэс Рот анализирует последствия этого релиза, который уже вызвал серьезные колебания на фондовом рынке и обозначил переход индустрии от простых чат-ботов к концепции «труда как услуги» (Labor as a Service), где ИИ-агенты способны выполнять сложные многодневные задачи в автономном режиме.
🚀 Новая эра автономности: Claude Opus 4.6 0:00
Компания Anthropic выпустила модель Opus 4.6, которая, по мнению Уэса Рота, вызывает «ударные волны» по всей индустрии . Несмотря на то что Anthropic меньше многих других ведущих лабораторий, её влияние на сектор ИИ остается колоссальным. Ведущий отмечает, что недавний выпуск плагинов для Claude Co-work (инструмента для повседневной работы) привел к заметному падению акций технологических компаний, работающих по модели SaaS (программное обеспечение как услуга), так как инвесторы осознали потенциал новых инструментов .
Ключевые особенности Opus 4.6:
- Контекстное окно объемом 1 миллион токенов (на данный момент в режиме бета-тестирования) .
- Способность удерживать в памяти огромные массивы данных, что критически важно для программирования и работы с крупными кодовыми базами .
- Переход от инкрементальных улучшений к «агентному планированию» (agentic planning) .
По словам Рота, в отличие от версии 4.5, которая просто следовала инструкциям, Opus 4.6 способна к самокоррекции: она самостоятельно находит ошибки в сгенерированном коде и исправляет их до выдачи финального результата .
📊 Прорыв в тестах и «последний экзамен человечества» 4:34
Эффективность новой модели подтверждается значительным ростом показателей в специализированных бенчмарках. Opus 4.6 ориентирована на задачи с «длинным горизонтом» (long horizon tasks), выполнение которых у человека могло бы занять часы или дни .
Результаты тестов, приведенные в видео:
- На тесте «Humanity's Last Exam» (Последний экзамен человечества) показатели выросли с 30% до 40% (без использования инструментов) и с 43% до 53% (с использованием инструментов) .
- В тесте RGI2 результат подскочил с 37,6 до 68,8 .
- Зафиксированы значительные успехи в агентном использовании терминала, компьютера, поиске информации и применении инструментов .
🏢 «Труд как услуга» и обвал акций SaaS-компаний 2:10
Уэс Рот вводит новый термин — «Labor as a Service» (LaaS, труд как услуга). По его мнению, если раньше индустрия прошла путь от SaaS к «интеллекту как услуге», то теперь frontier-лаборатории начинают предоставлять полноценных ИИ-сотрудников . Эти системы смогут выполнять работу за компьютером так же, как это делает живой наемный работник.
Ведущий подчеркивает последствия этого перехода:
- Релиз плагинов Claude Co-work спровоцировал распродажу акций в технологическом секторе .
- Особенно пострадали компании, чья бизнес-модель строится на классическом SaaS, который теперь рискует быть замещенным автономными агентами .
- Инструмент Claude Code, который ранее отпугивал «нормисов» своим интерфейсом в виде терминала, теперь интегрирован в более дружелюбную среду Co-work .
🕵️ Шпионские игры и загадочная Sonnet 5 5:27
Помимо Opus 4.6, Anthropic подтвердила скорый выход Claude Sonnet 5, которая внутри компании, как сообщается, носила кодовое имя «Fenic» (Феник) . Рот выдвигает интересную теорию относительно утечек даты релиза этой модели.
По мнению автора канала, Anthropic могла применить тактику Тириона Ланнистера из «Игры престолов»: дать разным людям разную информацию о дате выхода, чтобы вычислить «шпиона» среди сотрудников по тому, какая именно дата попадет в сеть .
Ожидаемые характеристики Sonnet 5 (на уровне слухов):
- Превосходит текущую Opus 4.5 по многим параметрам .
- На 50% дешевле и значительно быстрее предшественников .
- Способность запускать параллельные субагенты («рои» агентов) для одновременной работы над разными подзадачами .
🐝 ИИ как Factorio: командная работа агентов 7:24
Anthropic представила функцию «Agent Teams» (команды агентов), которая на данный момент находится в статусе исследовательского превью . Это позволяет запускать несколько агентов параллельно для работы над одним проектом.
Уэс Рот называет это «оркестрированными мультиагентными системами» и сравнивает процесс с игрой Factorio . Основное преимущество такого подхода — устранение «последовательного узкого места» (sequential bottleneck). То, на что раньше требовалось 30 минут диалога с чат-ботом, теперь может быть выполнено за 5 минут благодаря параллельной работе нескольких сущностей .
⚔️ Конкуренция с OpenAI: ИИ в роли операционной системы 8:40
Почти одновременно с релизом Anthropic, компания OpenAI представила свой проект Frontier . Рот считает, что обе компании стремятся к одной цели — стать своего рода «операционной системой», на которой будет работать весь бизнес .
Другая метафора, которую предлагает ведущий: ИИ-платформы будущего станут аналогом «HR-отдела для ИИ-агентов» . Они будут управлять наймом, распределением задач и контролем автономных цифровых сотрудников внутри корпораций.
В завершение Уэс Рот поделился личным опытом: он попросил своего агента (на базе Open Claude) обновиться до версии Opus 4.6. После того как агент согласился и «ушел» выполнять задачу, в эфире наступила тишина . Ведущий с иронией отметил, что отсутствие вестей от агента в течение 20 минут начинает его беспокоить, но выразил надежду, что процесс обновления проходит успешно .