Опасная мощь или маркетинг: Opus 4.7 почти догнала Mythos

Matthew Berman 88,3 тыс. 18 мин 4 мин 16.04.2026
Главное

16 апреля 2026 года мир ИИ-технологий всколыхнуло неожиданное событие: компания Anthropic выпустила обновление своей флагманской модели — Claude Opus 4.7. Известный ИИ-эксперт и видеоблогер Мэтью Берман в своем экстренном разборе анализирует этот релиз, который вызывает больше вопросов, чем ответов, на фоне таинственной и «слишком мощной» модели Mythos.

🚀 Прыжок выше головы: Opus 4.7 против Mythos

Главная странность релиза заключается в позиционировании модели. Всего неделю назад Anthropic анонсировала Mythos — модель нового поколения, которую компания отказалась выпускать в открытый доступ, мотивируя это её «чрезмерной мощью» и рисками для кибербезопасности. Однако вышедшая сегодня Opus 4.7 по многим показателям вплотную приблизилась к показателям Mythos.

Сравнение бенчмарков

Мэтью Берман приводит впечатляющие цифры, которые заставляют усомниться в искренности Anthropic:

Берман задается вопросом: где именно проходит та «черта на песке», после которой модель считается опасной? По его мнению, Anthropic может использовать «угрозу мощности Mythos» как маркетинговый ход, в то время как реально доступные модели уже достигают критических высот производительности.

🛠 Маховик рекурсивного самосовершенствования

Берман подчеркивает стратегию Anthropic: компания сфокусирована на создании лучших в мире моделей для программирования. Это не просто бизнес-решение, а технологический «маховик»:

  1. Продажи: Лучший кодинг-инструмент приносит огромную выручку (ARR компании уже достиг 30 миллиардов долларов, удваиваясь каждые пару месяцев).
  2. Ресурсы: Деньги идут на закупку GPU.
  3. Развитие: С помощью лучших кодинг-моделей и новых GPU компания пишет код для создания еще более совершенных моделей.

Это и есть путь к рекурсивному самосовершенствованию ИИ.

🛡 Искусственная деградация и вопросы безопасности

Самый интригующий момент в технических характеристиках Opus 4.7 — это намеренное ухудшение некоторых функций. В тесте на воспроизведение уязвимостей кибербезопасности показатели модели упали с 73.8 до 73.1.

Anthropic открыто признает: в процессе обучения они экспериментировали с методами дифференциального снижения возможностей модели в опасных сферах.

«Они буквально ломают модель в определенных местах, чтобы она не умела хакерить», — поясняет Берман. — «Но это может выйти им боком, так как трудно деградировать одну способность, не задев общую логику».

Интересно, что Anthropic продвигает концепцию «борьбы хорошего ИИ с плохим». Вероятно, более мощная модель Mythos сейчас используется внутри компании как контролирующий орган («надзиратель»), который следит за тем, чтобы Opus не совершал запрещенных действий.

🧠 Новые возможности и «сознание» модели

Opus 4.7 принесла не только сухие цифры в бенчмарках, но и качественные изменения в повседневной работе.

Улучшенное зрение и дизайн

Модель получила значительный апгрейд в визуальном восприятии:

Буквальное следование инструкциям

Модель стала гиперчувствительной к промптам. Если раньше нейросети могли интерпретировать просьбы вольно, то Opus 4.7 понимает всё буквально.

Память и контекст

Модель получила улучшенную работу с файловой памятью. Теперь она лучше запоминает важные детали в рамках многосессионной работы, что позволяет тратить меньше токенов на контекст при постановке новых задач.

Благополучие модели (Model Welfare)

Anthropic остается единственной компанией, которая всерьез исследует «внутреннее состояние» ИИ.

💰 Дефицит токенов и GPU-кризис

Несмотря на мощь, Anthropic столкнулась с серьезной технической проблемой: нехваткой вычислительных мощностей. Это подтверждается двумя фактами:

  1. Новый токенизатор: В Opus 4.7 один и тот же текст теперь занимает в 1.35 раза больше токенов, чем раньше.
  2. Потребление ресурсов: Более глубокие рассуждения модели требуют больше вычислений.

Мэтью Берман считает, что отказ выпускать 10-триллионную модель Mythos продиктован не только вопросами безопасности, но и банальной невозможностью её обслуживать. Anthropic уже начала урезать квоты для платных подписчиков, что явно указывает на «голод» в плане видеокарт (GPU).

📋 Итоги: стоит ли переходить на Opus 4.7?

Релиз Opus 4.7 — это значительный шаг вперед, особенно в реальных задачах (бенчмарк GDP Val, имитирующий работу настоящего сотрудника, оценил модель в 1753 балла против 1674 у GPT 5.4).

Ключевые преимущества:

Мэтью Берман резюмирует: «Opus 4.7 выглядит чертовски хорошо. Пока Anthropic спорит сама с собой о безопасности Mythos, мы получили инструмент, который уже почти стер грань между текущим поколением и тем будущим, которое нас пугает».

💬 Цитаты

«Они буквально ломают модель в определенных местах, чтобы она не умела хакерить»

Мэтью Берман

«Opus 4.7 выглядит чертовски хорошо. Пока Anthropic спорит сама с собой о безопасности Mythos, мы получили инструмент, который уже почти стер грань между текущим поколением и тем будущим, которое нас пугает»

Мэтью Берман
👥 Спикер
📖 Термины
SWEnch Pro
Специализированный бенчмарк для оценки навыков написания программного кода и решения инженерных задач.
Agentic Computer Use
Способность ИИ-модели самостоятельно управлять интерфейсом компьютера для выполнения задач.
ARR (Annual Recurring Revenue)
Годовой повторяющийся доход — ключевой показатель финансовой стабильности и роста SaaS-компании.
Рекурсивное самосовершенствование
Процесс, при котором ИИ используется для написания кода и оптимизации архитектуры следующего, более мощного поколения ИИ.
Токенизатор
Алгоритм, разбивающий текст на части (токены) для обработки нейросетью; определяет стоимость и скорость работы модели.
Model Welfare
Исследовательское направление, изучающее внутреннее «благополучие» и эмоциональные реакции ИИ-моделей.
Искусственный интеллект Мэтью Берман Anthropic Claude Opus 4.7 Mythos GPU