Инцестуозная петля ИИ: почему миллиарды Anthropic достанутся Nvidia

«Ускорение ускоряется, я искренне чувствую, что не могу за этим успеть», — эта фраза звучит пугающе на фоне новости о шокирующем раунде Anthropic на 65 миллиардов долларов, приблизившем компанию к триллионной капитализации. Пока Кремниевая долина строит замкнутые инвестиционные петли, в которых гигантские бюджеты в итоге всё равно достаются Nvidia, разработчики Claude разворачивают армию из сотен автономных агентов для динамического кодинга. Попытка полностью переписать сайт за 29 минут силами нейросети доказала: индустрия меняется быстрее, чем человечество успевает адаптироваться.

🚀 Релиз Opus 4.8: Новый виток гонки вооружений и экономический триумф Anthropic 1:23

Claude Opus 4.8: «Острое суждение» и режим Fast Mode 1:23

Мэттью Берман (Matthew Berman) начинает трансляцию с обсуждения внезапного релиза новой модели от Anthropic — Claude Opus 4.8 . Ведущий отмечает, что получил уведомление от разработчиков накануне и успел лишь кратко протестировать инструмент, прежде чем выйти в эфир . Появление версии 4.8 произошло всего через шесть недель после выхода предыдущей итерации 4.7, что, по мнению Бермана, свидетельствует о невероятном ускорении темпов разработки в индустрии ИИ .

Ключевые улучшения модели Opus 4.8 включают в себя:

«Более острое суждение» (Sharper judgment): модель стала более интеллектуальной и способна достигать результата, затрачивая меньше токенов .
Честность и автономность: Anthropic заявляет о большей прозрачности модели в оценке собственного прогресса и способности работать независимо дольше, чем предшественники .
Интеграция в Claude Code: модель теперь работает как «опытный инженер», выполняя задачи в репозиториях без постоянного контроля со стороны пользователя .

Одним из самых ожидаемых обновлений стал режим Fast Mode . Мэттью Берман, называющий себя «максималистом скорости», подчеркивает важность этого нововведения . Модель в этом режиме работает примерно в 2,5 раза быстрее стандартной версии . Если обычная генерация выдает около 100 токенов в секунду, то Fast Mode разгоняется до 250, что выводит Anthropic в лидеры по производительности среди фронтирных моделей . Примечательно, что повышение интеллектуальных способностей не сопровождалось ростом стоимости — тарифы остались прежними, что фактически означает удешевление стоимости единицы «интеллекта» . Ранее в разговоре Берман вскользь упомянул новую функцию динамических рабочих процессов, которая также стала частью этого релиза .

Битва бенчмарков: SWE-bench Pro и «проверка вайбом» 11:24

Обсуждение производительности Opus 4.8 невозможно без сравнения с главным конкурентом — GPT-5.5. На бенчмарке SWE-bench Pro, который оценивает способности моделей к решению реальных задач программирования, Opus 4.8 показал результат 69,2% . Это значительный скачок на 5 процентных пунктов по сравнению с версией 4.7 всего за полтора месяца . Берман отмечает, что «ускорение ускоряется» настолько сильно, что даже профессионалам становится трудно следить за ежедневными обновлениями .

Однако ведущий призывает не доверять слепо цифрам, указывая на разрыв между техническими тестами и реальными ощущениями пользователей (vibe check) . Согласно альтернативному тесту Deep Suite, который, по мнению Бермана, точнее отражает реальный опыт, GPT-5.5 удерживает лидерство с результатом 70%, в то время как Opus 4.7 демонстрировал лишь 54% . С выходом 4.8 ситуация может измениться, но «вайб» моделей остается важным фактором выбора для разработчиков .

В других тестах Opus 4.8 также демонстрирует доминирование:

Humanity's Last Exam: в этом сложном междисциплинарном тесте модель показала рост на 3 пункта, опережая GPT-5.5 (52,2% против 41,4% без инструментов) .
Agentic Computer Use: способность модели управлять компьютером (двигать окна, нажимать кнопки) оценена в 83%, что выше, чем у конкурента от OpenAI (78%) .
GPQA (Knowledge Work): в тестах на выполнение интеллектуальных задач модель показала улучшение на 140 пунктов по шкале ELO по сравнению с предыдущей версией .

Агентное использование терминала: преимущество GPT-5.5 14:51

Несмотря на успехи Anthropic в кодинге и логике, существует область, где лидерство OpenAI остается непоколебимым. Речь идет о тесте TerminalBench 2.1, который оценивает способность модели автономно навигировать в терминале, исполнять команды и перемещаться по директориям .

В этом бенчмарке GPT-5.5 удерживает первое место с результатом 78,2% . Даже новейшая Opus 4.8 пока не смогла превзойти этот показатель . Берман предполагает, что именно эта способность к «агентной» работе в терминале создает у многих пользователей ощущение превосходства моделей OpenAI в реальных сценариях разработки . Тем не менее, сам Мэттью признается, что его личным фаворитом остается Opus из-за общего качества ответов и производительности в его специфических задачах .

Экономика Anthropic и «вертикальный» рост доходов 24:06

Релиз Opus 4.8 рассматривается Берманом не только как технологический, но и как стратегический шаг для исправления ошибок прошлого. Предыдущая версия, Opus 4.7, была встречена аудиторией прохладно: она была слишком многословной, медленной и дорогой в пересчете на одну задачу . Это привело к временному оттоку части продвинутых пользователей в сторону GPT-5.5 .

Однако, несмотря на этот «сдвиг вайба» в соцсетях, финансовые показатели Anthropic демонстрируют феноменальный рост. Ссылаясь на данные издания The Information, Берман сообщает, что выручка Anthropic сейчас растет практически вертикально . Основные факты о текущем положении компании:

Anthropic генерирует как минимум на 35% больше выручки, чем OpenAI на текущем этапе .
Ожидается, что текущий квартал станет первым прибыльным кварталом в истории компании .
Наблюдается высокая инерция корпоративного сектора: в отличие от индивидуальных пользователей, крупные компании связаны контрактами и неохотно меняют поставщика услуг .

Берман подчеркивает, что на «фронтире» (среди ранних адептов) лояльность к брендам практически отсутствует — люди мгновенно переключаются на ту модель, которая лучше справляется с их текущей задачей . Именно поэтому выпуск Opus 4.8 с повышенной скоростью и улучшенным кодингом критически важен для Anthropic, чтобы вернуть доверие тех, кто начал сомневаться в превосходстве их моделей .

🤖 Динамические рабочие процессы и мощь параллельных агентов 27:30

Новая архитектура: сотни под-агентов в параллели 27:30

Одной из самых амбициозных функций, представленных Anthropic, стали динамические рабочие процессы (dynamic workflows). Теперь они доступны в рамках исследовательского превью (research preview) в Claude Code CLI, десктопном приложении и расширении для VS Code . Мэттью Берман подчеркивает широту охвата: технология интегрирована не только в собственные продукты компании, но и в крупнейшие облачные платформы, такие как Amazon Bedrock, Google Vertex AI и Microsoft Azure Foundry . По мнению ведущего, это свидетельствует о том, что Anthropic наконец-то преодолела «вычислительный кризис» (compute crunch) . Этому способствовали не только инвестиции, но и стратегические сделки, в том числе соглашение с xAI на использование их избыточных мощностей .

Суть динамических рабочих процессов заключается в способности системы разворачивать от десятков до сотен под-агентов, работающих параллельно для решения одной сложной задачи . Это радикально меняет экономику использования ИИ. Anthropic открыто предупреждает, что такие процессы потребляют существенно больше токенов, чем обычная сессия . Мэттью Берман иронизирует, что если раньше выручка компании росла вертикально, то теперь она «станет еще более вертикальной» . Это инструмент для топ-5% пользователей, которые приносят 80% дохода: они готовы платить за колоссальную экономию времени, которую дают параллельные агенты .

Уровни усилий и режим «Ultra Code» 30:20

Для активации новых возможностей пользователю предлагается два пути. Можно либо напрямую попросить Claude создать динамический воркфлоу, либо включить специальную настройку под названием «Ultra Code» через меню настроек (Effort menu) . Этот режим устанавливает уровень усилий на «экстра-высокий», позволяя модели самостоятельно решать, когда именно стоит задействовать параллельные рабочие процессы для выполнения задачи . Мэттью Берман отмечает, что Anthropic не стала повышать цену за миллион токенов, а вместо этого предложила «15 различных способов увеличить их потребление» .

Техническая реализация опирается на сложную систему делегирования. Центральный агент планирует выполнение задачи, разбивает её на подзадачи и распределяет их между под-агентами . При этом Берман указывает на потенциальное «узкое место»: общая эффективность всё ещё зависит от интеллекта главного агента — того, насколько хорошо он умеет планировать и управлять своими помощниками . Система работает до тех пор, пока ответы не сойдутся в единое скоординированное решение, достигая результатов, которые невозможны при одном проходе модели .

Адверсарное тестирование и кейсы использования 33:12

Спектр применения динамических рабочих процессов охватывает самые трудоемкие задачи в разработке ПО:

Масштабный поиск багов по всей кодовой базе с независимой проверкой каждой находки .
Глубокая модернизация и миграция кода, включая смену фреймворков и портов языков, затрагивающих тысячи файлов .
Аудиты безопасности, где критически важна точность .

Особый восторг у Мэттью Бермана вызвала концепция «адверсарных агентов» (adversarial agents) . Когда стоимость ошибки высока, система запускает независимые попытки решения проблемы, а отдельные агенты-противники пытаются «сломать» полученный результат или опровергнуть его до того, как пользователь увидит финальный ответ . Фактически, Anthropic встроила в программную обвязку (scaffolding) те методы, которые раньше пользователи применяли вручную — например, промпты «думай шаг за шагом» или состязательные проверки .

Практические испытания: от футбола до логических ловушек 42:24

В ходе прямого эфира Мэттью Берман протестировал возможности новой модели через интерфейс Claude Code на разных уровнях сложности. Одной из задач стало создание футбольной 3D-игры на библиотеке Three.js . Несмотря на некоторые странности визуализации (пирамиды, выходящие из игроков), игра оказалась вполне функциональной и управляемой . Также модель успешно справилась с симуляцией кубика Рубика, хотя процесс генерации кода на высоком уровне усилий был «мучительно медленным» .

Однако даже продвинутые воркфлоу не спасли модель от классических логических ловушек. В тесте «Мне нужно помыть машину, мойка в 50 футах, мне идти пешком или ехать?» Claude Opus 4.8 на максимальных настройках («Max Effort») упорно советовал идти пешком . Берман подчеркнул, что это пример «зазубренного интеллекта» (jagged intelligence): модель может писать сложнейший параллельный код, но пасует перед вопросом, с которым справится восьмилетний ребенок . Ранее в разговоре он упоминал, что сторонние инструменты вроде Cursor и Windsurf уже получили доступ к этим мощностям , а в будущем ожидается анонс модели класса Mythos , что должно еще сильнее раздвинуть границы возможностей агентов.

🚀 Модели класса Mythos и новая экономика вычислений 55:36

Анонс Mythos: следующая ступень интеллекта и проект Glasswing 57:41

Одним из самых громких заявлений в эфире стало упоминание Мэттью Берманом (Matthew Berman) планов Anthropic по выпуску совершенно нового класса моделей под кодовым названием Mythos . Согласно официальному блогу компании, Mythos будет обладать уровнем интеллекта, значительно превосходящим текущий флагман Opus . Берман отмечает, что OpenAI, вероятно, уже находится в состоянии аврала, пытаясь ускорить обучение своих моделей следующего поколения, чтобы не уступить лидерство .

На данный момент Mythos находится в стадии закрытого тестирования в рамках «Проекта Glasswing» (Project Glasswing) . Ограниченное число организаций уже использует превью-версию этой модели для решения задач в сфере кибербезопасности . Мэттью Берман подчеркивает, что модели такого уровня способностей требуют внедрения более строгих мер защиты перед тем, как они станут доступны широкой публике . Тем не менее, Anthropic заявляет о быстром прогрессе в разработке этих защитных механизмов и планирует открыть доступ к Mythos для всех клиентов уже в ближайшие недели .

Экономика Claude: радикальное удешевление «быстрого режима» 55:36

Важным финансовым обновлением стало изменение стоимости работы Claude в режиме повышенной скорости. Мэттью Берман обращает внимание на то, что режим «fast mode», позволяющий модели работать в 2,5 раза быстрее обычного, стал в три раза дешевле . Ранее этот режим обходился пользователям в шесть раз дороже стандартного, теперь же наценка составляет всего 2x от базового тарифа .

Берман связывает такое резкое снижение цен с успехами Anthropic в обеспечении вычислительными мощностями. Основными факторами здесь стали:

Масштабное партнерство с XAI .
Стратегические сделки с Amazon, которые помогли устранить дефицит ресурсов .

Актуальная стоимость Opus 4.8 в стандартном режиме составляет $5 за миллион входных токенов и $25 за миллион выходных . В «быстром режиме» цена возрастает до $10 и $50 соответственно . Мэттью отмечает, что несмотря на высокую стоимость в абсолютных цифрах, возможность получить ответ в несколько раз быстрее оправдывает такие затраты для профессиональных задач . Ранее в разговоре он вскользь упоминал, что эти изменения напрямую влияют на экономическую устойчивость компании.

Практический стресс-тест: от логических ловушек до разработки игр 59:52

В ходе прямого эфира Мэттью Берман провел серию тестов, чтобы проверить, насколько Opus 4.8 в реальности превосходит предыдущие итерации. Первым испытанием стал классический «тест с автомойкой» на логику: «Мне нужно помыть машину, автомойка в 50 футах от меня. Мне стоит пойти туда пешком или поехать?» . Несмотря на то, что ранее модель проваливала этот тест при максимальном уровне «размышлений» (max thinking), в этот раз она дала верный ответ: «Ехать. Вы не можете помыть машину, которой там нет» . Модель верно рассудила, что хотя 50 футов — это расстояние, которое проще пройти пешком, цель задачи требует присутствия автомобиля в боксе .

Далее последовала проверка навыков программирования «в один промпт»:

Видеоредактор: Берман попросил создать инструмент для нарезки, рефрейминга и добавления титров к видео . Модель сгенерировала рабочий прототип на HTML/JS, который позволил загрузить видео и выполнить базовое разделение сегментов (split), хотя интерфейс и требовал доработки .
Space Invaders: Попытка создать игру «Космические захватчики» с первого раза оказалась неудачной — кнопка запуска не срабатывала . Мэттью отметил, что конкуренты (например, будущие модели OpenAI) справляются с такими задачами стабильнее .
Симулятор кубика Рубика: Модель создала впечатляющую 3D-симуляцию с возможностью перемешивания и автоматической сборки . После небольшой настройки скорости анимации кубик успешно собрался, завершив процесс виртуальным конфетти .
Сложные игры: Автор продемонстрировал игру «Steel Talent Sky Assault», созданную его коллегой с помощью Opus 4.8, отметив высокий уровень детализации и наличие работающих бонусов (power-ups) .

Берман сознательно избегал использования режима «max thinking» для этих задач, поясняя, что дополнительный уровень вычислений нужен для фронтирных математических проблем, а не для написания кода игр . В завершение блока он запустил генерацию симулятора посадки модуля «Артемида» на Луну с реалистичной физикой и ограничениями по топливу . Также Мэттью протестировал «личность» модели, задав шуточный вопрос о секрете жизни. Модель ответила с юмором, заметив, что хотя картофель недооценен, истинный смысл кроется в последовательных усилиях и заботе о близких .

🛠️ Трудности адаптации: интерфейс против терминала 1:16:41

Эксперименты с базовой логикой и кодингом «в один клик» 1:16:55

В процессе тестирования Мэттью Берман (Matthew Berman) переходит от обсуждения возможностей к практическим испытаниям, начиная с простых логических задач и заканчивая созданием игровых прототипов. В чате упоминается работа над симулятором высадки на Луну миссии «Артемида» , а сам ведущий решает проверить базовую логику модели простым вопросом о том, в названиях каких дней недели есть буква «D» . Несмотря на примитивность задачи, Мэттью Берман отмечает, что сейчас становится всё труднее находить тесты, которые могли бы наглядно продемонстрировать разницу между моделями фронтира . По его словам, все топовые нейросети стали настолько хороши, что различия часто сводятся к субъективным «вайбам» (ощущениям) во время написания кода .

Особое внимание в этой части эфира уделяется способности моделей генерировать работающие инструменты за один проход. Демонстрируется пример игры Space Invaders, созданной Claude . Несмотря на то, что базовая версия игры выглядит довольно простой , сам факт того, что модель может выдать готовый HTML-файл с работающей механикой стрельбы и движения врагов без дополнительных правок, впечатляет ведущего . Мэттью Берман призывает зрителей иметь высокие ожидания от моделей нового поколения: «Почему бы и нет? Давайте требовать от них создания целых рабочих инструментов за один раз» .

Квоты использования и визуальные эффекты «Ultra Code» 1:21:45

Интересным моментом трансляции становится изучение обновлённого пользовательского интерфейса и системы лимитов. При попытке активировать динамические рабочие процессы, о которых говорилось ранее, Мэттью Берман замечает необычные визуальные эффекты: при вводе слова «workflow» текст начинает подсвечиваться и «переливаться» . Однако выясняется, что для полноценной работы продвинутых функций недостаточно простого упоминания в чате — требуется выбор определённого уровня «усилий» (effort) модели. В веб-интерфейсе это вызывает путаницу между уровнями «High» и «Extra High» .

Параллельно Мэттью Берман проверяет состояние своей подписки и лимитов использования. К его удивлению, несмотря на интенсивное тестирование в течение стрима, он израсходовал лишь 8% от доступного объёма в 5-часовом окне и всего 2% от общего лимита, который должен обновиться на следующий день . Ведущий отмечает, что Anthropic стали гораздо лояльнее к лимитам использования . Он также упоминает наличие дорогостоящего плана за 200 долларов в месяц, где квоты недавно были удвоены . Это позволяет пользователям проводить масштабные эксперименты, не опасаясь мгновенной блокировки доступа из-за исчерпания токенов .

Практика работы с Claude Code и CLI 1:28:10

Поняв, что веб-интерфейс накладывает определённые ограничения на использование новых функций, Мэттью Берман переходит к тестированию Claude через интерфейс командной строки (CLI) . Несмотря на то, что он открыто признаёт себя сторонником графических интерфейсов , новые возможности «Ultra Code» заставляют его вернуться к терминалу. При активации режима slasheffort ultra code интерфейс терминала окрашивается в яркие радужные цвета . Этот режим, по словам ведущего, предназначен для самых сложных задач и предполагает запуск множества параллельных агентов (до сотни одновременно) для решения поставленной цели .

Процесс настройки CLI оказывается непростым: Мэттью Берману приходится заново проходить авторизацию через команду slashlogin и бороться с навигацией по папкам на рабочем столе . Он ставит модели задачу по редизайну своего сайта, сохраняя существующие брендовые цвета, и специально указывает создать отдельное рабочее дерево (work tree), так как другие агенты могут работать над той же задачей в другом месте . В этот момент ведущий выражает восторг от того, как «сгорают» его токены в режиме Ultra Code, предвкушая запуск параллельных процессов обработки .

Ближе к завершению этого сегмента стрим прерывается экстренными новостями. Мэттью Берман замечает сообщение от Джоны (Jonah) о масштабном раунде финансирования Anthropic . Он лишь вскользь упоминает невероятные цифры оценки компании в 965 миллиардов долларов и доход в 47 миллиардов , отмечая, что это событие наверняка заставило Сэма Альтмана понервничать . Однако детальный разбор этой финансовой структуры и её влияния на индустрию он оставляет для следующей части обсуждения.

💸 Инвестиции и инфраструктурный лабиринт AI-индустрии 1:42:04

Масштабный раунд финансирования Anthropic: триллионные амбиции 1:42:17

В центре внимания индустрии оказалось известие о беспрецедентном раунде финансирования компании Anthropic. Мэттью Берман (Matthew Berman) обсуждает цифры, которые еще недавно казались фантастическими: компания привлекла более 65 миллиардов долларов инвестиций . Столь масштабное вливание капитала выводит капитализацию Anthropic на уровень почти в триллион долларов, что ставит её в один ряд с крупнейшими технологическими гигантами планеты .

Такой объем средств необходим для поддержания темпов разработки моделей уровня Frontier. Мэттью Берман отмечает, что Anthropic подчеркивает свою доступность на всех трех крупнейших облачных платформах мира: Amazon Web Services (AWS), Google Cloud и Microsoft Azure . При этом AWS остается их основным облачным провайдером и партнером по обучению моделей . Интересным нюансом в структуре сделок является упоминание компании SpaceX, которая привлекается для обеспечения доступа к вычислительным мощностям GPU классов 1 и 2 .

Параллельно с обсуждением этих астрономических сумм, Мэттью продолжает испытывать возможности системы в реальном времени, упоминая, что ранее в разговоре уже затрагивались вопросы производительности и новых бенчмарков . Однако даже на фоне технических тестов финансовый аспект остается доминирующим, поскольку он определяет, кто выживет в «гонке вооружений» искусственного интеллекта.

«Инцестуозная» экосистема AI: кто на самом деле получает деньги 1:42:04

Анализируя структуру текущих инвестиций, Мэттью Берман (Matthew Berman) дает жесткую оценку состоянию дел в индустрии, называя её структуру «инцестуозной» . Компании в этой сфере переплетены сложнейшей паутиной взаимного владения, долгов и обязательств . Ситуация выглядит следующим образом: технологические гиганты инвестируют миллиарды в стартапы, которые затем тратят эти же деньги на аренду облачных мощностей у тех же самых инвесторов .

Ключевые тезисы этого анализа:

Индустрия представляет собой «безумную паутину» собственности и долговых обязательств .
В конечном итоге, главным бенефициаром всех этих денежных потоков становится Nvidia .
Почти все привлеченные 65 миллиардов долларов фактически перекочевывают в карманы производителей чипов для обеспечения вычислительных мощностей .

Мэттью подчеркивает, что этот круговорот капитала создает иллюзию роста для всех участников, но в реальности он лишь маскирует глубокую зависимость от аппаратного обеспечения . Несмотря на то, что Anthropic старается диверсифицировать свои партнерства, зависимость от GPU остается критическим узким местом . В процессе тестирования динамических рабочих процессов Мэттью вскользь замечает, что эффективность использования токенов и квот значительно улучшилась , что может быть связано с ослаблением дефицита вычислительных ресурсов, о котором говорилось ранее.

Инфраструктурная зависимость и реальные расходы 1:43:11

За огромными цифрами инвестиций стоят реальные операционные расходы. Мэттью Берман (Matthew Berman) делится личным опытом, отмечая, что работа с моделями такого уровня обходится чрезвычайно дорого даже для продвинутых пользователей . Он упоминает, что платит Anthropic 200 долларов в месяц за профессиональный план из своего кармана, и компания не предоставляет ему бесплатных токенов для тестов .

Эта деталь подчеркивает экономическую модель Anthropic: даже при наличии миллиардных инвестиций, стоимость генерации и обучения остается высокой. Мэттью обращает внимание на то, что деньги инвесторов идут не только на R&D, но и на физическую инфраструктуру, доступ к которой часто ограничен . Использование SpaceX как партнера по GPU-мощностям — яркий пример того, на какие нестандартные шаги идут компании, чтобы обойти дефицит чипов .

В то время как Мэттью демонстрирует работу многоагентных систем, сжигающих сотни тысяч токенов за считанные минуты , становится очевидным, почему Anthropic требуется 65 миллиардов долларов. Каждый цикл «понимания», «концептуализации» и «судейства», выполняемый параллельными агентами , требует колоссальных вычислительных затрат. В одном из тестов система потребила более 240 000 токенов только на начальных этапах анализа структуры и дизайна проекта .

Пока ведущий продолжает технические тесты — от симуляции посадки модуля «Артемида» до попыток заставить ИИ придумать рекламный переход для спонсора — финансовый контекст напоминает, что за каждым успешным «рассуждением» модели стоит гигантская машина капитализма и инфраструктура, полностью зависящая от поставок Nvidia .

⌨️ Железо, лимиты и практика: редизайн сайта силами Opus 4.8 2:07:00

В процессе тестирования новых возможностей Claude Opus 4.8 Мэттью Берман (Matthew Berman) не только проверяет код, но и делится деталями своего рабочего окружения, а также демонстрирует, как ИИ справляется с комплексными задачами в реальном времени. Этот сегмент эфира посвящен практическому применению модели для обновления собственного проекта Мэттью и оценке того, насколько «прожорливыми» оказываются современные агентные системы.

Личный арсенал: Мэттью Берман о клавиатурах для продуктивности 2:09:12

Во время ожидания завершения итераций кода Мэттью подробно остановился на инструментах, которые обеспечивают его ежедневную работу. Несмотря на отсутствие прямой рекламы, он выделил клавиатуру NuPhy Air75 как своего фаворита . По словам ведущего, он приобрел три разные модели около месяца назад для сравнения и NuPhy выделилась за счет широких возможностей кастомизации и отличного качества сборки .

Мэттью отметил специфический приятный звук нажатия («thickiness/clickiness») и форм-фактор низкопрофильной механики . В процессе поиска идеального устройства он также протестировал:

Lofree Flow 2: модель с премиальным качеством сборки и лучшим звуком, но с неудачными прозрачными кейкапами и бесполезным сенсорным слайдбаром на боковой панели .
Keychron K1 и K2: эти устройства понравились ему меньше всего из-за субъективных ощущений от использования .

Выбор NuPhy Air75 стоимостью около 125 долларов Мэттью объясняет балансом между эстетикой и функциональностью, что критично при длительной работе с текстом и кодом .

Потребление ресурсов: сколько «ест» Opus 4.8 в режиме агентов 2:19:26

Одним из самых интригующих моментов тестирования стала проверка квот на использование модели. Ранее в разговоре Мэттью упоминал высокую стоимость и сложность инфраструктуры Anthropic, но реальные цифры расхода токенов во время работы агентной системы оказались неожиданными.

Для выполнения редизайна сайта было запущено в общей сложности 18 агентов, работавших параллельно . Весь процесс занял почти 29 минут и потребовал передачи сотен тысяч токенов только на этапе переписывания кода . Мэттью предложил зрителям угадать, какой процент пятичасового лимита сообщений он израсходовал. Прогнозы в чате варьировались от 30% до 80% .

Результат удивил даже самого ведущего: Opus 4.8 использовал всего 15% от текущего лимита в пятичасовом окне . Более того, общая статистика использования за всю неделю составила лишь 3% . Это демонстрирует высокую эффективность новой модели и оптимизацию работы с контекстом, что делает масштабные агентные задачи более доступными, чем предполагалось ранее .

От кода к визуалу: итоги эксперимента с Forward Future 2:15:20

Основной задачей этого фрагмента стал полный редизайн домашней страницы личного проекта Мэттью — forwardfuture.ai. Процесс включал в себя верификацию бренда, проверку типов и функциональное тестирование, для чего ИИ задействовал цикличные рабочие процессы (о них подробнее рассказывалось в главе 2) .

Когда работа была завершена, результат вызвал неоднозначную реакцию. Модель внесла следующие изменения:

Смена названия: Проект был самовольно переименован в «Forward Future Dispatch» .
Эстетика «iOS Glass»: ИИ повсеместно применил радикально закругленные углы для всех элементов интерфейса .
Анимация и отступы: Появились новые эффекты при наведении (ховеры) в виде фиолетовых линий, которые Мэттью счел слишком навязчивыми .
Компоновка: В макете образовалось избыточное пустое пространство, а видео-блок съехал на отдельную строку, нарушив визуальную иерархию .

Мэттью иронично заметил, что спустя 30 минут работы и сотни тысяч токенов, основным достижением ИИ стало простое закругление углов, при этом многие важные страницы, такие как раздел «Guides», остались нетронутыми . В ходе голосования среди зрителей (196 голосов) старый, более строгий и «квадратный» дизайн победил новую версию .

Контентная стратегия Forward Future AI 2:15:33

Помимо технических тестов, Мэттью акцентировал внимание на развитии содержательной части своего ресурса. Он объявил об инвестициях в оригинальный контент: аналитические статьи, эссе и глубокие исследования ИИ-индустрии . Одним из примеров такого подхода стал материал от Дэйва Шапиро (Dave Shapiro), приглашенного эксперта и друга канала, который написал провокационную статью о том, почему интересы Anthropic могут не совпадать с интересами пользователей .

Мэттью подчеркнул, что цель forwardfuture.ai — стать полноценным образовательным хабом, где публикуются подробные руководства по работе с моделями Claude и ChatGPT . Таким образом, даже если ИИ пока допускает ошибки в дизайне фронтенда, он остается мощным инструментом для структурирования и анализа информации, на которой строится новая медиа-платформа .

🔚 Завершение марафона: итоги голосования и будущее проекта 2:32:15

Финальный этап трансляции Мэттью Бермана (Matthew Berman), посвященной масштабным обновлениям в экосистеме Anthropic, превратился в подведение итогов не только технологических новостей, но и взаимодействия с сообществом. После многочасового разбора технических характеристик и живого тестирования моделей, ведущий обратился к результатам интерактива, который наглядно продемонстрировал вовлеченность его аудитории в процесс развития канала и сопутствующих ИИ-инструментов .

Визуальный стиль: мнение аудитории разделилось 2:32:33

Одним из ключевых моментов финала стало подведение итогов голосования за новый дизайн проекта. Результаты оказались на удивление плотными, что подчеркивает консерватизм части аудитории и готовность другой части к переменам в интерфейсе ИИ-сервисов . Согласно финальным цифрам, 52% голосов были отданы в пользу старого варианта оформления, в то время как 48% зрителей поддержали переход на новый дизайн .

Мэттью охарактеризовал такой исход как «очень интересный», отметив минимальный разрыв между предпочтениями . Подобная статистика важна для понимания того, как пользователи воспринимают инструменты, через которые они взаимодействуют с моделями вроде Claude. Несмотря на то, что ранее в эфире основной упор делался на производительность и функционал Opus 4.8, эстетическая и интерфейсная составляющая остаются важными факторами для сообщества . Ведущий поблагодарил участников за активность, отметив, что такие данные помогают лучше настраивать пользовательский опыт в будущих итерациях платформы .

Рекордная трансляция и сила сообщества 2:33:16

Завершая эфир, Мэттью Берман официально зафиксировал новый рекорд для своего канала: этот стрим стал самым продолжительным в его истории, продлившись более 154 минут . По словам автора, такая длительность не была запланированной, а стала прямым следствием беспрецедентной активности зрителей в чате .

Взаимодействие с аудиторией в режиме реального времени позволило не просто зачитывать новости, а проводить глубокие тесты. Мэттью отдельно выделил несколько аспектов поддержки:

Оперативные предложения: Зрители присылали идеи для промптов, которые тут же проверялись на новых моделях .
Финансовая поддержка: Ведущий выразил благодарность за «суперчаты» (Super Chats), которые помогают поддерживать независимые исследования и тестирование дорогостоящих API .
Атмосфера: «Вы, ребята, просто потрясающие», — резюмировал Берман, подчеркивая, что именно обратная связь в чате сделала этот марафон увлекательным для него самого .

Мэттью даже предложил напоследок просто «вместе полистать Twitter», чтобы убедиться, не появилось ли новых экстренных новостей за время трансляции, прежде чем окончательно попрощаться с аудиторией .

Экосистема Forward Future и оперативный контент 2:33:50

Финальным аккордом стало упоминание ресурса Forward Future (forwardfuture.ai), который служит центральным хабом для всех наработок Бермана . Мэттью призвал зрителей следить за обновлениями на сайте, где аккумулируются результаты тестов и аналитические отчеты по новым моделям Anthropic и другим ИИ-системам .

Несмотря на завершение прямого эфира, работа над материалом не остановилась. Берман сообщил, что команда приступает к монтажу записанного материала «прямо сейчас», чтобы выпустить сокращенную и структурированную версию видео уже сегодня . Это подчеркивает невероятную скорость современного цикла производства ИИ-контента: от появления новости до глубокого анализа и публикации готового видео проходит всего несколько часов . «Рад был всех видеть, до скорого!» — этими словами Мэттью закрыл трансляцию, оставив сообщество в ожидании новых практических руководств по работе с Claude и моделями класса Mythos .