# Прогнозы AI 2025–2026: Vibe coding, ARC-AGI и конец антропоцена

Источник: https://www.youtube.com/watch?v=zO38OkH5ZFA
Канал: The Cognitive Revolution
Опубликовано: 18.12.2025

---

В конце 2024 года граница между «обычными технологиями» и искусственным интеллектом начала стремительно стираться. В специальном прямом эфире «AI 2025 → 2026 Live Show» ведущие Натан Лабенц и Эрик Торнберг вместе с ведущими экспертами индустрии обсудили переход человечества в новую эру, где кодинг становится вопросом «вайба», а нейросети начинают обучаться на лету, бросая вызов самому определению человеческого интеллекта.

## 🧠 Кризис отрицания и конец «антропоцена»
[[JUMP:02:26]]

Открывая дискуссию, Z (известный аналитик и автор блога *Zvi's Thoughts*) отметил глубокий раскол в общественном восприятии ИИ. В то время как одни видят в текущих моделях предвестников конца человеческой эры, другие продолжают вирусные кампании, утверждая, что AGI (общий искусственный интеллект) невозможен по физическим причинам [03:03].

По мнению Z, многие люди просто «нуждаются в вере» в то, что ИИ — это обычная технология, которая никуда не денется и не изменит их бизнес-планы. «Трудно заставить человека понять что-то, если его зарплата зависит от непонимания этого», — цитирует эксперт классическую мысль [03:42]. Он подчеркивает, что дезинформация в этой сфере часто диктуется запросом на «когнитивное спокойствие».

Z определяет переход ИИ из разряда «обычных технологий» в категорию «необычных» по двум критериям:

1.  **Рекурсивное самосовершенствование:** когда ИИ существенно ускоряет исследования в области создания еще более мощного ИИ [07:01].
2.  **Массовое замещение труда:** когда ИИ не просто меняет характер работы, а забирает любую новую деятельность, на которую пытается переключиться человек [07:13].

По оценке Z, мы уже почти достигли этой точки. Он приводит в пример мнение Дина Болла, который считает связку Claude 3.5 Sonnet (кодинг) и Claude 3.5 Opus AGI-системой из-за невероятного качества работы с кодом и компьютером [07:53].

## 📈 Бенчмарки и цена интеллекта: результаты ARC-AGI
[[JUMP:25:20]]

Грег Ка Kamradt, руководитель премии ARC-AGI, представил данные о прогрессе моделей в решении задач, требующих подлинного обобщения (generalization). ARC-AGI принципиально отличается от других тестов тем, что предлагает задачи, которые легки для человека, но сложны для ИИ, поскольку требуют обучения новым правилам «на лету» из пары примеров [26:59].

Ключевые факты о прогрессе за год:

*   В декабре 2024 года OpenAI представила модель, набравшую 87% на ARC-AGI 1, что почти вдвое превысило предыдущие рекорды [28:46].
*   Стоимость решения одной задачи этой тестовой моделью составляла около $1000 [29:39].
*   Новейшая модель GPT-5.2 не только набрала 90%, но и оказалась в **390 раз дешевле** в расчете на токен, чем рекордсмен прошлого года [30:06].

Грег анонсировал запуск **ARC-AGI 3** в марте 2026 года [39:02]. В этот раз бенчмарк будет представлять собой интерактивную среду из 150 видеоигр. Главным критерием станет «эффективность действий» (action efficiency): ИИ должен будет решать игры с первого раза так же быстро, как это делает человек, не полагаясь на миллионы итераций обучения [41:55].

## 🤖 Компаньоны и этика: «Flourishing» против «Engagement»
[[JUMP:48:25]]

Евгения Куйда, основательница Replica и стартапа Wabby, поделилась инсайтами о рынке ИИ-компаньонов. По её словам, индустрия разделилась на два сегмента:

*   **Интерактивный фанфикшн:** (например, Character.ai), где подростки создают истории с любимыми персонажами аниме [50:24].
*   **Глубокие отношения:** (например, Replica), ориентированные на аудиторию 25-30+, ищущую эмоциональную поддержку [51:07].

Куйда выступила с критикой подхода OpenAI (ChatGPT), который она называет «максимизацией вовлеченности» (engagement maxing). По её наблюдениям, ChatGPT всегда структурирует ответы так, чтобы предложить пользователю продолжить диалог, в то время как Claude от Anthropic может быть «резким» и даже прекратить разговор, если сочтёт его непродуктивным для пользователя [54:52].

Куйда призывает ввести метрику **«human flourishing»** (человеческое процветание) вместо времени, проведенного в приложении [53:19]. Она также выразила категорическую позицию против использования ИИ-компаньонов детьми, считая, что это лишает их возможности учиться эмпатии у реальных людей [1:05:36].

## 🛠️ Vibe Coding и новая среда разработки
[[JUMP:58:23]]

Новым трендом 2025 года стал **«vibe coding»** — создание приложений путем простого описания идеи без написания кода. Куйда и Логан Килпатрик (лид AI Studio в Google DeepMind) сошлись во мнении, что это радикально меняет рынок ПО.

Основные тезисы о «вайб-кодинге»:

*   В апреле 2024 года только 10–15% приложений создавались ИИ с первой попытки (zero-shot). К концу 2025 года этот показатель для Gemini 3 и Claude 4.5 составляет около 80% [1:03:39].
*   Евгения Куйда полагает, что многие простые бизнес-инструменты (trello-подобные трекеры, CRM для малого бизнеса) станут бесплатными или будут создаваться пользователями под себя за минуты [1:02:45].
*   Логан Килпатрик подчеркивает, что скорость генерации критична: если ИИ строит приложение дольше 3 минут, пользователи «отваливаются» [1:26:49].

## 🧬 ИИ для большой науки: от текстов к суждениям
[[JUMP:1:42:25]]

Джунвон, CEO стартапа Elicit, рассказала о том, как ИИ трансформирует фармацевтику и фундаментальные исследования. По её мнению, главной проблемой науки сегодня являются не новые идеи, а «человеческое суждение» (judgment) [1:49:05].

В современной науке:

*   Ученые тратят недели на подбор ключевых слов в PubMed вместо проведения экспериментов [1:43:44].
*   Модели отлично справляются с «учебниковыми» вопросами, но их точность падает до 25-30% при решении реально нерешенных PhD-задач [1:47:48].
*   Ключевая ценность ИИ в биологии — не генерация миллионов новых целей для лекарств (их и так слишком много), а помощь в **исключении** неперспективных вариантов, на которые не стоит тратить бюджеты клинических испытаний [1:54:10].

## 🔄 Новые архитектуры: непрерывное обучение
[[JUMP:1:08:23]]

Дискуссия коснулась и технических ограничений текущих трансформеров. Али Бируз, исследователь из Cornell и Google, представил концепцию **Nested Learning** (Вложенное обучение). Его тезис: текущие модели «забывают» знания после того, как контекстное окно закрывается [1:13:48].

Бируз предлагает архитектуру с разными «частотами обновления» памяти:

1.  **Слои мировых знаний:** обновляются редко самой компанией-разработчиком.
2.  **Слои компании/пользователя:** обновляются чаще.
3.  **Слои задачи:** работают в режиме реального времени [1:21:11].

Это должно решить проблему «катастрофического забывания» и позволить моделям учиться на опыте так же эффективно, как это делает человеческий мозг.