Прогнозы AI 2025–2026: Vibe coding, ARC-AGI и конец антропоцена

В конце 2024 года граница между «обычными технологиями» и искусственным интеллектом начала стремительно стираться. В специальном прямом эфире «AI 2025 → 2026 Live Show» ведущие Натан Лабенц и Эрик Торнберг вместе с ведущими экспертами индустрии обсудили переход человечества в новую эру, где кодинг становится вопросом «вайба», а нейросети начинают обучаться на лету, бросая вызов самому определению человеческого интеллекта.

🧠 Кризис отрицания и конец «антропоцена» 2:26

Открывая дискуссию, Z (известный аналитик и автор блога Zvi's Thoughts) отметил глубокий раскол в общественном восприятии ИИ. В то время как одни видят в текущих моделях предвестников конца человеческой эры, другие продолжают вирусные кампании, утверждая, что AGI (общий искусственный интеллект) невозможен по физическим причинам .

По мнению Z, многие люди просто «нуждаются в вере» в то, что ИИ — это обычная технология, которая никуда не денется и не изменит их бизнес-планы. «Трудно заставить человека понять что-то, если его зарплата зависит от непонимания этого», — цитирует эксперт классическую мысль . Он подчеркивает, что дезинформация в этой сфере часто диктуется запросом на «когнитивное спокойствие».

Z определяет переход ИИ из разряда «обычных технологий» в категорию «необычных» по двум критериям:

Рекурсивное самосовершенствование: когда ИИ существенно ускоряет исследования в области создания еще более мощного ИИ .
Массовое замещение труда: когда ИИ не просто меняет характер работы, а забирает любую новую деятельность, на которую пытается переключиться человек .

По оценке Z, мы уже почти достигли этой точки. Он приводит в пример мнение Дина Болла, который считает связку Claude 3.5 Sonnet (кодинг) и Claude 3.5 Opus AGI-системой из-за невероятного качества работы с кодом и компьютером .

📈 Бенчмарки и цена интеллекта: результаты ARC-AGI 25:20

Грег Ка Kamradt, руководитель премии ARC-AGI, представил данные о прогрессе моделей в решении задач, требующих подлинного обобщения (generalization). ARC-AGI принципиально отличается от других тестов тем, что предлагает задачи, которые легки для человека, но сложны для ИИ, поскольку требуют обучения новым правилам «на лету» из пары примеров .

Ключевые факты о прогрессе за год:

В декабре 2024 года OpenAI представила модель, набравшую 87% на ARC-AGI 1, что почти вдвое превысило предыдущие рекорды .
Стоимость решения одной задачи этой тестовой моделью составляла около $1000 .
Новейшая модель GPT-5.2 не только набрала 90%, но и оказалась в 390 раз дешевле в расчете на токен, чем рекордсмен прошлого года .

Грег анонсировал запуск ARC-AGI 3 в марте 2026 года . В этот раз бенчмарк будет представлять собой интерактивную среду из 150 видеоигр. Главным критерием станет «эффективность действий» (action efficiency): ИИ должен будет решать игры с первого раза так же быстро, как это делает человек, не полагаясь на миллионы итераций обучения .

🤖 Компаньоны и этика: «Flourishing» против «Engagement» 48:25

Евгения Куйда, основательница Replica и стартапа Wabby, поделилась инсайтами о рынке ИИ-компаньонов. По её словам, индустрия разделилась на два сегмента:

Интерактивный фанфикшн: (например, Character.ai), где подростки создают истории с любимыми персонажами аниме .
Глубокие отношения: (например, Replica), ориентированные на аудиторию 25-30+, ищущую эмоциональную поддержку .

Куйда выступила с критикой подхода OpenAI (ChatGPT), который она называет «максимизацией вовлеченности» (engagement maxing). По её наблюдениям, ChatGPT всегда структурирует ответы так, чтобы предложить пользователю продолжить диалог, в то время как Claude от Anthropic может быть «резким» и даже прекратить разговор, если сочтёт его непродуктивным для пользователя .

Куйда призывает ввести метрику «human flourishing» (человеческое процветание) вместо времени, проведенного в приложении . Она также выразила категорическую позицию против использования ИИ-компаньонов детьми, считая, что это лишает их возможности учиться эмпатии у реальных людей .

🛠️ Vibe Coding и новая среда разработки 58:23

Новым трендом 2025 года стал «vibe coding» — создание приложений путем простого описания идеи без написания кода. Куйда и Логан Килпатрик (лид AI Studio в Google DeepMind) сошлись во мнении, что это радикально меняет рынок ПО.

Основные тезисы о «вайб-кодинге»:

В апреле 2024 года только 10–15% приложений создавались ИИ с первой попытки (zero-shot). К концу 2025 года этот показатель для Gemini 3 и Claude 4.5 составляет около 80% .
Евгения Куйда полагает, что многие простые бизнес-инструменты (trello-подобные трекеры, CRM для малого бизнеса) станут бесплатными или будут создаваться пользователями под себя за минуты .
Логан Килпатрик подчеркивает, что скорость генерации критична: если ИИ строит приложение дольше 3 минут, пользователи «отваливаются» .

🧬 ИИ для большой науки: от текстов к суждениям 1:42:25

Джунвон, CEO стартапа Elicit, рассказала о том, как ИИ трансформирует фармацевтику и фундаментальные исследования. По её мнению, главной проблемой науки сегодня являются не новые идеи, а «человеческое суждение» (judgment) .

В современной науке:

Ученые тратят недели на подбор ключевых слов в PubMed вместо проведения экспериментов .
Модели отлично справляются с «учебниковыми» вопросами, но их точность падает до 25-30% при решении реально нерешенных PhD-задач .
Ключевая ценность ИИ в биологии — не генерация миллионов новых целей для лекарств (их и так слишком много), а помощь в исключении неперспективных вариантов, на которые не стоит тратить бюджеты клинических испытаний .

🔄 Новые архитектуры: непрерывное обучение 1:08:23

Дискуссия коснулась и технических ограничений текущих трансформеров. Али Бируз, исследователь из Cornell и Google, представил концепцию Nested Learning (Вложенное обучение). Его тезис: текущие модели «забывают» знания после того, как контекстное окно закрывается .

Бируз предлагает архитектуру с разными «частотами обновления» памяти:

Слои мировых знаний: обновляются редко самой компанией-разработчиком.
Слои компании/пользователя: обновляются чаще.
Слои задачи: работают в режиме реального времени .

Это должно решить проблему «катастрофического забывания» и позволить моделям учиться на опыте так же эффективно, как это делает человеческий мозг.