# Уэс Рот: «GPT-4o mini — это ключ к созданию Общества Разумов»

Источник: https://www.youtube.com/watch?v=4SrR2sXZ6hE
Канал: Wes Roth
Опубликовано: 21.07.2024

---

Релиз новой компактной модели GPT-4o mini от компании OpenAI прошел на удивление тихо. На фоне ожиданий полноценного искусственного общего интеллекта (AGI) запуск «облегченной» версии многим показался второстепенным событием. Однако Уэс Рот, автор популярного технологического канала, убежден: перед нами не просто очередной продукт, а «исследовательский артефакт», который открывает путь к созданию сложных мультиагентных систем и так называемого «Общества Разумов» (Society of Minds).

## 🧩 GPT-4o mini: зачем OpenAI выпустила «маленькую» модель
[[JUMP:0:00]]

По мнению Уэса Рота, отсутствие ажиотажа вокруг GPT-4o mini связано с завышенными ожиданиями публики, которая ждет только гигантских скачков в возможностях нейросетей [0:13]. Тем не менее, сотрудник OpenAI под ником @rowancheung отметил, что этот релиз — важная веха на пути к AGI. Основная ценность новой модели заключается в ее экстремальной дешевизне и скорости: 15 центов за миллион входных токенов и 60 центов за миллион выходных [0:53]. Глава OpenAI Сэм Альтман охарактеризовал текущий этап развития ИИ как движение к «интеллекту, слишком дешевому, чтобы его измерять» [0:53].

Рот подчеркивает, что GPT-4o mini демонстрирует результат 82% в тесте MMLU, что делает ее сопоставимой с флагманскими моделями недавнего прошлого [1:05]. Это подтверждает тренд, заметный в исследовательских работах Microsoft и Google: оптимизация алгоритмов позволяет маленьким моделям достигать производительности систем, которые в 10 раз больше их по количеству параметров [2:53].

## 🧠 Феномен «Общества Разумов» и мультиагентные дебаты
[[JUMP:3:20]]

Ключевой технический инсайт, который обсуждает Уэс Рот, заключается в том, что несколько малых моделей, работающих сообща, могут превзойти одну большую и мощную [3:32]. Исследователи из Google и китайских институтов (включая Tencent) называют этот подход «Society of Minds» (Общество Разумов) [3:32].

Основные тезисы концепции мультиагентности:

*   **Коллективное обсуждение:** когда несколько экземпляров GPT-4 «общаются» друг с другом и подвергают критике аргументы оппонентов, точность ответов в сложных категориях (биографии, шахматы, логика) существенно возрастает [3:57].
*   **Динамика математической точности:** Рот приводит графики, показывающие, что точность решения математических задач растет по мере увеличения количества «агентов-дискутантов» [4:34]. Принципиальный скачок происходит при переходе от одного агента к двум, после чего наступает эффект плато [4:47].
*   **Итеративность:** качество ответов также улучшается в зависимости от количества раундов дебатов. Три раунда считаются оптимальными для достижения максимальной точности в математике [5:14].

По словам Рота, такая стратегия позволяет экономить огромные ресурсы: система фильтрации запросов (RouteLLM) может направлять простые задачи на GPT-4o mini, а сложные — на флагманскую GPT-4o, снижая затраты на 85% при сохранении 95% качества работы [1:58].

## 🏠 Симуляция человеческого поведения: от теории к практике
[[JUMP:5:28]]

В качестве примера того, для чего нужны дешевые модели, Уэс Рот вспоминает знаменитый эксперимент Стэнфорда под названием «Generative Agents: Interactive Simulacra of Human Behavior» [5:28]. В рамках этого исследования был создан виртуальный город с 25 ИИ-агентами, каждый из которых обладал собственной «памятью», личными целями и социальными связями [5:53].

Детали процесса симуляции:

*   **Потоки памяти:** персонажи сохраняли каждое событие (от покупки зубной пасты до драмы в отношениях) и оценивали его важность [6:06].
*   **Рефлексия:** на основе накопленных воспоминаний агенты делали выводы о своей жизни и планах на будущее [6:32].
*   **Стоимость:** использование GPT-4 для такого проекта обходилось в тысячи долларов, так как каждая мысль или фраза требовала платного запроса к API [9:50].

С появлением GPT-4o mini подобные симуляции становятся доступными для индивидуальных разработчиков. Рот отмечает, что код этого проекта теперь открыт (Open Source), и его можно запустить на домашнем компьютере [10:28].

## 📱 ИИ в каждом ботинке: будущее интеграции
[[JUMP:8:46]]

Уэс Рот обращает внимание на амбиции ИИ-гигантов интегрировать интеллект в повседневные предметы [9:11]. OpenAI открыто заявляет о намерении встроить свои модели в каждое приложение и на каждый сайт. Apple, в свою очередь, работает над локальными помощниками для управления умным домом [8:03].

Прогноз Рота относительно использования малых моделей:

*   **Экономика умного дома:** управление термостатом или освещением через мощную GPT-4 обходилось бы слишком дорого в пересчете на транзакцию. GPT-4o mini делает эксплуатацию домашнего ассистента за условный «доллар в месяц» реальностью [8:46].
*   **Повсеместная цифровизация:** ИИ-агенты появятся в часах, машинах и даже в обуви [9:23]. Автор иронизирует, что грань между комфортом (когда роботы работают за нас) и кошмаром в духе сериала «Черное зеркало» крайне тонка [9:36].

В завершение Уэс Рот делится личным планом: протестировать новую компактную модель в задачах написания программного кода [11:08]. Он выражает мнение, что именно в связке (chaining) множества быстрых и дешевых моделей кроется следующий этап прогресса в области автономных агентов.