# Питер Восс: «LLM — это статистический тупик на пути к настоящему AGI»

Источник: https://www.youtube.com/watch?v=98yA8-7QUTE
Канал: Eye on AI
Опубликовано: 01.10.2023

---

Питер Восс, ветеран исследований в области искусственного общего интеллекта (AGI) и один из авторов самого термина AGI, утверждает, что до создания полноценного цифрового разума осталось всего несколько лет. В интервью для Eye on AI он объясняет, почему доминирующие сегодня большие языковые модели (LLM) являются тупиковой ветвью на пути к истинному интеллекту, и предлагает альтернативу, основанную на когнитивных архитектурах и графах знаний.

## 🧠 Путь от ERP-систем к когнитивистике
[[JUMP:02:19]]

Питер Восс начал свою карьеру как инженер-электроник, но вскоре переключился на программное обеспечение, создав успешную ERP-систему [02:33]. Его компания выросла из гаражного стартапа до штата в 400 человек и вышла на IPO. Однако именно тогда Восс осознал фундаментальную ограниченность софта: программы не обладали здравым смыслом и выходили из строя при любой непредвиденной ошибке программиста [03:01].

После выхода из бизнеса он посвятил пять лет изучению теории познания (эпистемологии), когнитивистики и психологии развития детей [03:27]. Восс стремился понять:

*   Чем человеческий интеллект отличается от животного?
*   Как дети учатся без миллионов примеров?
*   Что именно измеряют тесты IQ?

В 2001 году он основал свою первую компанию в сфере ИИ, плодом работы которой стал проект SmartAction, внедривший «интеллектуальный мозг» в системы автоматизации телефонных звонков [04:20]. Текущая компания Восса, AIGOO.ai, представляет собой второе поколение этой технологии, нацеленное на создание AGI человеческого уровня [04:46].

## 🛠 Архитектура «чата с мозгом» против статистического ИИ
[[JUMP:05:25]]

По словам Питера Восса, ключевое различие между его подходом и современными LLM (такими как ChatGPT) заключается в использовании когнитивной архитектуры вместо статистических предсказаний [06:05].

*   **Субстрат мозга:** В основе системы лежит граф знаний, где узлы и связи кодируют отношения между концепциями, навыки и память (краткосрочную и долгосрочную) [05:38].
*   **Глубокая интеграция:** В отличие от модульных систем, где парсеры, базы данных и логические движки работают раздельно, в системе Восса все компоненты — парсинг, понимание контекста и рассуждение — глубоко интегрированы [10:57].
*   **Производительность:** Восс утверждает, что их граф знаний работает в 1000 раз быстрее (на три порядка), чем стандартные современные графовые базы данных [10:04]. Там, где обычной системе требуется 1000 секунд на обработку сложного запроса, AIGOO справляется за одну секунду [10:17].

Гость полагает, что успех статистического ИИ (Big Data и Big Compute) «высосал весь кислород» из индустрии, заставляя инвесторов и учёных игнорировать когнитивные подходы [09:12]. Однако он проводит аналогию: нейросети тоже считались нерабочими на протяжении 30 лет, пока не наступил прорыв [08:45].

## 📊 Уровни персонализации и памяти
[[JUMP:13:13]]

Система AIGOO логически разделена на три слоя, которые позволяют ей быть одновременно универсальной и глубоко личной [13:13]:

1.  **Ядро (Core Knowledge):** Базовые навыки общения, понимание грамматики и фундаментальных связей (на уровне выпускника колледжа) [13:39].
2.  **Корпоративный слой (Ontology):** Специфические знания о продуктах компании, бизнес-правила и интеграция с API [14:05].
3.  **Индивидуальный слой:** Память о конкретном пользователе, его предпочтениях, родственниках и истории покупок [14:32].

Восс подчеркивает эффективность хранения данных: пожизненная история переписки с пользователем занимает всего несколько мегабайт, в то время как LLM требуют триллионы параметров [15:57].

## 🌍 Заземление и мультимодальность: взгляд на AGI
[[JUMP:16:50]]

Обсуждая подход Яна Лекуна (архитектура JEPA), Восс соглашается с необходимостью «заземления» (grounding) интеллекта через чувства [18:35]. По его мнению, для истинного AGI необходимо:

*   Зрение для понимания 2D и 3D пространства [19:00].
*   Способность к движению и действию [19:14].
*   Обучение в реальном времени (incremental learning) [20:22].

Восс критикует метод «пакетного обучения» (bulk training), на который OpenAI и Google тратят сотни миллионов долларов [20:49]. По мнению исследователя, интеллект должен обладать способностью к «обучению с одного примера» (one-shot learning). Ребёнку достаточно один раз увидеть розового слона, чтобы узнать его в любом контексте, тогда как нейросети нужны тысячи размеченных изображений [20:34].

## 👤 Концепция «Персонального помощника в кубе»
[[JUMP:22:54]]

Питер Восс продвигает идею «personal-personal-personal assistant», где слово «персональный» имеет три значения [23:06]:

1.  **Собственность:** Пользователь владеет помощником, это не сервис мегакорпорации вроде Siri или Alexa [23:20].
2.  **Гиперперсонализация:** ИИ знает всю историю и предпочтения владельца [23:33].
3.  **Приватность:** Пользователь сам решает, какими данными делиться с банком, супругом или Amazon [23:47].

Восс видит в этом будущем не просто «цифрового двойника», а «экзокортекс» — расширение человеческого разума, которое берет на себя рутину и дает советы [24:14].

## 📉 Почему LLM — это тупик для AGI?
[[JUMP:33:13]]

Несмотря на впечатляющие успехи ChatGPT, Восс считает архитектуру трансформеров (Transformer) непригодной для создания AGI [33:51]. Его аргументы:

*   **Отсутствие обучения после тренировки:** После завершения процесса обучения модель статична. Чтобы она узнала о новом продукте или событии, нужно либо переучивать её (что стоит $100 млн), либо использовать костыли вроде RAG [34:05].
*   **Галлюцинации:** Системы генерируют контент статистически, а не рассуждают на основе знаний [33:51].
*   **Отсутствие метакогници:** LLM не знают, чего они не знают, и не могут отслеживать собственный процесс мышления [45:24].
*   **Катастрофическое забывание:** Дообучение на новых данных часто разрушает старые связи в нейросети [34:18].

Восс отмечает ироничную ситуацию: Сэм Альтман (OpenAI) и Демис Хассабис (DeepMind) сами признают, что LLM не приведут к AGI, но продолжают вливать деньги в масштабирование существующих систем из-за рыночного давления (FOMO) [33:13]. По мнению гостя, лидеры индустрии — в основном статистики и математики, которые смотрят на интеллект через призму обработки данных, а не когнитивных функций [36:03].

## 🥊 Заочный спор: Гёрцель, Легг и «оркестрация»
[[JUMP:37:08]]

Питер Восс выражает несогласие с подходами других пионеров AGI [37:08]:

*   **Бен Гёрцель:** По мнению Восса, Гёрцель сейчас фокусируется на «обществе узких ИИ» (Society of Mind), надеясь, что оркестрация множества специализированных моделей даст общий интеллект. Восс считает, что это не сработает, так как сумма узких моделей не дает способности к концептуализации [37:36].
*   **Шейн Легг (DeepMind):** Восс критикует его ставку на обучение с подкреплением (reinforcement learning). По мнению гостя, это лишь малая часть интеллекта, которая не заменяет быстрое обучение и рассуждение [38:03].

## 💰 Экономика и сроки: AGI за три года?
[[JUMP:45:51]]

Система AIGOO крайне эффективна в плане ресурсов. Один агент может работать на сервере с обычным CPU или даже на ноутбуке пятилетней давности [46:19]. Стоимость обучения новой функции или навыка исчисляется пенни, а не миллионами долларов [47:00].

На вопрос о том, когда мы увидим AGI, Восс отвечает: «Это вопрос не времени, а денег» [47:54]. По его расчетам:

*   При наличии команды в **100 человек** (сейчас в компании около 30), полноценный AGI может быть создан за **3 года** [48:07].
*   Главная проблема — «монокультура» в инвестициях. Деньги идут туда, где уже есть хайп (статистический ИИ), а не в фундаментально иные подходы [1:00:48].

В настоящее время компания Восса ориентирована на коммерческий сектор: колл-центры (где ИИ может заменить 50% персонала), университеты (в качестве ассистентов для студентов) и здравоохранение (коучи для диабетиков) [50:37].

---