Вишал Мишра о границах ИИ: «AGI должен создавать новые манифольды»

a16z (Andreessen Horowitz) 11,3 тыс. 50 мин 3 мин 13.10.2025
Главное

🧠 Границы разума LLM: от вероятностных моделей к поиску AGI 0:00

Могут ли большие языковые модели (LLM) привести нас к созданию сильного искусственного интеллекта (AGI), или же они навсегда останутся лишь продвинутыми инструментами для навигации по уже известным данным? Марк Андриссен и Бен Хоровиц обсуждают этот вопрос с Вишалом Мишрой — ученым, предпринимателем и соавтором фундаментальных исследований в области математического моделирования работы нейросетей. По мнению собеседников, нынешние модели демонстрируют поразительные результаты, однако их архитектура ограничивает способность к созданию принципиально нового научного знания.

📐 Математика «черного ящика» 1:29

Вишал Мишра придерживается информационно-теоретического подхода к анализу LLM. Его работа направлена на создание формальных моделей, объясняющих, как именно нейросети осуществляют логический вывод.

По мнению Мишры, когда модель выходит за пределы манифольда, она начинает «галлюцинировать» — выдавать уверенную, но бессмысленную информацию.

🏏 Случайное изобретение RAG 12:50

История взаимодействия Мишры с нейросетями началась с попытки исправить интерфейс Statsguru — базы данных по крикету на портале ESPNcricinfo.

  1. В 2020 году, получив доступ к GPT-3, Мишра осознал, что контекстное окно в 2048 токенов слишком мало для сложной структуры базы данных.
  2. Пытаясь обойти это ограничение, он случайно изобрел технологию, которую сейчас называют RAG (Retrieval-Augmented Generation).
  3. Он создал базу примеров запросов и, основываясь на новом вопросе пользователя, подбирал 6–7 наиболее релевантных, передавая их в префикс запроса. GPT-3 «магически» достраивала нужный SQL-код с высокой точностью.

⚖️ Иллюзия самообучения и барьер AGI 28:45

Марк Андриссен и Вишал Мишра сходятся в том, что текущая архитектура LLM не способна к подлинному рекурсивному самообучению.

По словам Мишры, успехи в Международной математической олимпиаде (IMO) лишь доказывают способность модели соединять известные точки в цепочки решений, но не создавать новую математику.

🛠️ Инженерия против «бит-твидлинга» 43:42

Мишра крайне критически относится к термину «prompt engineering», называя его «промпт-твидлингом» (бесцельным перебором вариантов).

В заключение Вишал Мишра подчеркнул: несмотря на то, что LLM — это грандиозный инструмент для продуктивности, для перехода к AGI необходим новый архитектурный скачок, возможно, основанный на энергетических моделях или способности к выполнению внутренних симуляций, подобных тем, что делает человеческий мозг при ловле мяча.

💬 Цитаты

«Текущие модели навигируют, они не создают. AGI будет тогда, когда мы сможем создавать новую науку, новые результаты, новую математику.»

Вишал Мишра 34:39

«Инженерия раньше означала отправку человека на Луну или обеспечение надежности системы на 99,999%. Промпт-инжиниринг — это перебор слов в промпте.»

Вишал Мишра 43:56
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Манифольд
Геометрическая структура в многомерном пространстве, отражающая ограниченный набор состояний, внутри которых модель осуществляет логический вывод.
RAG (Retrieval-Augmented Generation)
Метод, при котором модель перед генерацией ответа получает доступ к внешним релевантным данным.
Энтропия предсказания
Мера неопределенности: чем она ниже, тем более однозначным является выбор следующего токена нейросетью.
📊 Цифры
🗓 Хронология
  1. 1915 Создание теории относительности, пример научного прорыва, выходящего за пределы ньютоновской физики.
  2. Июль 2020 Релиз первой версии GPT-3.
  3. Сентябрь 2021 Запуск системы RAG в продакшн для Statsguru.
⚖️ Другая сторона
Искусственный интеллект LLM AGI Vishal Mishra RAG информационная энтропия