# Разбор отчета MIT: как статистика о крахе ИИ-пилотов ввела в заблуждение рынок

Источник: https://www.youtube.com/watch?v=D5lWbeBxzPs
Канал: 80,000 Hours
Опубликовано: 28.04.2026

---

В августе прошлого года мировые технологические медиа потрясла новость о масштабном исследовании Массачусетского технологического института (MIT), согласно которому 95% корпоративных пилотных проектов в сфере генеративного искусственного интеллекта закончились неудачей. Эта статистика спровоцировала масштабную распродажу акций на бирже Nasdaq и стала главным оружием в руках скептиков, заявлявших о сдувании ИИ-пузыря. Однако детальный критический анализ исходного отчета показывает, что ставшая вирусной цифра представляет собой результат манипуляций со статистикой, сомнительной методологии и скрытого коммерческого интереса авторов.

## 📉 Громкий заголовок против реальной математики
[[JUMP:0:00]]

Новость о тотальном крахе корпоративных ИИ-инициатив мгновенно подхватили такие авторитетные издания, как Forbes, Axios, The Hill и Harvard Business Review. Журналисты превзошли друг друга в попытках найти глубокие теоретические объяснения столь сокрушительному провалу. По мнению ведущего канала 80,000 Hours, эта история наглядно иллюстрирует, как даже подкрепленный авторитетным брендом MIT заголовок может оказаться абсолютной пустышкой.

Главная проблема заключается в том, что отчет не содержит данных о 95% провалившихся пилотов. На самом деле исследование выявило следующую структуру распределения среди опрошенных организаций:

* 60% компаний лишь изучали возможности создания кастомных ИИ-инструментов для своих задач.
* 20% организаций продвинулись дальше и действительно запустили пилотные проекты.
* 5% от общего числа участников смогли успешно развернуть разработанные инструменты в полноценное производство.

Таким образом, 80% компаний вообще никогда не запускали никаких пилотных программ по интеграции специализированного генеративного ИИ. Утверждать в данном контексте, что 95% пилотов провалились — это все равно что заявлять, будто 95% пользователей Tinder имеют неудачные браки, при условии, что 80% из них ни разу не сходили на свидание.

Более того, согласно данным самого опроса, ключевой причиной, по которой пилотные проекты не переросли в полноценное внедрение, стали вовсе не технические сбои или плохие результаты. Главным фактором оказалось стандартное, хорошо знакомое корпоративное нежелание внедрять новые инструменты. СМИ совершили грубую ошибку, вынеся неверную цифру в заголовки, однако авторы отчета и сами допустили аналогичную оплошность, упомянув в тексте к своему графику «95% уровень неудач». 

Если опереться на реальные цифры, то из тех 20% компаний, которые действительно запустили пилоты, успеха добились около 25% (то есть каждая четвертая). Для пилотных стадий технологических проектов это весьма высокий показатель, который в пять раз превышает растиражированную прессой цифру.

## 🏆 Завышенная планка успеха и «мусорные» модели прошлого
[[JUMP:2:14]]

Показатель успешности в 25% выглядит еще более впечатляющим, если учесть, насколько жесткие критерии авторы исследования установили для признания проекта успешным. Чтобы получить статус «успешного», ИИ-приложение должно было продемонстрировать «заметное и устойчивое влияние на продуктивность или финансовые результаты (прибыли и убытки) в течение всего 6 месяцев». Авторы не дали четкого определения понятиям «заметное» и «устойчивое».

Ведущий канала 80,000 Hours подчеркивает, что в сфере корпоративных технологий общепринятым фактом является то, что внедрение новых систем требует нескольких лет для отражения на конечной прибыли организации. Исходя из логики авторов исследования, неудачными признавались следующие проекты:

* Проекты, которые просто вышли на самоокупаемость (безубыточность).
* Инициативы, принесшие компании определенную пользу, но еще не успевшие заметно изменить общие графики продуктивности или прибыли.
* Проекты, которые планово должны стать прибыльными в следующем году, но не успели достичь этого в жесткий шестимесячный период.

Такой подход заставляет предположить, что исследователи изначально стремились зафиксировать отсутствие результатов. К тому же анализируемые кейсы реализовывались на базе ИИ-моделей 2024 года. По ироничному замечанию ведущего, те модели не могли сообразить, что шарик выпадет из чашки, если перевернуть её вверх дном, и представляли собой «горячий мусор» по сравнению с современными инструментами. Тот факт, что даже с такими технологиями четверть проектов принесла быструю прибыль, выглядит феноменально.

## 👥 Игнорирование массового использования ИИ сотрудниками
[[JUMP:3:33]]

Еще одна важная деталь: все упомянутые расчеты касаются исключительно сложных, кастомных ИИ-систем, которые компании разрабатывали или закупали под узкие внутренние нужды. Однако это далеко не самый популярный и эффективный метод интеграции технологий. Большинство людей используют общедоступные инструменты вроде ChatGPT, Claude или Gemini для ускорения работы или повышения ее качества.

Сам отчет указывает на то, что сотрудники более чем в 90% исследованных компаний регулярно применяют генеративный ИИ для выполнения своих рабочих задач, причем во многих случаях — по нескольку раз в день. По мнению ведущего, честный заголовок этого исследования должен был звучать так: «Четверть кастомных ИИ-приложений быстро приносят прибыль, а абсолютное большинство сотрудников регулярно или постоянно используют персональные ИИ-инструменты».

Однако авторы отчета отнеслись к этим данным скептически, указав, что подобные инструменты повышают лишь индивидуальную продуктивность, а не показатели прибылей и убытков всей организации. Ведущий оспаривает этот тезис: если каждый отдельный сотрудник становится более продуктивным, компетентный менеджмент получает прямую возможность продавать больше продуктов, нанимая меньше персонала, что неизбежно ведет к росту прибыльности. Он приводит аналогию: если дать курьеру более быстрый фургон, это увеличит лишь его личную скорость доставки, но глупо отрицать, что это повлияет на итоговую прибыль логистической компании.

## 🔬 Раздутая выборка и закрытый отчет
[[JUMP:4:50]]

Методологическая сторона исследования также вызывает серьезные вопросы. В статье журнала Fortune, давшей старт вирусному распространению новости, утверждалось, что исследование базируется на 150 интервью с топ-менеджерами и опросе 350 сотрудников. Но при изучении самого текста документа выясняется, что в реальности выборка состояла всего из 52 интервью и письменного опроса 153 человек.

Подобное завышение масштабов исследования в 2–3 раза осталось без исправлений со стороны прессы. Крошечная выборка означает огромную погрешность. Вывод о том, что лишь 5% компаний успешно внедрили кастомный ИИ, базируется как раз на выборке из 52 интервью. Это означает, что под успехом подразумевались буквально 2 или 3 реальные компании. Изменение ответов всего пары респондентов могло полностью перевернуть итоговую статистику, сделав показатель в три раза выше или ниже.

Ситуация усугублялась тем, что работа не проходила рецензирование независимыми экспертами (peer-review). Более того, в момент пика вирусной популярности статьи в Fortune сам отчет был недоступен для журналистов и общественности. Ссылка на первоисточник вела не на научную публикацию, а на обычную Google-форму. Чтобы получить PDF-файл, пользователям требовалось ввести личные данные, подробно описать сферу интересов своей организации и объяснить, как именно они планируют использовать «агентные веб-технологии» (agentic web). И эта форма активна до сих пор.

## 💼 Бренд MIT как ширма для коммерческих продаж
[[JUMP:7:01]]

Почему же сомнительное исследование смогло оказать столь мощное влияние на рынок и настроения инвесторов? Главная причина — престижный лейбл Массачусетского технологического института. Читатели автоматически представляли серьезный академический труд бизнес-школы MIT, подготовленный специалистами по социальным наукам. В действительности проект не задумывался как академический, а состав его авторов выглядит крайне специфично.

В состав исследовательской группы вошли профессор MIT, постдок (оба сейчас занимаются разработкой фреймворков для ИИ-агентов), продакт-менеджер из Microsoft, работающий над ИИ-агентами, и основатель стартапа, который также специализируется на коммерциализации агентных ИИ-систем.

Этот факт проливает свет на один из главных выводов отчета. Авторы утверждают, что текущие ИИ-инструменты не приживаются в бизнесе из-за отсутствия у них механизмов обучения, памяти и контекстной адаптации. В качестве единственного эффективного решения они называют переход на фреймворки «агентного ИИ» (agentic AI) — то есть именно на ту технологию, которую все четверо авторов сейчас активно разрабатывают и пытаются продать компаниям. В тексте отчета напрямую упоминается проект Nanda, в котором так или иначе замешаны все четыре создателя исследования, как наиболее перспективный путь решения обозначенных проблем.

По мнению ведущего, интерпретация результатов опроса в отчете выглядит натянутой, но она последовательно подводит читателя к мысли о необходимости покупки сторонних ИИ-агентных платформ (причем отчет подчеркивает, что их нужно покупать у внешних подрядчиков, а не создавать внутри компании). В итоге группа лиц опубликовала под брендом MIT материал с сомнительным анализом данных, заявив, что существующий ИИ неэффективен, а спасением является их собственный продукт. Никакого раскрытия конфликта интересов в отчете не было, за исключением стандартной приписки о том, что текст выражает личное мнение авторов, а не позицию их работодателей.

Автор канала 80,000 Hours резюмирует, что авторы исследования, скорее всего, искренне верят в пользу создаваемых ими ИИ-агентов. Однако реальная история этого отчета — это не урок о возможностях искусственного интеллекта. Это показательный пример того, как сырой документ, основанный на 52 интервью, содержащий конфликт интересов и сомнительные выводы, может получить статус истины в последней инстанции под маркой MIT, обрушить индекс Nasdaq и закрепиться в сознании десятков миллионов людей.