# Профессор Йоав Шохам о будущем ИИ в бизнесе: переход от моделей к комплексным системам

Источник: https://www.youtube.com/watch?v=3sYBe7yEJ3U
Канал: Stanford Graduate School of Business
Опубликовано: 21.02.2025

---

Переход искусственного интеллекта из стадии «хайпа» в фазу реального промышленного внедрения требует радикального пересмотра подходов к архитектуре и экономике моделей. Профессор Йоав Шохам, сооснователь AI21 Labs и один из пионеров агентно-ориентированного программирования, утверждает, что эра чистых LLM (больших языковых моделей) подходит к концу, уступая место сложным «ИИ-системам». В рамках дискуссии в Stanford Graduate School of Business эксперты обсудили, почему 94% корпоративных ИИ-проектов не доходят до внедрения и как гибридные архитектуры вроде Jamba могут решить проблему стоимости и точности вычислений.

## 🎓 Путь от теории к AI21 Labs: наследие Стэнфорда
[[JUMP:02:54]]

Йоав Шохам, почетный профессор Стэнфордского университета, начал свою карьеру в академической среде, занимаясь теорией игр и агентно-ориентированным программированием еще в 1993 году [00:54]. По его признанию, изначально он испытывал определенное «презрение» к практическим делам, предпочитая чистую науку, однако дух предпринимательства Стэнфорда заставил его изменить мнение [03:23]. Шохам пришел к выводу, что после доказательства определенного количества теорем возникает «аддиктивное» желание увидеть, как твои идеи реально меняют мир [03:37].

До основания AI21 Labs Шохам участвовал в создании нескольких успешных компаний:

*   **Trading Dynamics:** Компания, занимавшаяся B2B-трейдингом в эпоху первых интернет-аукционов. Шохам увидел возможности для применения теории игр в энергетических аукционах Калифорнии и аукционах спектра частот [05:03].
*   **Mobileye:** Шохам сотрудничал с Амноном Шашуа, основателем Mobileye (известным технологиями для беспилотных авто), который позже стал сооснователем AI21 Labs [06:07].

AI21 Labs была запущена в 2017 году — в тот же год, когда вышла знаменитая статья Google о трансформерах («Attention Is All You Need») [07:13]. По словам Шохама, основной идеей было создание гибрида глубокого обучения (статистики) и символьных рассуждений, поскольку нейросети сами по себе недостаточно надежны для логических задач [06:46]. Сегодня в компании работают около 250 человек, из которых 100 — технические специалисты [07:52]. Первым крупным успехом стал сервис Wordtune, набравший 10 миллионов пользователей и приносящий более $20 млн годовой выручки (ARR) [09:13].

## 📈 Три фазы ИИ в бизнесе: почему проекты терпят неудачу
[[JUMP:09:38]]

По мнению Йоава Шохама, развитие ИИ в корпоративном секторе проходит через три ключевых этапа:

1.  **До GPT-3:** Период спорадических экспериментов. Компании были заняты переходом в облака, и ИИ не был приоритетом [10:07].
2.  **Эра тотального экспериментирования:** Текущий момент, когда каждый CEO заявляет об «AI-first» подходе. Однако статистика неутешительна: данные AWS показывают 94-процентное падение при переходе от экспериментов к массовому внедрению [10:33]. Лишь 6% проектов становятся реальными продуктами.
3.  **Массовое внедрение (Cross-over):** Фаза, в которую мир входит сейчас. Ключевыми факторами здесь станут экономическая эффективность моделей и их надежность [10:59].

Шохам подчеркивает критическую проблему: в бизнесе модель, которая работает блестяще в 95% случаев и нелепо ошибается в 5%, считается непригодной для использования [11:25]. Чтобы преодолеть этот барьер, необходимо переходить от «голых» моделей к полноценным ИИ-системам с жестким контролем [11:40].

## 🏗️ Архитектура Jamba: прорыв за пределы Трансформеров
[[JUMP:12:32]]

Почти все современные модели (GPT, Claude, Llama) построены на архитектуре Transformer. Ее слабое место — квадратичная сложность вычислений в зависимости от длины контекста (input size) [13:48]. Для коротких текстов это приемлемо, но при обработке миллионов токенов вычисления становятся непомерно дорогими.

AI21 Labs предложила альтернативу — архитектуру **Jamba**, которая сочетает в себе:

*   **Mamba (SSM):** Модели пространства состояний (State Space Models), обеспечивающие почти линейную сложность и высокую скорость [14:29].
*   **Transformer:** Классические блоки внимания для сохранения качества семантики.
*   **Mixture of Experts (MoE):** Технология, позволяющая активировать только часть параметров модели для конкретного запроса [15:22].

Характеристики моделей Jamba:

*   **Малая модель:** 52 млрд параметров (12 млрд активных). По утверждению Шохама, она способна уместиться на одной видеокарте (GPU) с 80 ГБ памяти, что является уникальным показателем для такого класса [15:47].
*   **Большая модель:** 392 млрд параметров (94 млрд активных). Она помещается в один «под» из 8 GPU [15:59].

Шохам утверждает, что такая эффективность радикально меняет юнит-экономику для предприятий, делая обработку длинных документов и сложных запросов финансово оправданной [16:12].

## 🛠️ От моделей к ИИ-системам
[[JUMP:17:08]]

Шохам считает термин «Generative AI» неудачным и предпочитает говорить об ИИ-системах [16:42]. Главная проблема LLM — попытка заставить их делать то, для чего они не предназначены, например, арифметику. Шохам иронизирует, что любой калькулятор HP 1970-х годов справится с расчетами точнее и дешевле, чем современная нейросеть [17:52].

Настоящая ИИ-система должна включать:

1.  Языковую модель (LLM).
2.  Детерминированные инструменты (калькуляторы, API-вызовы).
3.  Собственный код (custom code).
4.  Оркестратор, который управляет всем процессом [17:52].

По мнению Шохама, попытки обучить LLM действовать через циклы обратной связи (подход React) часто ведут к потере контроля [20:05]. Будущее за гибридным подходом: ИИ осуществляет «умное» планирование и выполнение сценариев, но человек сохраняет контроль и наблюдаемость за процессом [21:26]. Профессор предсказывает, что к концу 2025 года понятие «ИИ-система» станет центральным в индустрии, а Ян Лекун (глава ИИ в Meta) окажется прав в том, что о «голых» LLM перестанут говорить [21:53].

## 🤖 Агенты: хайп против реальности
[[JUMP:22:21]]

Термин «агенты» сегодня используется повсеместно, часто превращаясь в «зыбучие пески» маркетинга. Шохам критикует использование неопределенных понятий вроде AGI (общего искусственного интеллекта), считая их бессмысленными для бизнеса [23:01].

Тем не менее, в концепции агентов есть рациональное зерно, если понимать под ними системы, обладающие следующими чертами:

*   **Использование инструментов:** Выход за рамки только генерации текста [23:39].
*   **Рефлексия:** Способность системы проверять свои ошибки [23:52].
*   **Длительные процессы:** В отличие от транзакционных LLM (вопрос-ответ), агенты могут работать часами, днями или месяцами [24:05].
*   **Проактивность:** Агент сам инициирует действия, а не только реагирует на стимул [24:20].

## 💼 Рекомендации для бизнеса: «Product-Algo Fit»
[[JUMP:25:40]]

Для руководителей компаний Шохам предлагает концепцию **Product-Algo Fit** (соответствие продукта алгоритму) [28:07]. Поскольку технологии ИИ подвержены ошибкам, нужно выбирать такие задачи, где цена ошибки не критична.

Пример из практики AI21 Labs:

*   **Крупный ритейлер:** Ежедневно на сайте появляются тысячи новых товаров. Компании требовались описания [26:59].
*   **Решение:** ИИ-система генерирует описания. Даже если одно из тысячи описаний будет неточным, это не приведет к краху бизнеса [28:35]. Это идеальный пример Product-Algo Fit, позволяющий постепенно отказываться от тотальной ручной модерации [27:52].

Главный совет Шохама на 2025 год: к концу года компания должна иметь хотя бы одно реальное внедрение в эксплуатацию (deployment), а не просто отчет об эксперименте [47:17]. Если CIO не может этого добиться, его нужно заставить [47:57].

## 🌍 Глобальная конкуренция: феномен DeepSeek и геополитика
[[JUMP:42:11]]

Обсуждая недавний успех китайской модели DeepSeek (R1), Шохам призывает сохранять скепсис. Хотя DeepSeek — «легитимная» и сильная команда, их заявления о стоимости обучения в $6 млн, по мнению профессора, являются преуменьшением как минимум на один-два порядка [44:03]. Шохам утверждает, что в тестах на фактологическую точность модель Jamba показывает себя лучше, чем DeepSeek [45:24].

Будущее мирового рынка ИИ видится Шохаму многополярным:

*   **США:** Останутся главным центром гравитации [51:42].
*   **Китай:** Будет развиваться независимо из-за геополитических ограничений. Шохам ожидает серьезного сопротивления внедрению китайских ИИ-технологий на Западе [50:45].
*   **Европа:** Франция демонстрирует инновационность и гибкость, в то время как Германия движется медленнее [51:13].
*   **Израиль:** Продолжит играть роль значимого технологического хаба, «прыгая выше своей головы» по уровню инноваций [51:27].

В вопросе влияния ИИ на рабочие места Шохам придерживается оптимистичного взгляда: технологии исторически создают больше рабочих мест, чем уничтожают [34:58]. Хотя такие профессии, как технические корректоры (copy editors), могут исчезнуть, редакторы и журналисты станут еще важнее [35:25]. В мире, где информация находится под постоянной атакой «фейков», роль человека, способного проверить факты и убедительно их преподнести, становится критической для либеральной демократии [37:42].