Профессор Йоав Шохам о будущем ИИ в бизнесе: переход от моделей к комплексным системам

Переход искусственного интеллекта из стадии «хайпа» в фазу реального промышленного внедрения требует радикального пересмотра подходов к архитектуре и экономике моделей. Профессор Йоав Шохам, сооснователь AI21 Labs и один из пионеров агентно-ориентированного программирования, утверждает, что эра чистых LLM (больших языковых моделей) подходит к концу, уступая место сложным «ИИ-системам». В рамках дискуссии в Stanford Graduate School of Business эксперты обсудили, почему 94% корпоративных ИИ-проектов не доходят до внедрения и как гибридные архитектуры вроде Jamba могут решить проблему стоимости и точности вычислений.

🎓 Путь от теории к AI21 Labs: наследие Стэнфорда 2:54

Йоав Шохам, почетный профессор Стэнфордского университета, начал свою карьеру в академической среде, занимаясь теорией игр и агентно-ориентированным программированием еще в 1993 году . По его признанию, изначально он испытывал определенное «презрение» к практическим делам, предпочитая чистую науку, однако дух предпринимательства Стэнфорда заставил его изменить мнение . Шохам пришел к выводу, что после доказательства определенного количества теорем возникает «аддиктивное» желание увидеть, как твои идеи реально меняют мир .

До основания AI21 Labs Шохам участвовал в создании нескольких успешных компаний:

Trading Dynamics: Компания, занимавшаяся B2B-трейдингом в эпоху первых интернет-аукционов. Шохам увидел возможности для применения теории игр в энергетических аукционах Калифорнии и аукционах спектра частот .
Mobileye: Шохам сотрудничал с Амноном Шашуа, основателем Mobileye (известным технологиями для беспилотных авто), который позже стал сооснователем AI21 Labs .

AI21 Labs была запущена в 2017 году — в тот же год, когда вышла знаменитая статья Google о трансформерах («Attention Is All You Need») . По словам Шохама, основной идеей было создание гибрида глубокого обучения (статистики) и символьных рассуждений, поскольку нейросети сами по себе недостаточно надежны для логических задач . Сегодня в компании работают около 250 человек, из которых 100 — технические специалисты . Первым крупным успехом стал сервис Wordtune, набравший 10 миллионов пользователей и приносящий более $20 млн годовой выручки (ARR) .

📈 Три фазы ИИ в бизнесе: почему проекты терпят неудачу 9:38

По мнению Йоава Шохама, развитие ИИ в корпоративном секторе проходит через три ключевых этапа:

До GPT-3: Период спорадических экспериментов. Компании были заняты переходом в облака, и ИИ не был приоритетом .
Эра тотального экспериментирования: Текущий момент, когда каждый CEO заявляет об «AI-first» подходе. Однако статистика неутешительна: данные AWS показывают 94-процентное падение при переходе от экспериментов к массовому внедрению . Лишь 6% проектов становятся реальными продуктами.
Массовое внедрение (Cross-over): Фаза, в которую мир входит сейчас. Ключевыми факторами здесь станут экономическая эффективность моделей и их надежность .

Шохам подчеркивает критическую проблему: в бизнесе модель, которая работает блестяще в 95% случаев и нелепо ошибается в 5%, считается непригодной для использования . Чтобы преодолеть этот барьер, необходимо переходить от «голых» моделей к полноценным ИИ-системам с жестким контролем .

🏗️ Архитектура Jamba: прорыв за пределы Трансформеров 12:32

Почти все современные модели (GPT, Claude, Llama) построены на архитектуре Transformer. Ее слабое место — квадратичная сложность вычислений в зависимости от длины контекста (input size) . Для коротких текстов это приемлемо, но при обработке миллионов токенов вычисления становятся непомерно дорогими.

AI21 Labs предложила альтернативу — архитектуру Jamba, которая сочетает в себе:

Mamba (SSM): Модели пространства состояний (State Space Models), обеспечивающие почти линейную сложность и высокую скорость .
Transformer: Классические блоки внимания для сохранения качества семантики.
Mixture of Experts (MoE): Технология, позволяющая активировать только часть параметров модели для конкретного запроса .

Характеристики моделей Jamba:

Малая модель: 52 млрд параметров (12 млрд активных). По утверждению Шохама, она способна уместиться на одной видеокарте (GPU) с 80 ГБ памяти, что является уникальным показателем для такого класса .
Большая модель: 392 млрд параметров (94 млрд активных). Она помещается в один «под» из 8 GPU .

Шохам утверждает, что такая эффективность радикально меняет юнит-экономику для предприятий, делая обработку длинных документов и сложных запросов финансово оправданной .

🛠️ От моделей к ИИ-системам 17:08

Шохам считает термин «Generative AI» неудачным и предпочитает говорить об ИИ-системах . Главная проблема LLM — попытка заставить их делать то, для чего они не предназначены, например, арифметику. Шохам иронизирует, что любой калькулятор HP 1970-х годов справится с расчетами точнее и дешевле, чем современная нейросеть .

Настоящая ИИ-система должна включать:

Языковую модель (LLM).
Детерминированные инструменты (калькуляторы, API-вызовы).
Собственный код (custom code).
Оркестратор, который управляет всем процессом .

По мнению Шохама, попытки обучить LLM действовать через циклы обратной связи (подход React) часто ведут к потере контроля . Будущее за гибридным подходом: ИИ осуществляет «умное» планирование и выполнение сценариев, но человек сохраняет контроль и наблюдаемость за процессом . Профессор предсказывает, что к концу 2025 года понятие «ИИ-система» станет центральным в индустрии, а Ян Лекун (глава ИИ в Meta) окажется прав в том, что о «голых» LLM перестанут говорить .

🤖 Агенты: хайп против реальности 22:21

Термин «агенты» сегодня используется повсеместно, часто превращаясь в «зыбучие пески» маркетинга. Шохам критикует использование неопределенных понятий вроде AGI (общего искусственного интеллекта), считая их бессмысленными для бизнеса .

Тем не менее, в концепции агентов есть рациональное зерно, если понимать под ними системы, обладающие следующими чертами:

Использование инструментов: Выход за рамки только генерации текста .
Рефлексия: Способность системы проверять свои ошибки .
Длительные процессы: В отличие от транзакционных LLM (вопрос-ответ), агенты могут работать часами, днями или месяцами .
Проактивность: Агент сам инициирует действия, а не только реагирует на стимул .

💼 Рекомендации для бизнеса: «Product-Algo Fit» 25:40

Для руководителей компаний Шохам предлагает концепцию Product-Algo Fit (соответствие продукта алгоритму) . Поскольку технологии ИИ подвержены ошибкам, нужно выбирать такие задачи, где цена ошибки не критична.

Пример из практики AI21 Labs:

Крупный ритейлер: Ежедневно на сайте появляются тысячи новых товаров. Компании требовались описания .
Решение: ИИ-система генерирует описания. Даже если одно из тысячи описаний будет неточным, это не приведет к краху бизнеса . Это идеальный пример Product-Algo Fit, позволяющий постепенно отказываться от тотальной ручной модерации .

Главный совет Шохама на 2025 год: к концу года компания должна иметь хотя бы одно реальное внедрение в эксплуатацию (deployment), а не просто отчет об эксперименте . Если CIO не может этого добиться, его нужно заставить .

🌍 Глобальная конкуренция: феномен DeepSeek и геополитика 42:11

Обсуждая недавний успех китайской модели DeepSeek (R1), Шохам призывает сохранять скепсис. Хотя DeepSeek — «легитимная» и сильная команда, их заявления о стоимости обучения в $6 млн, по мнению профессора, являются преуменьшением как минимум на один-два порядка . Шохам утверждает, что в тестах на фактологическую точность модель Jamba показывает себя лучше, чем DeepSeek .

Будущее мирового рынка ИИ видится Шохаму многополярным:

США: Останутся главным центром гравитации .
Китай: Будет развиваться независимо из-за геополитических ограничений. Шохам ожидает серьезного сопротивления внедрению китайских ИИ-технологий на Западе .
Европа: Франция демонстрирует инновационность и гибкость, в то время как Германия движется медленнее .
Израиль: Продолжит играть роль значимого технологического хаба, «прыгая выше своей головы» по уровню инноваций .

В вопросе влияния ИИ на рабочие места Шохам придерживается оптимистичного взгляда: технологии исторически создают больше рабочих мест, чем уничтожают . Хотя такие профессии, как технические корректоры (copy editors), могут исчезнуть, редакторы и журналисты станут еще важнее . В мире, где информация находится под постоянной атакой «фейков», роль человека, способного проверить факты и убедительно их преподнести, становится критической для либеральной демократии .