# Ник Якоби из Cohere: «Через 5 лет рынок ИИ захватят малые модели, а не гиганты»

Источник: https://www.youtube.com/watch?v=BJMi_dAwE8k
Канал: Machine Learning Street Talk
Опубликовано: 20.11.2024

---

В интервью для канала Machine Learning Street Talk Ник Якоби (Nick Jakobi), руководитель отдела моделирования в компании Cohere, обсуждает фундаментальный сдвиг в индустрии ИИ в 2024 году: переход от гонки за размером моделей к приоритету эффективности и коммерческой целесообразности. Основное внимание уделяется тому, как корпоративный сектор адаптирует большие языковые модели (LLM) и почему «высокий IQ» нейросетей часто оказывается избыточным для реальных бизнес-задач.

## 🏢 Стратегия Cohere: ИИ для энтерпрайза
[[JUMP:03:58]]

Ник Якоби подчеркивает, что Cohere сознательно дистанцируется от потребительского рынка, фокусируясь исключительно на обслуживании корпоративных клиентов [03:58]. По его словам, технологическое превосходство в области общих знаний — вещь мимолётная, поэтому компания делает ставку на специфические возможности:

*   **RAG (Retrieval-Augmented Generation):** Оптимизация моделей для работы с внешними базами данных.
*   **Использование инструментов (Tool use):** Способность модели эффективно взаимодействовать с API и сторонним софтом.
*   **Мультиязычность:** Поддержка множества языков как стандарт для глобального бизнеса [03:29].

Важным дифференциатором Cohere гость называет гибкость развертывания. В то время как многие конкуренты привязаны к собственным облакам, модели Cohere доступны на всех основных платформах: AWS (через Bedrock), Google Cloud, Microsoft Azure и Oracle [04:25]. Для компаний с жесткими требованиями к безопасности предусмотрено «частное развертывание» (private deploy), когда данные не покидают периметр облака заказчика [04:40].

## 🔄 «Игра в токены» и проблема переключаемости моделей
[[JUMP:06:59]]

Ведущий поднял вопрос о так называемой «игре в токены» (token game) — ситуации, когда клиенты могут легко менять одного поставщика модели на другого. Якоби признает, что на базовом уровне замена модели может сводиться к редактированию одного YAML-файла [06:46]. Однако на практике все гораздо сложнее.

По мнению Якоби, полная независимость от модели (model agnosticism) во многом является мифом по ряду причин:

1.  **Специфический промпт-инжиниринг:** Каждая модель имеет свои «причуды». Промпт, идеально работающий с одной нейросетью, может давать сбои в другой [09:15].
2.  **Глубокая интеграция:** Если приложение использует сложные агентские воркауты (agentic workflows), простая замена базовой модели может нарушить всю логику работы [08:49].
3.  **Тонкая настройка (Fine-tuning):** Если компания обучила модель на своих специфических данных, переезд на другое решение потребует полного цикла переобучения [09:45].

Якоби утверждает, что стратегия Cohere заключается в создании «липкой» (sticky) экосистемы вокруг модели — инфраструктуры и сервисов, которые делают переход к конкуренту экономически нецелесообразным [07:53].

## 📉 Экономика ИИ: почему меньше — значит лучше
[[JUMP:15:06]]

Одной из центральных тем беседы стала деградация полезности сверхбольших моделей для бизнеса. Якоби вводит концепцию «достаточного IQ» для модели. По его мнению, индустрия достигла точки, аналогичной рынку смартфонов: «iPhone 15 уже достаточно хорош, и радикальные улучшения замедляются» [15:06].

Гость приводит в пример линейку моделей Cohere:

*   **7B модели:** Маленькие, сверхбыстрые и дешевые. Идеальны для узких задач, таких как автодополнение кода [15:20].
*   **Command R (35B):** «Золотая середина», сопоставимая по возможностям с GPT-3.5 или Claude Haiku [18:20].
*   **Command R+ (103B):** Более мощная и умная модель, но при этом более медленная и дорогая [16:00].

Якоби отмечает парадоксальную ситуацию: многие крупнейшие клиенты Cohere предпочитают Command R более мощной версии R+, потому что она справляется с их задачами, работая быстрее и дешевле [16:18]. Он прогнозирует, что через пять лет основной объем потребления и затрат в индустрии будет сосредоточен вокруг моделей среднего размера, а не гигантов вроде GPT-4 или Claude Opus [18:06].

По мнению гостя, использование сверхмощных моделей вроде GPT-4 часто ограничивается лишь генерацией синтетических данных для обучения более мелких и эффективных сетей [18:53].

## 🧪 Данные, предвзятость и синтетика
[[JUMP:21:14]]

Обсуждая обучение моделей, Якоби указывает на преимущество OpenAI, имеющей огромный поток данных от пользователей ChatGPT [22:11]. В отличие от них, Cohere работает в условиях «неприкосновенности данных»: компания не видит промпты своих корпоративных клиентов, работающих через облака AWS или Azure [23:10].

Это вынуждает Cohere:

*   Генерировать обучающие данные «с нуля» самостоятельно [23:24].
*   Использовать пары предпочтений (preference pairs) для обучения с подкреплением (RLHF).
*   Бороться с предвзятостью (bias), которая неизбежно проникает в модели на этапе пре-тренинга из открытого интернета [24:04].

## 🎓 ИИ в образовании и на рынке труда: личный взгляд
[[JUMP:26:42]]

Якоби поделился личной историей о своем среднем сыне, который испытывает трудности в школе. Это заставило его задуматься о целесообразности традиционного образования в эпоху ИИ [29:18].

Ключевые тезисы Якоби о трансформации труда:

*   **Рост производительности без роста зарплат:** Инструменты ИИ позволят каждому сотруднику делать больше, но это не обязательно приведет к увеличению их личного дохода [27:24].
*   **Кризис бизнес-школ:** На конференции профессоров ведущих бизнес-школ (Insead, LSE, UCL) основной темой была борьба со списыванием с помощью ИИ. Однако дискуссия быстро перешла к осознанию того, что через полгода ИИ станет обязательным инструментом в любой работе, и учить нужно именно его использованию [28:26].
*   **Автоматизация профессий:** Несмотря на предсказание Джеффри Хинтона о том, что через пять лет радиологи станут не нужны, их число только выросло. Однако Якоби считает, что полная автоматизация в таких сферах, как анализ рентгеновских снимков, неизбежна в долгосрочной перспективе [30:59].

## 🛡️ Безопасность и угроза дезинформации
[[JUMP:31:12]]

В вопросах безопасности Якоби и ведущий затронули тему «субъектности» (agency). Ведущий выразил мнение, что пока у моделей нет собственной воли и целей, они остаются лишь инструментами [32:51].

Тем не менее, Якоби видит реальную опасность в масштабировании дезинформации. Он утверждает, что главная угроза не в самом факте «фейковых новостей» (они были всегда), а в возможности создать 100 000 ботов с определенными политическими взглядами, которые будут выглядеть и общаться как реальные люди [31:55]. По его словам, если кампания по дезинформации успешна, мы даже не заметим, что она идет [32:37].

---