Ник Якоби из Cohere: «Через 5 лет рынок ИИ захватят малые модели, а не гиганты»

Machine Learning Street Talk 4,4 тыс. 33 мин 4 мин 20.11.2024
Главное

В интервью для канала Machine Learning Street Talk Ник Якоби (Nick Jakobi), руководитель отдела моделирования в компании Cohere, обсуждает фундаментальный сдвиг в индустрии ИИ в 2024 году: переход от гонки за размером моделей к приоритету эффективности и коммерческой целесообразности. Основное внимание уделяется тому, как корпоративный сектор адаптирует большие языковые модели (LLM) и почему «высокий IQ» нейросетей часто оказывается избыточным для реальных бизнес-задач.

🏢 Стратегия Cohere: ИИ для энтерпрайза 3:58

Ник Якоби подчеркивает, что Cohere сознательно дистанцируется от потребительского рынка, фокусируясь исключительно на обслуживании корпоративных клиентов . По его словам, технологическое превосходство в области общих знаний — вещь мимолётная, поэтому компания делает ставку на специфические возможности:

Важным дифференциатором Cohere гость называет гибкость развертывания. В то время как многие конкуренты привязаны к собственным облакам, модели Cohere доступны на всех основных платформах: AWS (через Bedrock), Google Cloud, Microsoft Azure и Oracle . Для компаний с жесткими требованиями к безопасности предусмотрено «частное развертывание» (private deploy), когда данные не покидают периметр облака заказчика .

🔄 «Игра в токены» и проблема переключаемости моделей 6:59

Ведущий поднял вопрос о так называемой «игре в токены» (token game) — ситуации, когда клиенты могут легко менять одного поставщика модели на другого. Якоби признает, что на базовом уровне замена модели может сводиться к редактированию одного YAML-файла . Однако на практике все гораздо сложнее.

По мнению Якоби, полная независимость от модели (model agnosticism) во многом является мифом по ряду причин:

  1. Специфический промпт-инжиниринг: Каждая модель имеет свои «причуды». Промпт, идеально работающий с одной нейросетью, может давать сбои в другой .
  2. Глубокая интеграция: Если приложение использует сложные агентские воркауты (agentic workflows), простая замена базовой модели может нарушить всю логику работы .
  3. Тонкая настройка (Fine-tuning): Если компания обучила модель на своих специфических данных, переезд на другое решение потребует полного цикла переобучения .

Якоби утверждает, что стратегия Cohere заключается в создании «липкой» (sticky) экосистемы вокруг модели — инфраструктуры и сервисов, которые делают переход к конкуренту экономически нецелесообразным .

📉 Экономика ИИ: почему меньше — значит лучше 15:06

Одной из центральных тем беседы стала деградация полезности сверхбольших моделей для бизнеса. Якоби вводит концепцию «достаточного IQ» для модели. По его мнению, индустрия достигла точки, аналогичной рынку смартфонов: «iPhone 15 уже достаточно хорош, и радикальные улучшения замедляются» .

Гость приводит в пример линейку моделей Cohere:

Якоби отмечает парадоксальную ситуацию: многие крупнейшие клиенты Cohere предпочитают Command R более мощной версии R+, потому что она справляется с их задачами, работая быстрее и дешевле . Он прогнозирует, что через пять лет основной объем потребления и затрат в индустрии будет сосредоточен вокруг моделей среднего размера, а не гигантов вроде GPT-4 или Claude Opus .

По мнению гостя, использование сверхмощных моделей вроде GPT-4 часто ограничивается лишь генерацией синтетических данных для обучения более мелких и эффективных сетей .

🧪 Данные, предвзятость и синтетика 21:14

Обсуждая обучение моделей, Якоби указывает на преимущество OpenAI, имеющей огромный поток данных от пользователей ChatGPT . В отличие от них, Cohere работает в условиях «неприкосновенности данных»: компания не видит промпты своих корпоративных клиентов, работающих через облака AWS или Azure .

Это вынуждает Cohere:

🎓 ИИ в образовании и на рынке труда: личный взгляд 26:42

Якоби поделился личной историей о своем среднем сыне, который испытывает трудности в школе. Это заставило его задуматься о целесообразности традиционного образования в эпоху ИИ .

Ключевые тезисы Якоби о трансформации труда:

🛡️ Безопасность и угроза дезинформации 31:12

В вопросах безопасности Якоби и ведущий затронули тему «субъектности» (agency). Ведущий выразил мнение, что пока у моделей нет собственной воли и целей, они остаются лишь инструментами .

Тем не менее, Якоби видит реальную опасность в масштабировании дезинформации. Он утверждает, что главная угроза не в самом факте «фейковых новостей» (они были всегда), а в возможности создать 100 000 ботов с определенными политическими взглядами, которые будут выглядеть и общаться как реальные люди . По его словам, если кампания по дезинформации успешна, мы даже не заметим, что она идет .


💬 Цитаты

«Используйте самую маленькую и дешевую модель, которая справляется с вашей задачей — вот алгоритм, по которому сегодня живет бизнес.»

Ник Якоби 17:53

«Если кампания по дезинформации успешна, она будет выглядеть так, будто ничего не происходит.»

Ник Якоби 32:37

«Вы не обязательно будете получать больше, но с помощью ИИ вы определенно сможете делать больше.»

Ник Якоби 27:24
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG (Retrieval-Augmented Generation)
Метод, при котором ИИ ищет информацию в предоставленных документах перед тем, как дать ответ.
Энтерпрайз (Enterprise)
Рынок крупных компаний и корпораций с высокими требованиями к безопасности и масштабируемости.
Токен (Token)
Единица учета текста в LLM, примерно соответствующая части слова.
Субъектность (Agency)
Способность системы самостоятельно ставить цели и действовать для их достижения.
📊 Цифры
🗓 Хронология
  1. 2023 Взрывной рост популярности ChatGPT, ставший самым быстрым принятием технологии в истории.
  2. 2024 Переход индустрии от гонки размеров моделей к гонке эффективности и снижению задержек (latency).
  3. 2029 Прогноз Якоби о доминировании моделей среднего размера (типа Command R) в общем объеме использования.
⚖️ Другая сторона
Искусственный интеллект Cohere Nick Jakobi RAG Command R LLM economics