Глава Cohere Эйдан Гомес о развитии рассуждения в ИИ и будущем корпоративных моделей

Генеральный директор Cohere Эйдан Гомес в интервью для канала Machine Learning Street Talk (MLST) представил видение развития искусственного интеллекта, ориентированного на реальные потребности бизнеса. В центре дискуссии — отказ от гонки за «цифровыми богами» в пользу создания практичных инструментов, способных к сложному рассуждению и эффективной работе с корпоративными данными.

🚀 Философия Cohere: Ценность важнее AGI 1:39

В отличие от многих игроков в Кремниевой долине, Cohere не ставит своей целью создание общего искусственного интеллекта (AGI). По словам Эйдана Гомеса, миссия компании заключается в создании ценности для мира через предоставление предприятиям технологий, которые могут быть интегрированы в их продукты и усилить кадровый потенциал.

Основной акцент делается на преодолении «проблемы последней мили» — барьеров, мешающих внедрению больших языковых моделей (LLM) в реальный сектор:

Законодательные и регуляторные ограничения.
Требования к безопасности и конфиденциальности данных.
Недостаток опыта у команд разработчиков при работе с новыми технологиями.

Гомес считает, что индустрия должна уйти от «хрупкости» промпт-инжиниринга. По его мнению, модели должны стать достаточно умными, чтобы понимать общее намерение пользователя и надежно действовать от его имени, независимо от конкретных формулировок.

🧠 Прорыв в рассуждении и проблема галлюцинаций 17:00

Одной из самых обсуждаемых тем стала способность моделей к логическому выводу (reasoning). Гомес утверждает, что вопреки распространенному мнению, современные модели уже способны рассуждать, и это не бинарная характеристика («да» или «нет»), а континуум.

Основные тезисы Гомеса по развитию этой способности:

Рассуждение как навык: Это умение, которому модель нужно обучать, демонстрируя процесс разбиения задач на мелкие шаги.
Дефицит данных: В интернете мало примеров «внутреннего монолога» человека. Обычно мы видим только конечный результат размышлений, а не сам процесс с фиксацией ошибок и их исправлением.
Роль синтетических данных: Гомес полагает, что именно синтетически сгенерированные данные, демонстрирующие цепочки рассуждений, позволят создать датасеты объемом в триллионы токенов для обучения моделей планированию и логике.

Что касается проблемы галлюцинаций, которую раньше считали экзистенциальной угрозой для технологии, Гомес настроен оптимистично. Он утверждает, что за последний год был достигнут значительный прогресс, и в 2024–2025 годах надежность моделей существенно возрастет.

🛠 Command R и новая архитектура моделей 10:20

Эйдан признал, что в 2023 году Cohere несколько отставала от лидеров рынка, так как компания занималась внутренней реорганизацией и перестройкой технологической стратегии. Результатом этой работы стала серия моделей Command R и R+.

Ключевые особенности нового подхода:

Отказ от копирования: Cohere агрессивно исключает из обучения выходы моделей других провайдеров (например, GPT). По мнению Гомеса, это позволяет избежать «коллапса моделей», когда все ИИ начинают говорить одинаково и наследуют одни и те же ошибки.
Специализация на RAG и инструментах: Модели Command R оптимизированы для поиска по внешним источникам (Retrieval Augmented Generation) и использования сторонних API.
Сжатие против расширения: После периода создания гигантских моделей на триллионы параметров индустрия перешла к фазе сжатия их в эффективные форм-факторы для промышленного использования.

Гомес предсказывает переход к архитектуре Mixture of Experts (MoE), где отдельные компоненты будут экспертами в узких областях: коде, медицине или математике. Это позволит деплоить только нужные субкомпоненты вместо гигантских монолитных моделей.

⚖️ Политика, риски и идеологические битвы 33:36

Эйдан Гомес выступает как активный критик концепции экзистенциального риска (X-risk). По его словам, идея о том, что языковые модели захватят мир и убьют всех, на данный момент не имеет под собой оснований и является предметом академических дискуссий, а не регуляторной политики.

Позиция Гомеса по вопросам регулирования:

Против олигополий: Чрезмерное регулирование и огромные штрафы (например, в $100 млн) могут уничтожить стартапы, но будут незаметны для техгигантов, что приведет к стагнации рынка.
Приоритет реальных рисков: Вместо борьбы с «роботами-убийцами» следует сосредоточиться на проблемах дезинформации и верификации контента. Гомес считает критически важным внедрение систем подтверждения личности, чтобы отличать мнение живых граждан от активности ботов иностранных государств.
ИИ как инструмент: Спикер сравнивает ИИ с калькулятором. Хотя были опасения, что калькуляторы сделают людей глупее, на деле они просто позволили решать более сложные задачи.

Гомес также прокомментировал закрытие Института будущего человечества Ника Бострома, отметив, что хотя он не согласен со многими их идеями, дефундирование академических институтов — это всегда потеря для науки. Он охарактеризовал современные движения вокруг ИИ (EA — эффективный альтруизм и e/acc — эффективный акселерационизм) как «культоподобные» и признался, что не хочет ассоциироваться ни с одним из них.

🏢 Культура Cohere и вызовы масштабирования 54:00

Сегодня в Cohere работает около 350 человек. Гомес признался, что как начинающий основатель совершил «каждую возможную ошибку», но выжил благодаря способности быстро признавать провалы и слушать опытных наставников.

Особенности работы в глобальной компании:

Проблема удаленки: Гомес считает дистанционную работу крайне сложной и предпочитает концентрировать команды в географических хабах. Сам он переехал в Лондон, чтобы быть ближе к местной команде исследователей.
Разница культур: Офисы компании имеют разный «вайб». Лондонский офис — сплоченный и напоминает классический стартап с походами в паб. Торонто — крупнейший хаб с культурой «упорного труда до поздней ночи». Сан-Франциско Гомесу нравится меньше всего из-за его однородности и зацикленности на одной теме.

В завершение Гомес отметил, что 2024 год станет временем, когда ИИ-решения наконец выйдут из стадии «научных проектов» и начнут массово внедряться в производство, становясь фундаментальной частью повседневной работы.