В новом выпуске подкаста 20VC Гарри Стеббингс беседует с Джоэль Пино, директором по ИИ (CAIO) компании Cohere. Джоэль, за плечами которой шесть лет руководства фундаментальными исследованиями в Meta, делится уникальным взглядом на то, почему законы масштабирования ИИ остаются незыблемыми, как эффективно строить команды из «звезд» индустрии и почему страхи перед «восстанием машин» лишены научной строгости.
🧠 Путь от фундаментальной науки к корпоративным продуктам 1:08
Джоэль Пино перешла в Cohere после работы в Meta (с 2017 по 2024 год), где она наблюдала трансформацию ИИ из академической дисциплины в доминирующую технологическую силу . По её мнению, несмотря на кажущуюся «молниеносную» скорость индустрии, многим гипотезам требуются годы, чтобы созреть и получить необходимое количество вычислительных мощностей и данных .
Сегодняшний ажиотаж вокруг ИИ-агентов Джоэль воспринимает сдержанно. Она отмечает, что:
- Идеи обучения с подкреплением (RL), которые она изучает более 20 лет, только сейчас входят в мейнстрим благодаря моделям рассуждения (reasoning models) .
- Прогресс часто идет нелинейно: алгоритмические инновации, такие как архитектура Transformer или оптимизатор Adam, создают качественные скачки, которые невозможно предсказать простым накоплением ресурсов .
- Ожидание того, что RL «из коробки» даст нам общий искусственный интеллект (AGI), по мнению Пино, преждевременно из-за крайне низкой эффективности обучения .
📉 Проблема эффективности обучения с подкреплением (RL) 3:59
Гарри Стеббингс поднимает вопрос о том, почему RL считается «ужасным» и дорогим методом. Джоэль объясняет это фундаментальной природой последовательного принятия решений:
- Накопление ошибок: Каждое неверное действие в цепочке уводит модель всё дальше от правильного пути, что требует огромного количества попыток для нахождения верного решения .
- Необходимость действий: В отличие от обучения на статических текстах, RL требует активного взаимодействия с миром. Для этого нужны симуляторы или синтетическая среда, создание которых обходится очень дорого .
Пино подчеркивает, что RL отлично работает там, где есть четкая математическая функция вознаграждения (игры, математика), но пока пасует перед социальными взаимодействиями . По её словам, научить ИИ быть «социальным существом» так же сложно, как воспитывать ребенка: невозможно прописать все нюансы математически .
🚀 Законы масштабирования и алгоритмическая магия 11:52
Вопрос о том, достаточно ли просто «заливать задачи деньгами» и вычислительными мощностями, остается одним из самых спорных. По мнению Джоэль Пино, законы масштабирования (Scaling Laws) продемонстрировали невероятную устойчивость .
Ключевые факторы прогресса в её интерпретации:
- Вычисления и данные: Имеют более линейный эффект. Больше ГПУ и данных обычно дают предсказуемо лучший результат .
- Алгоритмы: Дают нелинейный скачок. Новая идея может годами лежать в открытом доступе, пока её не применят в правильном масштабе и с нужной комбинацией гиперпараметров .
- Сложность инноваций: Алгоритмы — это самая творческая и фрустрирующая часть работы, так как исследователь никогда не знает, сработает ли идея, пока не дойдет до конца пути .
🏢 ИИ в энтерпрайзе: 10-кратный рост вместо увольнений 13:52
В Cohere Джоэль сфокусирована на внедрении ИИ в бизнес-процессы. Она считает, что реальный сигнал о полезности технологии можно получить только при продаже её компаниям, а не через академические бенчмарки .
Прогнозы Пино относительно рынка труда:
- Рост продуктивности: Она не верит в массовую замену 5% «худших» сотрудников. Вместо этого Джоэль прогнозирует, что большинство работников смогут выполнять в 10 раз больше задач с помощью ИИ .
- Реальные примеры: В переводе текстов или создании видео голливудского качества эффективность уже выросла с недель до секунд .
- Роль человека: Люди остаются критически важными для формулирования задач, проверки фактов и внесения дизайнерских правок. «Намерение» (intent) и «критика» — функции, которые ИИ пока не может забрать себе .
Одной из главных преград для бизнеса Пино называет интеграцию с существующими десятилетиями информационными системами и вопросы безопасности данных . Именно поэтому Cohere делает ставку на установку моделей на собственных серверах клиентов (on-premise) .
🛡️ Безопасность и угрозы: от галлюцинаций к «самозванству» 22:02
С переходом к ИИ-агентам ландшафт угроз меняется. Если для чат-ботов главной проблемой были галлюцинации, то для агентов основной риск — это «имперсонация» (impersonation) .
Джоэль предупреждает: агенты могут выдавать себя за сущности, которыми они не являются, чтобы проникать в банковские системы или совершать действия от лица компаний. По её мнению, это станет игрой в «кошки-мышки», требующей постоянной бдительности и разработки новых стандартов безопасности .
Пино выразила умеренный оптимизм относительно роли государства:
- Правительства хорошо справляются с установкой долгосрочных стандартов (как в авиации) .
- Однако регуляция не должна опережать технологию; сначала нужно дать пространство для творчества и извлечь уроки из реального использования .
🤝 Команда мечты: стоит ли нанимать «Галактикос»? 28:30
На вопрос Гарри о том, нужно ли тратить миллиарды на покупку «суперзвезд» (как это делают Microsoft или Google), Джоэль отвечает отрицательно. Она считает, что для успеха важен баланс талантов, а не просто ростер знаменитостей .
Идеальный состав ИИ-команды по версии Пино:
- Визионеры (1-3 человека): Задают вектор и понимают, что можно создать в пространстве бесконечных инноваций .
- Машины исполнения: Технические специалисты с жесткой дисциплиной, которым не важно, чья это идея — они просто строят и тестируют систему .
- «Социальный клей»: Люди, которые поддерживают командную динамику и понимают потребности коллег .
Джоэль убеждена: баланс между талантом и вычислительными мощностями критичен. Если нанять слишком много гениев, но не дать им ГПУ, их время будет потрачено впустую .
🧪 Синтетические данные и риск «генетического вырождения» 33:07
Поскольку простые данные (маркировка кошек и собак) уже освоены, индустрия переходит к специализированным задачам. Это делает данные дороже, так как для их подготовки нужны эксперты .
Джоэль Пино описывает проблему «коллапса распределения» при использовании синтетических данных:
- Если модели учатся только на данных друг друга без притока нового разнообразия, они начинают «вырождаться», подобно популяции на изолированном острове .
- В закрытых мирах (шахматы, го) это не проблема, так как правила стабильны .
- В программировании (кодинге) можно избежать деградации, если грамотно «инъектировать» разнообразие, смешивая репозитории и трансформируя их .
Пино предсказывает, что через 10 лет качество генерируемого кода станет безупречным, как это произошло с изображениями с 2015 года . Роль программиста трансформируется в роль «главного куратора», который выбирает лучшее из огромного объема сгенерированных вариантов .
🚫 Почему «экзистенциальный риск» — плохой термин 44:59
Джоэль Пино признается, что как ученый не обладает терпением к экстремальным сценариям в духе «ИИ станет нашим повелителем» . Она считает такие обсуждения лишенными научной строгости и напоминающими научную фантастику .
Главные тезисы Пино о будущем и обществе:
- Экзистенциальный риск: Джоэль бы запретила этот термин, так как он парализует людей страхом, а страх — плохой помощник в принятии решений .
- Дети и технологии: Пино ограничивает экранное время своих детей (телефоны только после 14-15 лет) и обсуждает с ними настройки приватности в соцсетях .
- Открытость: Она считает закрытие систем и ограничение доступа к идеям глубокой ошибкой, которая мешает инновациям .
В финале беседы Джоэль подчеркивает, что больше всего её вдохновляет потенциал ИИ в научных открытиях и медицине, а также создание максимально эффективных моделей, способных работать всего на паре ГПУ, а не на огромных кластерах .