# От DeepMind до Microsoft: Мустафа Сулейман о будущем ИИ, опасности автономии и качестве данных

Источник: https://www.youtube.com/watch?v=BaNWLTWIuIU
Канал: Greylock
Опубликовано: 21.06.2024

---

Мустафа Сулейман, один из пионеров современной индустрии искусственного интеллекта, сооснователь DeepMind и Inflection AI, а ныне руководитель ИИ-направления в Microsoft, обсуждает с партнером Greylock Сетом Розенбергом эволюцию технологий от «абсурдных» идей 2010 года до современных систем. В центре внимания — переход от гонки параметров к борьбе за качество данных, определение «практического» интеллекта и будущее, где ИИ превращается из чат-бота в автономного ассистента с памятью и характером.

## 🧠 От «абсурдной» идеи к фундаменту индустрии
[[JUMP:01:20]]

В 2010 году, когда Мустафа Сулейман вместе с коллегами основал DeepMind, идея создания искусственного общего интеллекта (AGI) казалась большинству современников не просто невыполнимой, а абсурдной [01:46]. В то время академические лаборатории не были готовы к масштабным инженерным проектам, а правительства не видели в этом приоритета [02:53].

По словам Мустафы Сулеймана, его мотивация всегда была прагматичной:

*   **Решение сложных системных проблем:** Он считал, что мир стал слишком сложным для человеческого понимания — от продовольственных систем до финансов и экономики [04:09].
*   **Улучшение прогнозирования:** ИИ виделся инструментом, способным делать точные предсказания в условиях неопределенности, что помогло бы людям жить лучше и здоровее [04:37].
*   **Предпринимательство как единственный путь:** Сулейман пришел к выводу, что только формат стартапа обладает достаточной смелостью и гибкостью для реализации миссии такого масштаба [03:17].

## 📏 Как измерить интеллект: от теста Тьюринга к прибыли в $1 млн
[[JUMP:04:51]]

Определение интеллекта долгое время оставалось философским вопросом, но для DeepMind оно стало инженерной задачей. Третий сооснователь компании, Шейн Легг, определил интеллект как способность системы «демонстрировать хорошие результаты в широком спектре сред» [05:43].

Мустафа Сулейман предлагает критически пересмотреть классические метрики:

1.  **Проблема теста Тьюринга:** Современные системы уже способны вводить людей в заблуждение в ходе разговора, но это не делает их по-настоящему интеллектуальными в практическом смысле [06:22].
2.  **«Современный тест Тьюринга»:** Мустафа Сулейман утверждает, что настоящим мерилом станет способность ИИ выполнять сложные, абстрактные задачи в реальном мире [07:39].
3.  **Критерий миллиона долларов:** По прогнозу гостя, до конца текущего десятилетия появится система, способная самостоятельно придумать продукт, организовать его производство, наладить логистику, маркетинг и заработать на этом $1 млн прибыли [08:04].

Мустафа Сулейман считает, что на пути к AGI мы сначала увидим мощные специализированные системы с глубокой экспертизой (в медицине, праве, маркетинге), и только затем — универсальный интеллект, способный легко переключаться между этими ролями [08:32].

## 📉 Революция эффективности: Phi-3 и конец гонки параметров
[[JUMP:08:46]]

Долгое время считалось, что возможности модели напрямую зависят от её размера. Однако Мустафа Сулейман указывает на переломный момент: Microsoft выпустила модель Phi-3, которая при размере всего 3,8 млрд параметров приближается по качеству к GPT-4 [10:24].

Ключевые технологические тренды по мнению гостя:

*   **Уменьшение размеров:** Phi-3 в 100 раз меньше современных фронтирных моделей по затратам на инференс, что позволяет запускать её на обычном смартфоне или ноутбуке [10:36].
*   **Смена фокуса:** Количество параметров перестало быть главным прокси-показателем способностей модели. Теперь на первое место выходит качество данных [13:06].
*   **Демократизация:** Open-source модели отстают от проприетарных API всего на несколько месяцев или год, что полностью меняет ландшафт для разработчиков [11:03].

## 💎 Данные — это новая нефть (и новый барьер)
[[JUMP:11:16]]

Если раньше основным методом было обучение с подкреплением на основе отзывов людей (RLHF), то сейчас индустрия переходит к обучению на основе отзывов ИИ (RLAIF).

Мустафа Сулейман делится опытом создания модели Pi (Inflection AI) и дает советы стартапам:

*   **Собственные «учителя»:** Для Pi нанимали учителей (AI Teachers) исключительно с высшим образованием, которые проходили 20-часовое обучение и сложные тесты на логику и понимание текста [15:18].
*   **Жесткий отбор:** Даже сотрудники самой команды разработчиков не всегда могли пройти тесты, которые предлагались будущим разметчикам данных [16:22].
*   **Создание рва (moat):** Для стартапа критически важно владеть своим стеком тонкой настройки (fine-tuning) и собирать уникальные данные через интерфейс взаимодействия с пользователем [18:32].

По мнению Сулеймана, инвестировать в вычисления (compute) важно, но настоящая ценность для предпринимателя сегодня — в создании циклов сбора и фильтрации высококачественных данных [19:39].

## 🛡️ Опасность полной автономии и «узкие вены» действий
[[JUMP:20:55]]

Мустафа Сулейман вводит три понятия для оценки ИИ: IQ (интеллект), EQ (эмоциональный интеллект) и AQ (Action Quotient — коэффициент действия) [20:55]. Хотя индустрия стремится к созданию агентов, способных действовать, Сулейман предостерегает от излишнего оптимизма.

Его позиция по автономности:

1.  **Риски бесконтрольности:** Полная автономия (способность ИИ самостоятельно ставить цели, добывать ресурсы и планировать) опасна и должна регулироваться [21:47].
2.  **«Узкие вены» автономии:** Правильный подход — давать агенту ограниченные степени свободы в конкретных средах (например, вызов конкретного API для проверки реестра) [22:14].
3.  **Проблема точности:** Для простых текстов достаточно 80% точности, но для действий (бронирование ресторана, финансовые транзакции) требуется 99%+. Одна ошибка в цепочке из пяти действий делает всю систему бесполезной для потребителя [26:31].

Мустафа Сулейман полагает, что системы, способные на по-настоящему надежные последовательные действия, появятся через два года, когда вычислительные мощности для обучения вырастут еще на два порядка (уровень GPT-6) [23:20].

## 🚀 Будущее Microsoft: AI как «холст» жизни
[[JUMP:31:49]]

В Microsoft Мустафа Сулейман курирует Bing, Edge и Co-pilot. Он считает, что мы движемся к моменту, когда искусственный интеллект станет «вторым пилотом», знающим о пользователе всё [32:54].

Перспективы интерфейсов:

*   **Голос как приоритет:** В модели Pi 30% всех диалогов были голосовыми, и именно эти пользователи демонстрировали самое высокое удержание [20:43].
*   **Память и персонализация:** ИИ должен помнить контекст, прошлые разговоры и личные данные пользователя, чтобы стать его полноценным помощником [32:54].
*   **Смерть традиционных приложений:** В течение нескольких лет ИИ может поглотить привычные интерфейсы. Вместо того чтобы открывать текстовый редактор или браузер, пользователь будет просто давать команду ассистенту, который сам управляет «холстом активности» [34:14].

Мустафа Сулейман советует начинающим предпринимателям искать ниши, где «неточность является добродетелью» (например, креатив или генерация идей), и избегать областей с критически высокой ценой ошибки, пока технологии не достигнут нужного уровня прецизионности [28:27].