«ИИ-пакет» вместо десятка подписок: спасет ли индустрию модель кабельного ТВ?

The Cognitive Revolution 972 1 ч 17 мин 8 мин 26.09.2023
Главное

В новом выпуске подкаста The Cognitive Revolution ведущие Нейтан Лабенз и Эрик Торнберг обсуждают практические аспекты и экономику современных технологий искусственного интеллекта. В центре внимания — обновление функции тонкой настройки GPT-3.5 Turbo, дебаты вокруг ускорения разработки ИИ-систем и запуск синтетических баз данных. Кроме того, эксперты подробно разбирают концепцию потенциального «кабельного пакета» для ИИ-сервисов как решения проблемы высокой стоимости привлечения клиентов и оттока пользователей.

🛠️ Тонкая настройка GPT-3.5 Turbo и революция Chain of Thought 1:05

Разработчики получили возможность тонкой настройки модели GPT-3.5 Turbo, что существенно меняет подходы к созданию ИИ-приложений. Ранее многие команды рассматривали альтернативные варианты, такие как тонкая настройка open-source модели Llama 2 от Meta. Однако, как отмечает сооснователь видеоплатформы Waymark Нейтан Лабенз, работа с собственными моделями сопряжена с серьезными инфраструктурными проблемами (inference problems). Разработчикам приходится самостоятельно решать задачи хостинга, управления пиковыми нагрузками и автоматического масштабирования серверов.

В отличие от этого, OpenAI предлагает максимально упрощенный процесс. Продукт поддерживает как классический формат «промпт-комплишн», так и современный формат чата. Это позволяет задавать системные сообщения, распределять роли и предоставлять несколько примеров выполнения задач для обучения.

Метод синтетического обучения Chain of Thought

В процессе оптимизации видеосервиса Waymark команда столкнулась с тем, что стандартная тонкая настройка GPT-3.5 Turbo на парах «входные данные — готовый скрипт» не приносила желаемого качества. Лабенз пришел к идее обучать модель не просто на финальных результатах работы более мощной GPT-4, а на цепочке ее рассуждений (Chain of Thought).

Алгоритм создания нового синтетического датасета выглядит следующим образом:

  1. GPT-4 получает задачу проанализировать структуру видео, профиль бизнеса и доступные изображения.
  2. Модель сначала подробно описывает свою стратегию, проводит логический разбор и пошагово объясняет аргументацию.
  3. На основе этих рассуждений генерируется итоговый сценарий.
  4. Полученный массив данных (включающий весь ход мысли) загружается в GPT-3.5 Turbo для тонкой настройки.

Экономические и технические результаты оптимизации

По словам Лабенза, такой подход совершает революцию в производственных циклах разработки. Ранее промпт для GPT-4 с подробными инструкциями и примерами практически полностью заполнял контекстное окно в 8000 токенов. Это приводило к следующим издержкам:

После тонкой настройки GPT-3.5 Turbo на основе рассуждений GPT-4 необходимость в громоздких примерах отпала, а объем промпта сократился до 4000 токенов. Это обеспечило:

Для управления качеством данных и внесения оперативных исправлений в процессе обучения Лабенз использовал платформу Human Loop. Этот инструмент позволяет отслеживать каждую итерацию, вносить корректировки поверх ответов модели и сразу запускать исправленный массив в следующий цикл обучения.

📊 Взрывной рост выручки OpenAI и экономика токенов 38:08

Финансовые показатели OpenAI демонстрируют стремительное масштабирование бизнеса. По имеющимся данным, за весь 2022 год выручка компании составляла чуть более $20 млн. К осени 2023 года компания вышла на показатель годовой регулярной выручки (annual run rate) в размере $1 млрд, что эквивалентно более чем $80 млн в месяц. Таким образом, бизнес вырос в 15–20 раз всего за девять месяцев.

Лабенз приводит гипотетический расчет объема генерации, основанный на текущей розничной стоимости токенов GPT-3.5 Turbo, которая составляет $2 за 1 миллион токенов:

Инвесторы и аналитики предполагают, что на ближайшей конференции для разработчиков OpenAI может объявить об очередном снижении цен на использование API.

🛑 Дебаты об ускорении: безопасность и регуляторные барьеры 19:31

Развитие ИИ порождает внутреннюю дискуссию в индустрии о том, какие процессы требуют ускорения, а какие — контролируемого замедления. По мнению Лабенза, необходимо форсировать внедрение прикладных программ на базе оптимизированных моделей вроде GPT-3.5. В то же время разработка базовых моделей следующего поколения, превосходящих по мощности GPT-4 (таких как GPT-5), должна подвергаться жесткому регулированию и независимому аудиту.

Ключевые риски и проблема биологической безопасности

Наиболее критической угрозой технологические компании называют риски, связанные с пандемиями и созданием биологического оружия. Исполнительный директор Anthropic в ходе слушаний в Сенате США подтвердил, что компания привлекала профессоров MIT и ведущих экспертов по биобезопасности для оценки моделей. По их заключениям, текущие версии ИИ еще не способны полностью спроектировать новый опасный патоген, но уже могут пошагово подсказать этапы его создания.

Ситуация осложняется следующими факторами:

Лабенз считает, что разработчикам нужно время для создания ИИ-фильтров, способных полностью очистить обучающие выборки от потенциально опасной научной информации. Ведущие лаборатории занимают разные позиции: OpenAI и Anthropic стремятся к компромиссу с регуляторами, позиция Google DeepMind остается менее публичной, а Meta выступает в роли «дикой карты» (wild card) — по слухам, они планируют выпустить аналог GPT-4 в open-source без каких-либо жестких ограничений.

🧑‍💻 Эволюция взаимодействия: от Copilot к делегированию 26:12

Методология использования ИИ в повседневной и профессиональной деятельности сегодня разделяется на два базовых режима, к которым в ближайшее время добавится третий.

Режим соавторства (Copilot mode)

В этом формате человек остается главным действующим лицом (primary agent), а ИИ выполняет функции ассистента, берет на себя рутину и отвечает на запросы. На собственном примере Лабенз отмечает, что при написании кода он практически перестал программировать вручную. Процесс строится на передаче фрагментов кода в GPT-4 с текстовым описанием необходимых изменений. В таком режиме разработчик получает кратное увеличение скорости выполнения проектов (multiple X speedup) и минимизирует глупые синтаксические ошибки.

Режим делегирования (Delegation mode)

Главное отличие этого режима заключается в том, что уровень доверия к ИИ позволяет человеку полностью отказаться от проверки каждой отдельной операции. Пример из практики аутсорсинговой компании Athena: при получении 1000 резюме на вакансию менеджер тратит время на валидацию промпта на первых 10 анкетах, после чего ИИ автоматически отсеивает нижние 80% кандидатов. Это экономит до 90% времени.

Для классификации задач Лабенз ссылается на трехуровневую иерархию Рейчел Вудс:

Третьим, зарождающимся этапом станут автономные ИИ-агенты (Agents). Они должны связать функционал Copilot и прямого делегирования, выполняя сложные цепочки действий без необходимости выстраивания громоздких программных конструкций со стороны пользователя.

По мнению Лабенза, замещение реальных специалистов уже происходит. Потребители все чаще используют ChatGPT или Claude для проверки контрактов или получения первичных медицинских и юридических консультаций, полностью отказываясь от платных звонков экспертам.

📦 Концепция «ИИ-пакета»: борьба с подписной усталостью 45:22

Стремительный рост количества качественных ИИ-продуктов привел к формированию подписной усталости у пользователей. Стоимость ежемесячного использования ключевых инструментов на одного человека уже превышает разумные пределы.

Текущая структура цен на премиальные ИИ-сервисы:

Даже при минимальном наборе инструментов базовый чек активного пользователя составляет не менее $110 в месяц.

Экономический тупик для нишевых разработчиков

Разработчики специализированных SaaS-приложений (на примере Waymark) оказались в уязвимом положении. Инструмент для создания маркетинговых видео стоит около $30 в месяц. Розничный клиент обычно заходит на платформу, чтобы сделать всего один ролик, скачивает его, после чего сразу отменяет подписку, не желая копить регулярные обязательства.

При этом затраты на обслуживание остаются высокими. Общая стоимость ИИ-запросов к сторонним API для генерации видео под одного нового бесплатного триал-пользователя составляет около 15 центов. Чтобы окупить затраты на 200 случайных посетителей, сервису необходимо привлечь хотя бы одного постоянного платящего подписчика за $30.

Модель кабельного ТВ для искусственного интеллекта

Нейтан Лабенз предлагает решение — создание единого ИИ-пакета (AI Cable Bundle) стоимостью условные $100 в месяц. В рамках этого пакета пользователь получает базовый лимитированный доступ к сотням и тысячам специализированных ИИ-приложений (генераторы изображений Midjourney, Playground AI, Lexica; голосовые движки Eleven Labs, Play HT; образовательные платформы Khan Academy).

Математическая модель распределения выручки в таком пакете:

📉 Скептицизм инвесторов и уроки Uber против Lyft 56:50

Эрик Торнберг оценивает идею создания единого ИИ-пакета со скептицизмом, опираясь на венчурный опыт и историю развития традиционного софта. В классическом бизнесе SaaS подобные мега-пакеты не прижились из-за колоссальных издержек на координацию между создателями продуктов. Каждый разработчик стремится единолично владеть клиентскими отношениями и использовать их для дальнейших перекрестных продаж (cross-sell).

Иррациональность бизнеса и венчурный фактор

Торнберг приводит в пример индустрию райдшеринга. По словам бывшего директора по развитию Uber Эмиля Майкла, он лично предпринимал попытки объединить или поглотить Lyft, поскольку обе компании сжигали миллиарды долларов венчурных инвестиций на субсидирование абсолютно идентичных поездок. Однако сделка сорвалась по иррациональным причинам: основатель Uber Трэвис Каланик требовал «уничтожить» конкурента, а руководство Lyft заявляло об органической ненависти к Uber.

По мнению Торнберга, стартапы, подпитываемые венчурными фондами, ориентированы на доминирование и захват 100% рынка. Это делает долгосрочное компромиссное сотрудничество внутри одного пакета маловероятным, даже если оно выгодно клиентам и индустрии.

Альтернативный сценарий: Альянсы платформ

Вместо единого нейтрального агрегатора ИИ-рынок, скорее всего, пойдет по пути Sling TV, где существуют изолированные пакеты каналов (Orange pack и Blue pack). В контексте ИИ это приведет к формированию двух или трех противоборствующих технологических альянсов:

При такой структуре крупные игроки будут обязывать нишевых разработчиков использовать исключительно свои базовые модели в обмен на включение в дистрибьюторский пакет.

💬 Цитаты

«Отрицать вытеснение специалистов на данном этапе — это просто прятать голову в песок.»

Нейтан Лабенз 35:22

«Бизнес в конце концов иррационален, а тот факт, что компании финансируются венчурными капиталистами с видением завоевания мира, мешает им сотрудничать с конкурентами.»

Эрик Торнберг 1:12:46
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Fine-tuning (Тонкая настройка)
Процесс дообучения готовой языковой модели на узкоспециализированном массиве данных.
Chain of Thought (Цепочка рассуждений)
Метод промптинга и обучения, при котором модель пошагово описывает логику решения перед выдачей ответа.
Inference (Инференс/Вывод)
Процесс работы обученной модели на реальных серверах при обработке пользовательских запросов.
Token (Токен)
Минимальная единица текста (слог или часть слова), которую обрабатывает и генерирует языковая модель.
Annual Run Rate
Прогноз финансового показателя (например, выручки) за целый год, рассчитанный на основе текущих краткосрочных данных.
📊 Цифры
🗓 Хронология
  1. 2022 год Общая годовая выручка OpenAI составляет немногим более $20 млн.
  2. Осень 2023 года Выручка OpenAI достигает отметки в $1 млрд в годовом исчислении (run rate).
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-3.5 Turbo Waymark The Cognitive Revolution