«ИИ-пакет» вместо десятка подписок: спасет ли индустрию модель кабельного ТВ?

В новом выпуске подкаста The Cognitive Revolution ведущие Нейтан Лабенз и Эрик Торнберг обсуждают практические аспекты и экономику современных технологий искусственного интеллекта. В центре внимания — обновление функции тонкой настройки GPT-3.5 Turbo, дебаты вокруг ускорения разработки ИИ-систем и запуск синтетических баз данных. Кроме того, эксперты подробно разбирают концепцию потенциального «кабельного пакета» для ИИ-сервисов как решения проблемы высокой стоимости привлечения клиентов и оттока пользователей.

🛠️ Тонкая настройка GPT-3.5 Turbo и революция Chain of Thought 1:05

Разработчики получили возможность тонкой настройки модели GPT-3.5 Turbo, что существенно меняет подходы к созданию ИИ-приложений. Ранее многие команды рассматривали альтернативные варианты, такие как тонкая настройка open-source модели Llama 2 от Meta. Однако, как отмечает сооснователь видеоплатформы Waymark Нейтан Лабенз, работа с собственными моделями сопряжена с серьезными инфраструктурными проблемами (inference problems). Разработчикам приходится самостоятельно решать задачи хостинга, управления пиковыми нагрузками и автоматического масштабирования серверов.

В отличие от этого, OpenAI предлагает максимально упрощенный процесс. Продукт поддерживает как классический формат «промпт-комплишн», так и современный формат чата. Это позволяет задавать системные сообщения, распределять роли и предоставлять несколько примеров выполнения задач для обучения.

Метод синтетического обучения Chain of Thought

В процессе оптимизации видеосервиса Waymark команда столкнулась с тем, что стандартная тонкая настройка GPT-3.5 Turbo на парах «входные данные — готовый скрипт» не приносила желаемого качества. Лабенз пришел к идее обучать модель не просто на финальных результатах работы более мощной GPT-4, а на цепочке ее рассуждений (Chain of Thought).

Алгоритм создания нового синтетического датасета выглядит следующим образом:

GPT-4 получает задачу проанализировать структуру видео, профиль бизнеса и доступные изображения.
Модель сначала подробно описывает свою стратегию, проводит логический разбор и пошагово объясняет аргументацию.
На основе этих рассуждений генерируется итоговый сценарий.
Полученный массив данных (включающий весь ход мысли) загружается в GPT-3.5 Turbo для тонкой настройки.

Экономические и технические результаты оптимизации

По словам Лабенза, такой подход совершает революцию в производственных циклах разработки. Ранее промпт для GPT-4 с подробными инструкциями и примерами практически полностью заполнял контекстное окно в 8000 токенов. Это приводило к следующим издержкам:

Финансовые затраты: одна генерация обходилась в 30–35 центов.
Высокая задержка: время ожидания ответа составляло от 60 до 90 секунд.

После тонкой настройки GPT-3.5 Turbo на основе рассуждений GPT-4 необходимость в громоздких примерах отпала, а объем промпта сократился до 4000 токенов. Это обеспечило:

Снижение стоимости: финансовые затраты на генерацию упали примерно на 90%.
Снижение задержки: время обработки сократилось до 10–20 секунд.
Масштабируемость: модель становится доступной мгновенно и работает в рамках высоких лимитов OpenAI.

Для управления качеством данных и внесения оперативных исправлений в процессе обучения Лабенз использовал платформу Human Loop. Этот инструмент позволяет отслеживать каждую итерацию, вносить корректировки поверх ответов модели и сразу запускать исправленный массив в следующий цикл обучения.

📊 Взрывной рост выручки OpenAI и экономика токенов 38:08

Финансовые показатели OpenAI демонстрируют стремительное масштабирование бизнеса. По имеющимся данным, за весь 2022 год выручка компании составляла чуть более $20 млн. К осени 2023 года компания вышла на показатель годовой регулярной выручки (annual run rate) в размере $1 млрд, что эквивалентно более чем $80 млн в месяц. Таким образом, бизнес вырос в 15–20 раз всего за девять месяцев.

Лабенз приводит гипотетический расчет объема генерации, основанный на текущей розничной стоимости токенов GPT-3.5 Turbo, которая составляет $2 за 1 миллион токенов:

Ежемесячно инфраструктура OpenAI генерирует около 40 триллионов токенов.
В пересчете на все население Земли это эквивалентно генерации примерно 5000 токенов в месяц на каждого человека планеты.

Инвесторы и аналитики предполагают, что на ближайшей конференции для разработчиков OpenAI может объявить об очередном снижении цен на использование API.

🛑 Дебаты об ускорении: безопасность и регуляторные барьеры 19:31

Развитие ИИ порождает внутреннюю дискуссию в индустрии о том, какие процессы требуют ускорения, а какие — контролируемого замедления. По мнению Лабенза, необходимо форсировать внедрение прикладных программ на базе оптимизированных моделей вроде GPT-3.5. В то же время разработка базовых моделей следующего поколения, превосходящих по мощности GPT-4 (таких как GPT-5), должна подвергаться жесткому регулированию и независимому аудиту.

Ключевые риски и проблема биологической безопасности

Наиболее критической угрозой технологические компании называют риски, связанные с пандемиями и созданием биологического оружия. Исполнительный директор Anthropic в ходе слушаний в Сенате США подтвердил, что компания привлекала профессоров MIT и ведущих экспертов по биобезопасности для оценки моделей. По их заключениям, текущие версии ИИ еще не способны полностью спроектировать новый опасный патоген, но уже могут пошагово подсказать этапы его создания.

Ситуация осложняется следующими факторами:

Провал выравнивания (RLHF): обучение с подкреплением на основе отзывов людей не гарантирует защиту. Наличие «универсальных джейлбрейков» (universal jailbreak) позволяет обходить встроенные запреты систем.
Угроза открытого исходного кода: если модель класса GPT-5 с доступом к опасным биологическим данным попадет в открытый доступ, сторонние лица смогут легко удалить механизмы фильтрации отказов.

Лабенз считает, что разработчикам нужно время для создания ИИ-фильтров, способных полностью очистить обучающие выборки от потенциально опасной научной информации. Ведущие лаборатории занимают разные позиции: OpenAI и Anthropic стремятся к компромиссу с регуляторами, позиция Google DeepMind остается менее публичной, а Meta выступает в роли «дикой карты» (wild card) — по слухам, они планируют выпустить аналог GPT-4 в open-source без каких-либо жестких ограничений.

🧑‍💻 Эволюция взаимодействия: от Copilot к делегированию 26:12

Методология использования ИИ в повседневной и профессиональной деятельности сегодня разделяется на два базовых режима, к которым в ближайшее время добавится третий.

Режим соавторства (Copilot mode)

В этом формате человек остается главным действующим лицом (primary agent), а ИИ выполняет функции ассистента, берет на себя рутину и отвечает на запросы. На собственном примере Лабенз отмечает, что при написании кода он практически перестал программировать вручную. Процесс строится на передаче фрагментов кода в GPT-4 с текстовым описанием необходимых изменений. В таком режиме разработчик получает кратное увеличение скорости выполнения проектов (multiple X speedup) и минимизирует глупые синтаксические ошибки.

Режим делегирования (Delegation mode)

Главное отличие этого режима заключается в том, что уровень доверия к ИИ позволяет человеку полностью отказаться от проверки каждой отдельной операции. Пример из практики аутсорсинговой компании Athena: при получении 1000 резюме на вакансию менеджер тратит время на валидацию промпта на первых 10 анкетах, после чего ИИ автоматически отсеивает нижние 80% кандидатов. Это экономит до 90% времени.

Для классификации задач Лабенз ссылается на трехуровневую иерархию Рейчел Вудс:

Задачи, которые просто должны быть сделаны (Just needs to get done): их автоматизируют и делегируют ИИ в первую очередь.
«Достаточно хорошая» работа (Good enough): пограничные задачи, требующие стандартизированного исполнения.
Великолепная работа (Great work): инсайты, стратегия и глубинная аналитика — здесь ИИ выступает лишь как советник, а финальное суждение выносит человек.

Третьим, зарождающимся этапом станут автономные ИИ-агенты (Agents). Они должны связать функционал Copilot и прямого делегирования, выполняя сложные цепочки действий без необходимости выстраивания громоздких программных конструкций со стороны пользователя.

По мнению Лабенза, замещение реальных специалистов уже происходит. Потребители все чаще используют ChatGPT или Claude для проверки контрактов или получения первичных медицинских и юридических консультаций, полностью отказываясь от платных звонков экспертам.

📦 Концепция «ИИ-пакета»: борьба с подписной усталостью 45:22

Стремительный рост количества качественных ИИ-продуктов привел к формированию подписной усталости у пользователей. Стоимость ежемесячного использования ключевых инструментов на одного человека уже превышает разумные пределы.

Текущая структура цен на премиальные ИИ-сервисы:

ChatGPT Enterprise: $60 в месяц.
ChatGPT Plus / Retail: $20 в месяц.
Windows Copilot: $30 в месяц.
Google Duet: $30 в месяц.
Perplexity Pro: $20 в месяц.
Claude Pro: $20 в месяц.
GitHub Copilot: $10 (для физлиц) или $19 (для компаний) в месяц.
Replit Ghostwriter: $10 в месяц.

Даже при минимальном наборе инструментов базовый чек активного пользователя составляет не менее $110 в месяц.

Экономический тупик для нишевых разработчиков

Разработчики специализированных SaaS-приложений (на примере Waymark) оказались в уязвимом положении. Инструмент для создания маркетинговых видео стоит около $30 в месяц. Розничный клиент обычно заходит на платформу, чтобы сделать всего один ролик, скачивает его, после чего сразу отменяет подписку, не желая копить регулярные обязательства.

При этом затраты на обслуживание остаются высокими. Общая стоимость ИИ-запросов к сторонним API для генерации видео под одного нового бесплатного триал-пользователя составляет около 15 центов. Чтобы окупить затраты на 200 случайных посетителей, сервису необходимо привлечь хотя бы одного постоянного платящего подписчика за $30.

Модель кабельного ТВ для искусственного интеллекта

Нейтан Лабенз предлагает решение — создание единого ИИ-пакета (AI Cable Bundle) стоимостью условные $100 в месяц. В рамках этого пакета пользователь получает базовый лимитированный доступ к сотням и тысячам специализированных ИИ-приложений (генераторы изображений Midjourney, Playground AI, Lexica; голосовые движки Eleven Labs, Play HT; образовательные платформы Khan Academy).

Математическая модель распределения выручки в таком пакете:

Общая стоимость подписки — $100.
Нишевое приложение (например, Waymark) получает скромную долю в размере 1/1000 от общего пула, то есть 10 центов с одного пользователя в месяц.
При продаже пакета 1 миллиону подписчиков платформа гарантированно получает $100 000 стабильной ежемесячной выручки ($1,2 млн в год).
При росте базы до 10 миллионов подписчиков пул приложений расширяется, обеспечивая стабильный доход разработчикам «длинного хвоста».

📉 Скептицизм инвесторов и уроки Uber против Lyft 56:50

Эрик Торнберг оценивает идею создания единого ИИ-пакета со скептицизмом, опираясь на венчурный опыт и историю развития традиционного софта. В классическом бизнесе SaaS подобные мега-пакеты не прижились из-за колоссальных издержек на координацию между создателями продуктов. Каждый разработчик стремится единолично владеть клиентскими отношениями и использовать их для дальнейших перекрестных продаж (cross-sell).

Иррациональность бизнеса и венчурный фактор

Торнберг приводит в пример индустрию райдшеринга. По словам бывшего директора по развитию Uber Эмиля Майкла, он лично предпринимал попытки объединить или поглотить Lyft, поскольку обе компании сжигали миллиарды долларов венчурных инвестиций на субсидирование абсолютно идентичных поездок. Однако сделка сорвалась по иррациональным причинам: основатель Uber Трэвис Каланик требовал «уничтожить» конкурента, а руководство Lyft заявляло об органической ненависти к Uber.

По мнению Торнберга, стартапы, подпитываемые венчурными фондами, ориентированы на доминирование и захват 100% рынка. Это делает долгосрочное компромиссное сотрудничество внутри одного пакета маловероятным, даже если оно выгодно клиентам и индустрии.

Альтернативный сценарий: Альянсы платформ

Вместо единого нейтрального агрегатора ИИ-рынок, скорее всего, пойдет по пути Sling TV, где существуют изолированные пакеты каналов (Orange pack и Blue pack). В контексте ИИ это приведет к формированию двух или трех противоборствующих технологических альянсов:

Пакет OpenAI / Microsoft: экосистема приложений, жестко привязанная к моделям GPT.
Пакет Anthropic / Google: экосистема, функционирующая на моделях Claude и Gemini.

При такой структуре крупные игроки будут обязывать нишевых разработчиков использовать исключительно свои базовые модели в обмен на включение в дистрибьюторский пакет.