Логан Килпатрик о стратегии OpenAI: от GPT Store до будущего AGI

Будущее OpenAI: Логан Килпатрик о новой эре агентов и развитии платформы 1:31

Развитие экосистемы OpenAI вступило в новую фазу после недавнего DevDay, где компания представила масштабный набор инструментов, включая GPT Store и обновленные API. В интервью для подкаста The Cognitive Revolution ведущий Нейтан Ленц обсудил с руководителем отдела по связям с разработчиками Логаном Килпатриком (Logan Kilpatrick) стратегию компании, роль агентов и то, как продукты OpenAI соотносятся с глобальной миссией создания AGI.

🚀 Философия продукта и миссия AGI 7:35

OpenAI не стремится просто создать «лучшую чат-платформу» или «лучший API». По словам Килпатрика, данные продукты — это механизмы, позволяющие приблизить человечество к AGI, приносящему пользу обществу.

Стратегия итераций: Компания придерживается философии поэтапного выпуска технологий. Согласно мнению Килпатрика, если бы OpenAI скрывала свои разработки до момента создания совершенного AGI, это вызвало бы разрушительный шок для общества.
Адаптация: Продукты типа ChatGPT и новые GPT нужны для того, чтобы дать людям время адаптироваться к изменениям и, что важнее, принять участие в формировании того, как ИИ будет вести себя в будущем.

🤖 Эпоха агентов: ограничения и потенциал 11:30

Одной из главных тем обсуждения стало развитие агентов. Килпатрик подчеркнул, что современные GPT и помощники в API все еще ограничены классической моделью «запрос — ответ».

Отсутствие планирования: У нынешних систем отсутствует механизм самостоятельного долгосрочного планирования действий, который характерен для ранних экспериментальных агентных продуктов.
Безопасность и надежность: По мнению гостя, на текущий момент ни один продукт на рынке не достиг идеальной надежности в работе с агентами. Более того, общество и интернет пока не готовы к массовому появлению миллионов автономных агентов, выполняющих действия от имени пользователей.
Гибкость: Килпатрик отметил, что компания сознательно ограничивает автономность систем до тех пор, пока технология не станет достаточно безопасной и надежной для широкого использования.

🛠 Обновления платформы и инструменты для разработчиков 17:37

Обновления API направлены на снижение барьеров для входа и создание более мощных бизнес-инструментов.

GPT-4 Turbo: Версия «preview» предназначена для сбора обратной связи и проверки производительности перед финальным релизом, который ожидается в течение нескольких недель. Компания признала необходимость публикации более подробных бенчмарков, таких как MMLU, для объективной оценки качества моделей.
Fine-tuning: Поддержка 16k контекста в 3.5 Turbo стала самым востребованным обновлением. Килпатрик подчеркнул, что качественное обучение моделей с использованием reasoning-примеров (объяснение того, почему модель пишет текст определенным образом) дает значительный прирост производительности.
Пользовательские модели (Custom Models): Входной порог инвестиций в $2–3 млн оправдан для компаний, стремящихся создать действительно защищенный бизнес на базе моделей, обученных на уникальных массивах данных объемом в миллиарды токенов.

🧩 Мультимодальность и этика 36:37

Интеграция зрения, звука и текста превращает OpenAI в полноценную мультимодальную платформу.

Vision: Модель понимает изображения с разным уровнем детализации. Режим низкого разрешения (512x512) оптимизирован по стоимости и подходит для большинства задач, где требуется общая оценка контента.
Текст-в-речь (TTS): Килпатрик пояснил, что голоса ИИ намеренно сбалансированы: они звучат естественно, но при этом сохраняют «нечеловеческую» окраску, чтобы пользователи четко понимали, что они взаимодействуют с машиной. Компания строго придерживается политики, требующей уведомлять пользователей об использовании синтетического голоса.
Конфиденциальность: Официально подтверждено: OpenAI не использует данные, передаваемые через API, для обучения своих моделей.