Будущее OpenAI: Логан Килпатрик о новой эре агентов и развитии платформы 1:31
Развитие экосистемы OpenAI вступило в новую фазу после недавнего DevDay, где компания представила масштабный набор инструментов, включая GPT Store и обновленные API. В интервью для подкаста The Cognitive Revolution ведущий Нейтан Ленц обсудил с руководителем отдела по связям с разработчиками Логаном Килпатриком (Logan Kilpatrick) стратегию компании, роль агентов и то, как продукты OpenAI соотносятся с глобальной миссией создания AGI.
🚀 Философия продукта и миссия AGI 7:35
OpenAI не стремится просто создать «лучшую чат-платформу» или «лучший API». По словам Килпатрика, данные продукты — это механизмы, позволяющие приблизить человечество к AGI, приносящему пользу обществу.
- Стратегия итераций: Компания придерживается философии поэтапного выпуска технологий. Согласно мнению Килпатрика, если бы OpenAI скрывала свои разработки до момента создания совершенного AGI, это вызвало бы разрушительный шок для общества.
- Адаптация: Продукты типа ChatGPT и новые GPT нужны для того, чтобы дать людям время адаптироваться к изменениям и, что важнее, принять участие в формировании того, как ИИ будет вести себя в будущем.
🤖 Эпоха агентов: ограничения и потенциал 11:30
Одной из главных тем обсуждения стало развитие агентов. Килпатрик подчеркнул, что современные GPT и помощники в API все еще ограничены классической моделью «запрос — ответ».
- Отсутствие планирования: У нынешних систем отсутствует механизм самостоятельного долгосрочного планирования действий, который характерен для ранних экспериментальных агентных продуктов.
- Безопасность и надежность: По мнению гостя, на текущий момент ни один продукт на рынке не достиг идеальной надежности в работе с агентами. Более того, общество и интернет пока не готовы к массовому появлению миллионов автономных агентов, выполняющих действия от имени пользователей.
- Гибкость: Килпатрик отметил, что компания сознательно ограничивает автономность систем до тех пор, пока технология не станет достаточно безопасной и надежной для широкого использования.
🛠 Обновления платформы и инструменты для разработчиков 17:37
Обновления API направлены на снижение барьеров для входа и создание более мощных бизнес-инструментов.
- GPT-4 Turbo: Версия «preview» предназначена для сбора обратной связи и проверки производительности перед финальным релизом, который ожидается в течение нескольких недель. Компания признала необходимость публикации более подробных бенчмарков, таких как MMLU, для объективной оценки качества моделей.
- Fine-tuning: Поддержка 16k контекста в 3.5 Turbo стала самым востребованным обновлением. Килпатрик подчеркнул, что качественное обучение моделей с использованием reasoning-примеров (объяснение того, почему модель пишет текст определенным образом) дает значительный прирост производительности.
- Пользовательские модели (Custom Models): Входной порог инвестиций в $2–3 млн оправдан для компаний, стремящихся создать действительно защищенный бизнес на базе моделей, обученных на уникальных массивах данных объемом в миллиарды токенов.
🧩 Мультимодальность и этика 36:37
Интеграция зрения, звука и текста превращает OpenAI в полноценную мультимодальную платформу.
- Vision: Модель понимает изображения с разным уровнем детализации. Режим низкого разрешения (512x512) оптимизирован по стоимости и подходит для большинства задач, где требуется общая оценка контента.
- Текст-в-речь (TTS): Килпатрик пояснил, что голоса ИИ намеренно сбалансированы: они звучат естественно, но при этом сохраняют «нечеловеческую» окраску, чтобы пользователи четко понимали, что они взаимодействуют с машиной. Компания строго придерживается политики, требующей уведомлять пользователей об использовании синтетического голоса.
- Конфиденциальность: Официально подтверждено: OpenAI не использует данные, передаваемые через API, для обучения своих моделей.