OpenAI Dev Day 2024: Сэм Альтман о переходе к ИИ-агентам, уровнях AGI и конкуренции с Google

Wes Roth 29,4 тыс. 59 мин 5 мин 02.10.2024
Главное

На конференции OpenAI Dev Day 2024 генеральный директор компании Сэм Альтман и технические специалисты представили видение будущего, в котором искусственный интеллект переходит от простых чат-ботов к автономным агентам. В центре внимания оказались новая модель o1, запуск Realtime API для голосового взаимодействия и дорожная карта по достижению сильного ИИ (AGI) через пятиуровневую систему оценки прогресса.

🏆 Пять уровней на пути к AGI 3:30

Сэм Альтман пояснил, что OpenAI отказалась от бинарного восприятия AGI («он либо есть, либо его нет») в пользу более детальной классификации . По его словам, это необходимо, так как само определение «общего искусственного интеллекта» стало слишком перегруженным и размытым.

В OpenAI используют следующую внутреннюю шкалу:

По мнению Сэма Альтмана, с выходом модели o1 компания «явно достигла второго уровня» . Он подчеркнул, что переход к третьему уровню (агентам) произойдет в «недалеком будущем», и это станет моментом, когда технология начнет казаться по-настоящему дееспособной .

Альтман также отметил, что прогресс идет по экспоненте: если сравнить текущую модель o1 с GPT-4 Turbo, выпущенной всего 11 месяцев назад, разница в способностях решать сложные задачи будет поразительной .

🧪 Культура OpenAI: «Следовать за наукой» 7:25

Отвечая на вопрос о приверженности исследованиям, Сэм Альтман подтвердил, что OpenAI остается прежде всего исследовательской организацией. Он считает, что в истории компании был период, когда главным было просто масштабирование вычислительных мощностей, но сейчас фокус снова сместился на глубокие научные прорывы .

Ключевые принципы разработки в OpenAI:

Интересный факт: один из корпоративных клиентов просил OpenAI уведомлять о запусках новых продуктов за 60 дней, на что Сэм Альтман в шутку ответил, что сам хотел бы иметь такую возможность, намекая на непредсказуемость исследовательского процесса .

🛡️ Безопасность и «итеративное развертывание» 11:51

Обсуждая опасения сообщества по поводу безопасности ИИ (Alignment), Сэм Альтман защитил стратегию «итеративного развертывания». По его мнению, невозможно предусмотреть все риски теоретически, подготовив список из «17 принципов» для будущего суперинтеллекта .

Аргументы OpenAI в пользу текущего подхода:

Альтман признал, что OpenAI часто занимает консервативную позицию, ограничивая возможности моделей (например, запрещая голосу «петь» или выдавать оскорбительный контент), чтобы дать обществу время на адаптацию .

🤖 2025 год — год ИИ-агентов 16:26

Сэм Альтман сделал смелый прогноз: 2025 год станет временем массового внедрения ИИ-агентов . Это системы, которые смогут выполнять многоэтапные задачи, взаимодействуя с компьютерами и другими людьми на протяжении длительных периодов.

По мнению Альтмана, это фундаментально изменит мир:

Главным препятствием для создания агентов, имеющих доступ к управлению компьютером пользователя (клики мышью, ввод данных), Альтман назвал не технические возможности, а доверие и надежность . Планка безопасности для таких систем должна быть беспрецедентно высокой.

🎙️ Голосовой интерфейс и «взлом человеческого API» 25:15

Запуск Advanced Voice Mode и Realtime API стал одной из главных тем Dev Day. Альтман признался, что голосовой режим стал первым случаем, когда ИИ по-настоящему «обманул» его мозг. Он ловит себя на том, что постоянно говорит «пожалуйста» и «спасибо» при общении голосом, так как система кажется слишком реальной .

Это вызывает новые вопросы этики:

На мероприятии продемонстрировали работу Realtime API: ИИ-ассистент в реальном времени позвонил в магазин и заказал 400 клубник в шоколаде, обсудив цену и доставку . Также был показан дрон, управляемый голосовыми командами через ИИ, который в реальном времени анализировал видеопоток .

🏢 Конкуренты и продукты: NotebookLM и Anthropic 29:06

Несмотря на доминирование на рынке, Сэм Альтман открыто похвалил продукты конкурентов. Его особенно впечатлил проект GoogleNotebookLM . Альтман отметил, что функция генерации подкастов в этом приложении — «просто крутая вещь», которая принесла ему радость .

Также в ходе беседы упомянули:

🛠️ Техническая дорожная карта и будущее 27:30

Альтман поделился планами по развитию моделей o1 до конца 2024 года:

  1. Поддержка вызова функций (function calling) .
  2. Внедрение системных промптов и структурированных выводов (structured outputs) .
  3. Значительное увеличение скорости и «интеллекта» моделей в следующем году .

Что касается контекстных окон, Альтман предсказывает появление «бесконечного контекста» в течение ближайшего десятилетия . В ближайшие месяцы OpenAI планирует достичь отметки в 10 миллионов токенов, которые будут обрабатываться быстро и точно .

В финале дискуссии Сэм Альтман описал интерфейс будущего: «Вы просто подходите к куску стекла, говорите, что вам нужно, и ИИ мгновенно рендерит для вас индивидуальное видео-интерфейс, связанный со всеми агентами и инструментами в мире» .

💬 Цитаты

«2025 год станет годом, когда тема агентов станет действительно масштабной.»

Сэм Альтман 16:52

«Я считаю, что Google NotebookLM — это супер-круто. Утром я смотрел примеры и это просто принесло мне радость.»

Сэм Альтман 29:18

«Вы сможете попросить агента сделать что-то, что заняло бы у вас месяц, и он закончит за час.»

Сэм Альтман 18:35
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Общий искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
o1
Новая серия моделей OpenAI, ориентированная на сложные рассуждения и решение логических задач.
Alignment (выравнивание)
Процесс настройки модели ИИ таким образом, чтобы ее цели и поведение соответствовали человеческим ценностям и мерам безопасности.
Realtime API
Инструмент для разработчиков, позволяющий встраивать в приложения быстрый голосовой интерфейс «модель-модель».
📊 Цифры
🗓 Хронология
  1. Октябрь 2024 Проведение OpenAI Dev Day и анонс Realtime API
  2. Конец 2024 Планируемое добавление вызова функций и системных промптов в o1
  3. 2025 год Прогнозируемый взлет популярности ИИ-агентов
  4. К 2030 году Ожидание полной адаптации общества к возможностям ИИ-агентов
⚖️ Другая сторона
Искусственный интеллект Сэм Альтман OpenAI AGI NotebookLM o1