OpenAI o1: «Фундаментальный сдвиг в возможностях ИИ»

Wes Roth 78,6 тыс. 30 мин 2 мин 12.09.2024
Главное

OpenAI представила новую модель под кодовым названием «Strawberry», получившую официальное имя OpenAI o1. По словам Уэса Рота, ведущего канала, эта модель знаменует фундаментальный сдвиг в возможностях искусственного интеллекта, демонстрируя способности к глубокому рассуждению, сопоставимые с экспертами уровня PhD в математике, физике и программировании.

🧠 Феномен скрытого «рассуждения» 0:27

Ключевое отличие модели заключается в использовании «цепочки рассуждений» (Chain of Thought). В отличие от предыдущих версий, которые отвечают практически мгновенно, OpenAI o1 тратит время на детальное обдумывание задачи перед выдачей ответа.

Как утверждает Рот, этот механизм позволяет модели решать задачи, с которыми до сих пор не справлялся ни один другой ИИ, например, сложные логические головоломки с расстановкой мебели на сетке.

📊 Результаты и бенчмарки 3:39

OpenAI o1 значительно опережает предыдущую флагманскую модель GPT-4o в задачах, требующих логики и глубокого анализа.

При этом Рот подчеркивает: модель не идеальна во всем. В задачах на личное письмо или креативное творчество пользователи могут предпочесть GPT-4o из-за более высокой скорости ответа.

🛡️ Безопасность и «чтение мыслей» 15:38

Интеграция правил безопасности непосредственно в цепочку рассуждений сделала модель более устойчивой к попыткам «взлома» (jailbreak). По мнению Уэса Рота, скрытые мысли модели — это важный инструмент мониторинга: разработчики могут видеть, пытается ли ИИ манипулировать пользователем или лгать, что невозможно при работе с «черным ящиком».

Тем не менее, этот подход вызывает вопросы:

  1. Контроль и прозрачность: Рот предполагает, что скрытие внутренних рассуждений — это также способ защитить интеллектуальную собственность и предотвратить обучение конкурентов на данных о том, как именно ИИ пришел к верному ответу.
  2. Этика: Модель не обучают «социально приемлемым» мыслям внутри её «черновика», чтобы не ограничивать её способность находить лучшие решения. Это может привести к тому, что в процессе рассуждения модель может «думать» неприятные вещи, даже если итоговый ответ будет полезным и корректным.

Рот убежден, что вопрос о том, что именно «думает» ИИ, станет одной из самых горячих тем для обсуждения среди политиков, разработчиков и общества в ближайшем будущем.

💬 Цитаты

«Это первый раз, когда модель правильно ответила на этот вопрос.»

Уэс Рот 0:27

«Мы верим, что скрытая цепочка рассуждений открывает уникальную возможность для мониторинга моделей.»

Уэс Рот (цитирует OpenAI) 19:30
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Chain of Thought (Цепочка рассуждений)
Техника, при которой модель разбивает сложную задачу на последовательные логические шаги перед ответом.
Test time compute (Вычисления во время тестирования)
Ресурсы и время, которые модель тратит на обдумывание ответа уже после своего обучения.
Jailbreak (Взлом)
Методы обхода ограничений безопасности ИИ, направленные на получение запрещенных ответов.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект OpenAI o1 Chain of Thought GPT-4o тестовое время вычислений