Тим и Кит о модели o1: «Это не рассуждение, а имитация»

Machine Learning Street Talk 47,7 тыс. 1 ч 24 мин 3 мин 15.09.2024
Главное

Рассуждения или имитация: Что на самом деле происходит внутри o1-preview? 0:00

В свежем выпуске подкаста Machine Learning Street Talk (MLST) ведущие Тим и Кит Даггер обсуждают новые модели OpenAI, в частности o1-preview, и пытаются разобраться, можно ли считать «режимы рассуждения» этих моделей настоящим логическим выводом или это лишь искусная имитация. Авторы канала занимают критическую позицию, предлагая смотреть на возможности современных LLM через призму теории вычислимости и практического опыта разработки кода.

Теория вычислений и «ловушка» нейросетей 2:15

Основной тезис Даггера заключается в том, что современное понимание программирования и логики часто игнорирует фундаментальные принципы, заложенные Аланом Тьюрингом.

Что такое «рассуждение»? 13:07

Участники дискуссии пытаются определить границы понятия «рассуждение» (reasoning).

Почему ИИ не может работать в режиме «автопилота» 34:41

Одним из центральных сюжетов выпуска стал эксперимент с решением сложной логической задачи (задача с переключателями в pillar), которую ведущие предложили моделям.

  1. Результаты тестов: Модели, включая o1-preview, продемонстрировали неспособность к последовательному удержанию логики при изменении условий. Они часто «зацикливаются» на неверных стратегиях, просто повторяя одни и те же действия, надеясь на успех.
  2. Необходимость контроля: Ведущие убеждены, что современные LLM — это инструмент для «дидактического обмена знаниями», а не автономный агент. Если человек перестает проверять промежуточные результаты, модель быстро «деградирует» из-за накопления ошибок и потери контекста.
  3. Синергия человека и ИИ: Тим отмечает, что для программиста ИИ полезен не как замена, а как инструмент для анализа огромных массивов кода, где модель может помочь найти исторические причины возникновения «грязных» участков или багов.

Прогнозы и выводы 55:29

Ведущие задаются вопросом: как далеко зайдет «выпуклая оболочка» (convex hull) практического применения ИИ?

💬 Цитаты

«Модель — это отражение пользователя. Если вы пишете плохой код, модель будет глупой, потому что она — ваше зеркало.»

«Новые модели OpenAI не рассуждают. Они просто запоминают траектории рассуждений, подаренные людьми.»

«Это не путь к AGI. Это путь к очень дорогой итеративной генерации.»

Кит Даггер 25:41
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
o1-preview
Новая модель OpenAI, использующая специальные алгоритмы цепочки рассуждений перед выдачей ответа.
Цепочка мыслей (Chain-of-Thought)
Метод в-контекстного обучения, при котором модель пошагово разбивает задачу перед финальным ответом.
Тьюрингова машина
Математическая модель вычислителя, который может манипулировать символами на бесконечной ленте.
RLHF
Обучение с подкреплением на основе отзывов людей, используемое для настройки поведения моделей.
Модельный коллапс
Состояние, при котором различные режимы работы модели начинают конфликтовать друг с другом, снижая качество результата.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект o1-preview OpenAI Chain of Thought Theory of Computation LLM