Шикхар Мурти о возможностях LLM: рассуждения или запоминание?

Stanford Online 19 тыс. 1 ч 3 мин 3 мин 04.03.2025
Главное

Лингвистические модели: от рассуждений к автономным агентам 0:15

В лекции 14 курса CS224N «Reasoning and Agents» Шикхар Мурти из Stanford University подробно рассматривает две перспективные области применения больших языковых моделей (LLM): способность к логическому мышлению и возможности выполнения действий в качестве автономных агентов. В условиях бурного развития этой сферы за последние несколько лет, лектор акцентирует внимание на том, что многие вопросы остаются открытыми, а существующие методы требуют критического анализа и дальнейшего изучения.


🧠 Способы стимуляции рассуждений в LLM 1:00

Шикхар Мурти определяет рассуждение как использование фактов и логики для получения ответа, выделяя три основные категории: дедуктивное (от правил к выводу), индуктивное (от наблюдений к обобщениям) и абдуктивное (вывод объяснений из наблюдений). Для внедрения логических навыков в языковые модели применяются различные стратегии промптинга:

Исследователи отмечают, что с помощью достаточного инжиниринга промптов производительность стандартных методов CoT становится сопоставимой с более сложными подходами.


🛠 Дистилляция и итеративное обучение 10:09

Помимо промптинга, важным направлением является обучение небольших моделей навыкам рассуждения старших «коллег».


🔍 Проверка на прочность: рассуждение или запоминание? 20:17

Шикхар Мурти ставит под сомнение реальные способности моделей к рассуждению, ссылаясь на эксперименты с «пост-хок» объяснениями. В таких тестах было замечено, что даже при порче или сокращении цепочки рассуждений модель выдает тот же самый (иногда верный, иногда ошибочный) ответ, что указывает на отсутствие истинной логической зависимости.

Особое внимание уделяется контрафактуальному (или внераспределительному) оцениванию:

По мнению лектора, это указывает на то, что текущие успехи моделей могут быть связаны не столько с системным логическим выводом, сколько с memorization — заучиванием паттернов из тренировочных данных.


🤖 LLM как агенты: действия в среде 30:09

Во второй части лекции обсуждается использование моделей как цифровых агентов, способных совершать действия (клики, ввод текста) в браузерах или специальных интерфейсах для достижения целей.

Эволюция подходов

  1. Semantic Parsers: использование машинного перевода для превращения естественного языка в исполняемые логические формы.
  2. Планы из примеров: обучение моделей выводить исполняемый план из инструкций.
  3. Reinforcement Learning (RL): прямое обучение политики действий с получением награды.
  4. Generative Trajectory Modeling: современный подход 2024 года, где агент предсказывает последовательность действий (траекторию) как следующую последовательность токенов, используя архитектуру трансформера.

Проблемы и будущее

Несмотря на использование синтетических данных и итеративное ре-лейблинг (повторную маркировку траекторий), агенты все еще далеки от совершенства. На бенчмарках типа MiniWoB и WebArena даже лучшие модели часто совершают тривиальные ошибки, например, вводя email-адрес в поле для пароля или зацикливаясь на неверных действиях. Мурти подчеркивает, что планирование на длинные дистанции остается серьезным барьером, а разрыв между человеческой эффективностью и возможностями ИИ-агентов остается значительным.

💬 Цитаты

«Мы сводим проблему принятия решений в средах к простой авторегрессионной модели.»

Шикхар Мурти 42:44

«Может быть, это не рассуждение, а просто запоминание.»

Шикхар Мурти 27:26
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
CoT Prompting
Метод, при котором модель пошагово описывает логику решения перед выводом ответа.
Self-Consistency
Стратегия выбора ответа на основе голосования между несколькими вариантами цепочек рассуждений.
Контрафактуальное оценивание
Метод тестирования модели в условиях, которые маловероятны в её обучающей выборке, для проверки глубины понимания.
Дистилляция
Процесс обучения меньшей модели на знаниях или ответах более мощной (старшей) модели.
DOM
Представление веб-страницы в виде структуры объектов, с которыми может взаимодействовать агент.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Shikhar Murty Large Language Models Chain of Thought LLM agents