Филип Исола: «Поиск — это новый двигатель глубокого обучения»

MIT OpenCourseWare 2,1 тыс. 1 ч 22 мин 3 мин 11.02.2026
Главное

Стратегии логического вывода в глубоком обучении: от обучения к поиску 0:55

Современный ландшафт глубокого обучения (Deep Learning) претерпевает значительные изменения. Если раньше фокус исследователей был сосредоточен почти исключительно на фазе обучения (Training), то сейчас всё больше внимания уделяется методам логического вывода (Inference) и использованию вычислительных мощностей непосредственно в момент тестирования или развертывания модели. Фактически, развитие AI смещается от простой стратегии «обучить модель на данных и сделать один проход» к активному поиску решений в пространстве возможностей.

🤖 Разграничение обучения и логического вывода 4:21

Филип Исола, лектор MIT, предлагает рассматривать процесс работы AI как взаимодействие двух режимов:

По мнению лектора, наиболее интересные современные системы (например, OpenAI o1) используют сочетание обучения и интенсивного поиска непосредственно при работе с запросом, что позволяет значительно повысить точность ответов за счет масштабирования вычислений на этапе инференса, а не только на этапе тренировки,.

🔍 Методы поиска и оптимизации 15:06

Традиционные методы глубокого обучения, основанные на авторегрессионной генерации (последовательное предсказание следующего токена), зачастую ограничены жадным сэмплированием (greedy sampling). Проблема в том, что жадный выбор наиболее вероятного токена на каждом шаге не гарантирует получение наиболее вероятной последовательности в целом. Для улучшения результата применяются более продвинутые техники:

  1. Best-of-N: генерация N независимых вариантов ответа и выбор того, который обладает наибольшей суммарной вероятностью или наилучшим баллом по внешней функции оценки.
  2. Beam Search: расширение дерева поиска с сохранением K наиболее перспективных путей на каждом шаге, что позволяет находить более качественные конфигурации ответов.
  3. Chain-of-Thought (Цепочка рассуждений): метод, при котором модель сама генерирует промежуточные этапы мышления в текстовом виде, эффективно превращая процесс вывода в своего рода символьный поиск, описанный на естественном языке.

✅ Верификация как мощный инструмент 34:26

Критически важный тезис лекции заключается в том, что верификация решения часто гораздо проще самого процесса генерации. Если модель пишет программный код, её можно проверить с помощью компилятора; если решает математическую задачу — с помощью формального прувера.

Именно на этом принципе строится современный подход к «самоулучшению» моделей:

Этот цикл «поиск → верификация → обучение» лежит в основе прогресса моделей, способных к сложному логическому анализу.

💡 Тест-тайм обучение: адаптация «на лету» 56:10

Интересным направлением является Test-Time Training — обновление поведения модели прямо в процессе работы. Это может происходить через:

Примером успешного применения таких методов стала победа исследователей MIT в бенчмарке ARC, который считался «неприступным» для чисто нейросетевых архитектур прошлого. Ученые доказали, что даже старые добрые методы градиентного спуска, примененные на этапе инференса к конкретным примерам, могут давать результаты, превосходящие сложные системы.

💬 Цитаты

«Верификация фундаментально легче, чем генерация.»

Филип Исола 35:33

«В этой области побеждают две вещи: простые методы в большом масштабе — это поиск и обучение.»

Филип Исола 9:18
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Inference (Логический вывод)
Процесс использования уже обученной модели для решения новых задач в реальном времени.
Teacher Forcing
Метод обучения, при котором модель на каждом шаге получает правильный предыдущий токен, а не свой собственный результат.
Chain-of-Thought
Техника, при которой модель выписывает свои рассуждения пошагово перед выдачей окончательного ответа.
Pareto frontier
Граница оптимальных решений, где невозможно улучшить один показатель, не ухудшив другой.
📊 Цифры
🗓 Хронология
  1. 1994 Deep Blue побеждает Гарри Каспарова в шахматы с помощью brute-force поиска.
  2. 2020 Появление популярного метода CLIP + VQGAN для генерации изображений.
  3. 2024 Инференс-методы становятся критически важным трендом в глубоком обучении.
⚖️ Другая сторона
Искусственный интеллект Deep Learning Inference Methods Chain-of-Thought Reinforcement Learning MIT OpenCourseWare