Йонас Хюботтер: почему будущее ИИ — за адаптацией в реальном времени

Machine Learning Street Talk 30 тыс. 1 ч 45 мин 2 мин 30.11.2024
Главное

🧠 Будущее ИИ: адаптация в процессе работы и преодоление ограничений «монолитов» 0:00

В современном ландшафте искусственного интеллекта доминируют огромные параметрические модели, обучаемые на колоссальных массивах данных и «замораживающиеся» после завершения обучения. Однако такой подход имеет фундаментальные ограничения: он не обладает гибкостью и не позволяет системе динамически адаптироваться к новым, специфическим задачам. Исследователь ETH Zurich Йонас Хюботтер в интервью Machine Learning Street Talk обсуждает концепцию адаптации в режиме реального времени (Test-Time Adaptation), которая обещает превратить статичные модели в динамические системы, способные эффективно распределять вычислительные ресурсы.

📉 Проблема индуктивного подхода и переход к трансдукции 26:55

Традиционная парадигма глубокого обучения полагается на индуктивный подход: модель обучается один раз, чтобы «понимать всё обо всём». Ведущий и гость отмечают, что такой подход ведет к усреднению знаний и потере точности при решении узких задач.

Йонас Хюботтер полагает, что будущие системы должны использовать принципы локального обучения. Вместо попыток сжать весь «манифольд данных» (data manifold) в одну модель, ИИ должен уметь «зумироваться» на конкретной задаче, выделяя из памяти наиболее информативные примеры.

🛠 SIFT: Автоматизированная выборка данных 3:21

Ключевым препятствием для локального обучения является выбор правильных данных. Обычный поиск ближайших соседей (nearest neighbor search) часто возвращает избыточную или нерелевантную информацию. Метод, предложенный Хюботтером и его коллегами — SIFT (Search-based Inference with Fine-Tuning) — решает эту проблему через минимизацию неопределенности.

  1. Поиск информативности: SIFT ищет данные, которые не только близки к запросу, но и несут новую информацию (минимизация избыточности).
  2. Линейные суррогатные модели: Для оценки того, как конкретный пример повлияет на качество предсказания, SIFT использует простую линейную модель, что делает процесс вычислений «трактуемым» (математически доступным в замкнутой форме).
  3. Принцип «Google Earth»: Аналогия с картографическим сервисом идеально описывает метод: модель тратит вычислительные мощности не равномерно, а концентрирует их там, где это необходимо для точности ответа.

⚖️ Баланс между вычислениями и неопределенностью 1:15:27

Важнейший вклад работы Хюботтера — связь количества затрачиваемого на этапе инференса (вывода) времени с «эпистемической неопределенностью» модели.

🔮 Взгляд в будущее 1:26:03

Участники дискуссии сходятся во мнении, что будущее ИИ — за гибридными, «асинхронными» системами, которые больше похожи на биологические организмы, чем на текущие «монолитные» архитектуры.

💬 Цитаты

«Интеллект — это способность абстрагироваться и адаптироваться к окружению для достижения фундаментальных целей.»

Йонас Хюботтер 0:14

«Трансдуктивное активное дообучение будет иметь колоссальное значение в ближайшие пять лет.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Трансдуктивное обучение
Тип обучения, где модель подстраивается под специфический тестовый запрос, а не пытается выучить общие правила для всего мира.
Эпистемическая неопределенность
Мера неуверенности модели, вызванная недостатком знаний или данных в конкретной области.
Манифольд данных (Data manifold)
Геометрическое представление структуры данных в пространстве признаков, на котором «живет» информация.
Индуктивный парадигма
Классический подход, при котором модель пытается выучить общие закономерности из обучающей выборки, чтобы применять их везде.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Jonas Hübotter Test-Time Adaptation Transductive Learning Machine Learning Large Language Models