Йонас Хюботтер: почему будущее ИИ — за адаптацией в реальном времени

🧠 Будущее ИИ: адаптация в процессе работы и преодоление ограничений «монолитов» 0:00

В современном ландшафте искусственного интеллекта доминируют огромные параметрические модели, обучаемые на колоссальных массивах данных и «замораживающиеся» после завершения обучения. Однако такой подход имеет фундаментальные ограничения: он не обладает гибкостью и не позволяет системе динамически адаптироваться к новым, специфическим задачам. Исследователь ETH Zurich Йонас Хюботтер в интервью Machine Learning Street Talk обсуждает концепцию адаптации в режиме реального времени (Test-Time Adaptation), которая обещает превратить статичные модели в динамические системы, способные эффективно распределять вычислительные ресурсы.

📉 Проблема индуктивного подхода и переход к трансдукции 26:55

Традиционная парадигма глубокого обучения полагается на индуктивный подход: модель обучается один раз, чтобы «понимать всё обо всём». Ведущий и гость отмечают, что такой подход ведет к усреднению знаний и потере точности при решении узких задач.

Индуктивное обучение: стремление создать единую функцию, описывающую весь набор данных.
Трансдуктивное обучение: подстройка статистической функции под конкретный входной пример.

Йонас Хюботтер полагает, что будущие системы должны использовать принципы локального обучения. Вместо попыток сжать весь «манифольд данных» (data manifold) в одну модель, ИИ должен уметь «зумироваться» на конкретной задаче, выделяя из памяти наиболее информативные примеры.

🛠 SIFT: Автоматизированная выборка данных 3:21

Ключевым препятствием для локального обучения является выбор правильных данных. Обычный поиск ближайших соседей (nearest neighbor search) часто возвращает избыточную или нерелевантную информацию. Метод, предложенный Хюботтером и его коллегами — SIFT (Search-based Inference with Fine-Tuning) — решает эту проблему через минимизацию неопределенности.

Поиск информативности: SIFT ищет данные, которые не только близки к запросу, но и несут новую информацию (минимизация избыточности).
Линейные суррогатные модели: Для оценки того, как конкретный пример повлияет на качество предсказания, SIFT использует простую линейную модель, что делает процесс вычислений «трактуемым» (математически доступным в замкнутой форме).
Принцип «Google Earth»: Аналогия с картографическим сервисом идеально описывает метод: модель тратит вычислительные мощности не равномерно, а концентрирует их там, где это необходимо для точности ответа.

⚖️ Баланс между вычислениями и неопределенностью 1:15:27

Важнейший вклад работы Хюботтера — связь количества затрачиваемого на этапе инференса (вывода) времени с «эпистемической неопределенностью» модели.

Минимизация дисперсии: Модель использует байесовский подход для оценки уверенности в своих предсказаниях.
Динамический бюджет: Если модель уже достаточно уверена в ответе, она останавливает дополнительные вычисления.
Экономия ресурсов: Это позволяет эффективно использовать «простаивающие» мощности современных компьютеров, например, новых процессоров M4, для дообучения модели прямо в процессе работы над кодом или документом.

🔮 Взгляд в будущее 1:26:03

Участники дискуссии сходятся во мнении, что будущее ИИ — за гибридными, «асинхронными» системами, которые больше похожи на биологические организмы, чем на текущие «монолитные» архитектуры.

Turing-полные системы: Переход от фиксированного количества памяти к неограниченным внешним хранилищам, к которым контроллер ИИ обращается не последовательно, а напрямую через абстракции.
Стирание границ: Йонас Хюботтер предсказывает, что облачные провайдеры в будущем будут продавать не только доступ к API, но и «переменное количество вычислительных ресурсов» (variable inference time compute), позволяя пользователям самим определять, насколько глубоко модель должна «думать» над конкретной задачей.