Проблема генерализации и надежности нейросетей

MIT OpenCourseWare 1,4 тыс. 1 ч 4 мин 2 мин 11.02.2026
Главное

Обобщающая способность моделей: проблема Out-of-Distribution (OOD) 0:00

Обобщающая способность современных моделей машинного обучения на данных, выходящих за рамки обучающей выборки, остается одной из самых серьезных нерешенных проблем в области искусственного интеллекта. Хотя нейросети достигли впечатляющих результатов в классификации изображений, генерации контента и стратегических играх, их применение в реальном мире часто сталкивается с критическими ограничениями. Проблема заключается в том, что теоретическое допущение о независимой и одинаковой распределенности данных (IID — Independently and Identically Distributed) практически никогда не выполняется в условиях реальной эксплуатации, где данные постоянно меняются.

⚖️ Хрупкость моделей и реальный мир 1:38

Основной барьер для повсеместного внедрения ИИ, например, в беспилотные автомобили или медицину — это отсутствие гарантий надежности. По мнению Сары Бири, многие успешные примеры внедрения ИИ сегодня — это системы с обязательной проверкой человеком (Human-in-the-loop), где ошибки ИИ корректируются экспертами.

🛡️ Состязательные атаки и устойчивость 13:38

Одной из главных тем является уязвимость нейросетей к состязательным (adversarial) примерам — специально созданным минимальным искажениям данных, которые заставляют модель ошибаться с высокой уверенностью, оставаясь при этом невидимыми для человеческого глаза.

  1. Примеры атак: Изменение текстуры 3D-объекта (черепахи) может заставить классификатор уверенно называть его «винтовкой».
  2. Защита: Для борьбы с этим применяется состязательное обучение (adversarial training) — метод, при котором модель принудительно обучают на самых «трудных» примерах.
  3. Ограничения: Несмотря на прогресс, это направление остается крайне затратным вычислительно и не дает универсальных решений для всех типов угроз.

🌐 Проблема сдвига распределений (Distribution Shift) 43:38

Даже без злонамеренных атак модели сталкиваются со сдвигом распределений — изменением характеристик данных при переходе от обучения к эксплуатации. Это может проявляться через:

Для борьбы с этим используются методы распределенно-устойчивой оптимизации (Distributionally Robust Optimization, DRO), которые пытаются максимизировать устойчивость модели к наихудшим сценариям сдвига. Однако, как отмечает Сара Бири, на практике часто оказывается эффективнее просто собрать более качественные, репрезентативные данные, отражающие реальный тестовый домен, чем пытаться алгоритмически компенсировать нехватку данных.

💬 Цитаты

«Training distribution equals test distribution. This is never true in the real world.»

Сара Бири 06:36

«If you really need something to work well, you have to invest in the right kind of training data.»

Сара Бири 58:55
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
IID
Допущение, что данные для обучения и тестирования взяты из одного и того же распределения.
OOD (Out-of-Distribution)
Ситуация, когда модель сталкивается с данными, которые не были представлены в обучающей выборке.
Состязательные примеры (Adversarial examples)
Данные с минимальными изменениями, которые заставляют ИИ ошибаться.
DRO (Distributionally Robust Optimization)
Метод оптимизации, нацеленный на обеспечение работы модели при наихудших изменениях распределения данных.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект machine learning out-of-distribution adversarial examples Sara Beery robustness