Сара Бери об ИИ: «Я не хочу, чтобы Google тратил энергию на каждый запрос»

MIT OpenCourseWare 1,5 тыс. 1 ч 25 мин 3 мин 11.02.2026
Главное

Искусство переноса знаний: как модели обучаются на чужом опыте 🧠 0:00

Transfer learning (обучение с переносом) — это парадигма машинного обучения, позволяющая создавать эффективные модели, даже когда объем доступных данных крайне мал. Сара Бери, лектор MIT, подчеркивает: вместо того чтобы начинать обучение с «чистого листа», нейросети могут использовать опыт, полученный при решении других задач. Этот подход имитирует способность человека адаптироваться к новому опыту, опираясь на физическое понимание мира и накопленные знания.

🏗 Модульный подход: fine-tuning и адаптация 12:16

Основой transfer learning является перенос знаний о том, как входные данные (input) преобразуются в полезные результаты (output).

🌍 Адаптация к домену (Domain Adaptation) 30:02

Domain adaptation решает проблему сдвига распределения данных (distribution shift), когда источник данных и целевое окружение имеют разные характеристики — например, качественные фото товаров с Amazon против «грязных» снимков с рабочего стола на eBay.

🎓 Дистилляция знаний (Knowledge Distillation) 41:10

Дистилляция знаний — это передача опыта от крупной, «учительской» модели к более компактной «студенческой».

🤖 Эра Foundation Models: прогресс или экологический кризис? 56:16

Foundation models (фундаментальные модели) — это системы, настолько универсальные, что могут решать множество задач без специфического дообучения (off-the-shelf). Однако этот прогресс имеет скрытую цену.

💡 Промпт-инжиниринг: «Джинн из лампы»

Современный парадигма адаптации — промпт-инжиниринг, где взаимодействие с моделью сводится к «вопрошанию».

💬 Цитаты

«Если я видел дальше других, то лишь потому, что стоял на плечах гигантов.»

Исаак Ньютон (цитируется Сарой Бери) 58:26

«Я не хочу, чтобы Google запускал ИИ-модели каждый раз, когда я пытаюсь что-то загуглить.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Fine-tuning
Процесс дообучения предварительно обученной модели на небольшом наборе специализированных данных.
Distillation
Передача знаний от большой сложной модели к маленькой, более эффективной.
Zero-shot
Способность модели выполнять задачу без предварительных примеров выполнения этой конкретной задачи.
Catastrophic Forgetting
Проблема, при которой модель при дообучении на новых данных внезапно теряет способность решать старые задачи.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Transfer Learning Foundation Models Knowledge Distillation Domain Adaptation