MIT: «Вы не сможете переиграть OpenAI мощностью железа, будьте креативными»

MIT OpenCourseWare 321 тыс. 1 ч 4 мин 11.02.2026
Главное

Курс MIT 6.S191 «Введение в глубокое обучение» (Introduction to Deep Learning) открывает свои двери для студентов, предлагая глубокое погружение в технологию, которая за последние десять лет прошла путь от неработающих концептов до инструментов, которыми пользуется почти каждый. Ведущий лектор (предположительно Сара Бири, судя по контексту работы с экологами и слонами) вместе с ассистентом Джереми представляют обновленную программу 2024 года, акцентируя внимание на сочетании теоретической базы и практических навыков разработки.

🚀 Философия курса и прагматизм в обучении 0:12

Глубокое обучение сегодня касается почти всех сфер жизни: от генерации текста и кода до 3D-реконструкции (NeRF) и стратегических игр (AlphaGo) . По словам лектора, успех в этой области обеспечивается синергией теории и практики .

Курс ориентирован на продвинутый уровень (graduate-level) и предполагает наличие у слушателей базовых знаний об ИИ . Одной из ключевых особенностей программы является фокус на творческом подходе к ресурсам. Преподаватели сразу предупреждают: университет не может предоставить бесконечные вычислительные мощности .

«Вы не сможете переиграть OpenAI по количеству вычислительных ресурсов в своем проекте», — подчеркивает лектор, призывая студентов искать инновации не в масштабе данных, а в оригинальности подходов и архитектурных решениях .

Основные принципы оценки знаний:

⚖️ Этика и правила взаимодействия с ИИ 8:17

В курсе по глубокому обучению было бы странно запрещать использование ИИ-помощников вроде ChatGPT. Однако администрация курса вводит строгие этические рамки :

  1. Принцип «человеческого коллеги»: К ИИ-ассистенту нужно относиться как к сокурснику. Лектор утверждает, что нельзя просить модель решить задачу или написать код за вас, так как вы не стали бы просить об этом друга .
  2. Прозрачность: Если при выполнении задания использовался ИИ, студент обязан указать это, описав характер взаимодействия, точно так же, как указываются имена живых коллег по учебной группе .
  3. Индивидуальность: Общие обсуждения допустимы, но финальный код и решения должны быть результатом самостоятельного интеллектуального труда .

📜 Краткая история нейросетей: взлеты и падения 13:41

История области представлена как череда циклов энтузиазма и разочарования («зим ИИ»):

Лектор задается вопросом: где мы будем в 2028 году? Будет ли это новый виток осцилляции или выход на плато, зависит от того, сможем ли мы преодолеть текущие ограничения мощностей и данных .

🧱 Фундаментальные строительные блоки 21:46

Сегодняшнее глубокое обучение базируется на нескольких «столпах»:

Лектор подробно разбирает эволюцию функций активации:

  1. Step-function (ступенчатая): непригодна для обучения, так как градиент везде равен нулю .
  2. Sigmoid и Tanh: ранее популярны, но страдают от проблемы «затухания градиентов» при больших значениях .
  3. ReLU (Rectified Linear Unit): современный стандарт. Она проста в вычислении и ускоряет сходимость в 6 раз по сравнению с Tanh (по данным Крижевского) . Однако существует риск «отмирания» нейронов при попадании в отрицательную область .

📈 От перцептрона к глубоким моделям 39:23

Основная идея глубокого обучения — усложнение через наслоение. Даже двухслойный перцептрон способен выполнять нелинейную классификацию, комбинируя простые «наклонные плоскости» (рампы) в сложные геометрические формы .

Ключевые темы будущих лекций:

🐘 Будущее и масштабирование 58:42

В завершение лекции проводится аналогия с биологическими системами. Масштабирование — один из главных драйверов индустрии :

Современные модели приближаются по числу параметров к сложным биологическим организмам, однако обучение GPT-4o стоит многие миллионы долларов и сопряжено с огромными углеродными выбросами [21:59, 22:38]. Лектор, сама работающая в сфере сохранения биоразнообразия, подчеркивает иронию ситуации: ИИ помогает изучать природу, но его обучение может вредить климату .

💬 Цитаты

«Вы не сможете переиграть OpenAI в этом исследовательском проекте по количеству вычислений. Будьте креативными.»

Сара Бири 04:46

«В 2000 году на конференции NeurIPS заголовок со словами 'neural network' был верным признаком того, что статью отклонят.»

Сара Бири 17:46

«ReLU — это наш выбор по умолчанию, она помогает ускорить сходимость в 6 раз.»

Сара Бири 34:32
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Перцептрон
Простейшая модель нейрона, суммирующая входы с весами и применяющая нелинейность.
Backpropagation
Алгоритм вычисления градиентов для обучения многослойных сетей.
ReLU
Функция активации, которая пропускает положительные значения и превращает отрицательные в ноль.
Double Descent
Явление, при котором ошибка модели сначала падает, потом растет из-за переобучения, а затем снова падает при очень большом числе параметров.
📊 Цифры
🗓 Хронология
  1. 1958 Розенблатт представил перцептрон.
  2. 1972 Критика Минского и Паперта привела к первой зиме ИИ.
  3. 1986 Популяризация алгоритма обратного распространения ошибки.
  4. 2012 Победа AlexNet на конкурсе ImageNet, революция глубокого обучения на GPU.
⚖️ Другая сторона
Искусственный интеллект MIT OpenCourseWare Deep Learning PyTorch ReLU AlexNet