Lecture 23: Introduction to Machine Learning

MIT OpenCourseWare 6,2 тыс. 1 ч 16 мин 3 мин 03.12.2025

Знаменитый эксперт в области деривативов, профессор Школы менеджмента имени Ротмана при Университете Торонто Джон Халл представил в MIT масштабный обзор применения искусственного интеллекта в финансовом секторе. В своей лекции он описывает переход от классической статистики к алгоритмам машинного обучения, объясняет принципы работы нейросетей и доказывает, почему обучение с подкреплением скоро станет стандартом для хеджирования сложных рисков.

🏭 Машинное обучение как сердце новой промышленной революции 5:42

По мнению Джона Халла, современное машинное обучение (ML) — это не просто новый набор алгоритмов, а фундамент четвертой промышленной революции. Он выделяет четкую хронологию технологического прогресса человечества:

Разницу между эпохами Халл иллюстрирует на примере выдачи кредитов. Если в рамках «третьей революции» компьютер просто автоматизировал проверку анкет по правилам, написанным кредитными инспекторами, то «четвертая» подразумевает использование ML для поиска скрытых закономерностей в данных и создания более совершенных стратегий одобрения займов. Ключевым фактором успеха ИИ сегодня профессор считает не столько новизну самих математических методов (многие из которых известны десятилетиями), сколько возросшую скорость работы современных процессоров.

📊 Смена парадигмы: Машинное обучение против Статистики 10:09

Халл подчеркивает фундаментальное различие в подходах между классической статистикой и Data Science. В традиционной статистике исследователь сначала формулирует гипотезу в «удобном кресле», а затем собирает данные для ее проверки. Машинное обучение идет в обратном направлении:

  1. Сначала собирается массив данных.
  2. Затем алгоритм ищет в нем паттерны без предварительных теоретических предустановок.

В этой области сложилась своя терминология, которая поначалу может запутать классического статистика. Вместо «зависимых переменных» специалисты по ML говорят о целевых переменных (targets), а вместо «независимых переменных» — о признаках (features).

Три столпа алгоритмов

Профессор выделяет три ключевых типа обучения:

🧠 Анатомия и тренировка нейронных сетей 22:26

Искусственные нейронные сети (ANN) представляют собой многослойные структуры, имитирующие биологические процессы. В отличие от линейной регрессии, ANN не пытаются связать входные данные с результатом одним уравнением. Вместо этого они проходят через несколько этапов преобразований в «скрытых слоях».

[Image of artificial neural network architecture with input, hidden, and output layers]

Ключевые параметры процесса:

Для предотвращения переобучения (overfitting) — ситуации, когда модель идеально знает тренировочные данные, но бесполезна в реальности, — Халл рекомендует разделять выборку в пропорции 60% (обучение), 20% (валидация) и 20% (финальный тест). Усложнять модель стоит лишь до тех пор, пока точность на валидационном наборе продолжает расти; как только она начинает падать, обучение нужно прекращать.

📈 Практика: Имитация формулы Блэка-Шоулза-Мертона 38:30

Одним из экспериментов Джона Халла стало обучение нейросети на данных, сгенерированных классической моделью ценообразования опционов Блэка-Шоулза-Мертона. Профессор создал 10 000 цен опционов, добавил в них случайный «шум» и проверил, сможет ли ИИ восстановить исходную логику формулы.

Результат оказался впечатляющим: нейросеть с тремя скрытыми слоями смогла практически идеально имитировать модель. Это имеет огромное прикладное значение. Для многих экзотических деривативов единственным способом оценки является симуляция Монте-Карло, которая может занимать 3–4 минуты