«Z равно нулю»: как математика разделяет классы в обучении от DeepLearning.AI

DeepLearning.AI 63,6 тыс. 10 мин 2 мин 01.12.2022
Главное

В рамках курса Machine Learning Specialization от DeepLearning.AI разбираются фундаментальные аспекты построения классификаторов. В этом уроке рассматривается концепция «границы принятия решения» (decision boundary) — математического и визуального инструмента, который позволяет понять, как именно логистическая регрессия разделяет объекты на классы.

📐 Математическая основа прогнозирования 0:01

Логистическая регрессия вычисляет предсказания в два этапа . Сначала модель определяет промежуточное значение $z$, которое представляет собой линейную комбинацию признаков: $z = \mathbf{w} \cdot \mathbf{x} + b$ . Затем к этому значению применяется сигмоидная функция $g(z) = 1 / (1 + e^{-z})$, также называемая логистической функцией.

Результат работы функции $f(x)$ интерпретируется как вероятность того, что целевая переменная $y$ равна единице при заданных входных данных $x$ и параметрах $w$ и $b$ . Чтобы превратить эту вероятность в конкретный класс (0 или 1), необходимо установить порог.

Стандартный подход к классификации, по словам ведущего:

🌓 Где проходит граница: роль значения Z 2:18

Чтобы понять, в какой момент модель меняет своё решение, нужно проанализировать поведение сигмоиды . Функция $g(z)$ выдает значение больше или равное $0,5$ только в том случае, если её аргумент $z$ больше или равен нулю . Поскольку $z = \mathbf{w} \cdot \mathbf{x} + b$, условие предсказания первого класса сводится к простому неравенству: $w \cdot x + b \ge 0$ .

Линия (или гиперплоскость в многомерном пространстве), где выполняется равенство $w \cdot x + b = 0$, называется границей принятия решения . На этой линии модель находится в «нейтральном» состоянии, оценивая вероятность принадлежности к обоим классам как равную.

Рассмотрим пример с двумя признаками ($x_1$ и $x_2$) и заданными параметрами:

В этом случае все точки справа от линии будут классифицированы как $1$, а слева — как $0$ .

🌀 Нелинейные границы и полиномы 6:42

Логистическая регрессия не ограничивается только прямыми линиями. Как и в случае с линейной регрессией, для моделирования сложных зависимостей можно использовать полиномиальные признаки .

Если добавить квадратичные члены, например, $z = w_1x_1^2 + w_2x_2^2 + b$, форма границы может радикально измениться. При параметрах $w_1 = 1, w_2 = 1$ и $b = -1$ уравнение границы примет вид окружности: $x_1^2 + x_2^2 = 1$ .

Возможности усложнения практически безграничны:

В завершение урока отмечается, что понимание визуализации границ помогает осознать диапазон моделей, которые можно построить. Следующим критически важным этапом является обучение модели — выбор оптимальных параметров $w$ и $b$ с помощью функции потерь и градиентного спуска .

💬 Цитаты

«Граница принятия решения — это линия, на которой вы находитесь в нейтральном положении относительно того, является ли Y нулем или единицей.»

«С полиномиальными признаками вы можете получить очень сложные границы принятия решений.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Сигмоида (Sigmoid function)
S-образная функция, преобразующая любое число в значение в диапазоне от 0 до 1.
Decision Boundary
Линия или поверхность, разделяющая пространство признаков на области, соответствующие разным классам.
Полиномиальные признаки
Новые признаки, созданные путем возведения существующих признаков в степень или их перемножения.
Смещение (Bias)
Параметр 'b' в линейном уравнении, позволяющий сдвигать границу решения независимо от весов признаков.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Logistic Regression Decision Boundary Sigmoid Function DeepLearning.AI Machine Learning