«Z равно нулю»: как математика разделяет классы в обучении от DeepLearning.AI

В рамках курса Machine Learning Specialization от DeepLearning.AI разбираются фундаментальные аспекты построения классификаторов. В этом уроке рассматривается концепция «границы принятия решения» (decision boundary) — математического и визуального инструмента, который позволяет понять, как именно логистическая регрессия разделяет объекты на классы.

📐 Математическая основа прогнозирования 0:01

Логистическая регрессия вычисляет предсказания в два этапа . Сначала модель определяет промежуточное значение $z$, которое представляет собой линейную комбинацию признаков: $z = \mathbf{w} \cdot \mathbf{x} + b$ . Затем к этому значению применяется сигмоидная функция $g(z) = 1 / (1 + e^{-z})$, также называемая логистической функцией.

Результат работы функции $f(x)$ интерпретируется как вероятность того, что целевая переменная $y$ равна единице при заданных входных данных $x$ и параметрах $w$ и $b$ . Чтобы превратить эту вероятность в конкретный класс (0 или 1), необходимо установить порог.

Стандартный подход к классификации, по словам ведущего:

Если $f(x) \ge 0,5$, модель предсказывает $\hat{y} = 1$ .
Если $f(x) < 0,5$, модель предсказывает $\hat{y} = 0$ .

🌓 Где проходит граница: роль значения Z 2:18

Чтобы понять, в какой момент модель меняет своё решение, нужно проанализировать поведение сигмоиды . Функция $g(z)$ выдает значение больше или равное $0,5$ только в том случае, если её аргумент $z$ больше или равен нулю . Поскольку $z = \mathbf{w} \cdot \mathbf{x} + b$, условие предсказания первого класса сводится к простому неравенству: $w \cdot x + b \ge 0$ .

Линия (или гиперплоскость в многомерном пространстве), где выполняется равенство $w \cdot x + b = 0$, называется границей принятия решения . На этой линии модель находится в «нейтральном» состоянии, оценивая вероятность принадлежности к обоим классам как равную.

Рассмотрим пример с двумя признаками ($x_1$ и $x_2$) и заданными параметрами:

Веса: $w_1 = 1, w_2 = 1$.
Смещение (bias): $b = -3$ .
Уравнение границы: $x_1 + x_2 - 3 = 0$, что эквивалентно прямой $x_1 + x_2 = 3$ .

В этом случае все точки справа от линии будут классифицированы как $1$, а слева — как $0$ .

🌀 Нелинейные границы и полиномы 6:42

Логистическая регрессия не ограничивается только прямыми линиями. Как и в случае с линейной регрессией, для моделирования сложных зависимостей можно использовать полиномиальные признаки .

Если добавить квадратичные члены, например, $z = w_1x_1^2 + w_2x_2^2 + b$, форма границы может радикально измениться. При параметрах $w_1 = 1, w_2 = 1$ и $b = -1$ уравнение границы примет вид окружности: $x_1^2 + x_2^2 = 1$ .

Возможности усложнения практически безграничны:

Использование признаков более высокого порядка ($x^3, x_1x_2$) позволяет создавать границы в форме эллипсов или сложных кривых .
Внутри такой сложной фигуры модель может предсказывать класс $1$, а за её пределами — класс $0$ .
Без использования полиномов (только с исходными признаками $x_1, x_2, \dots$) граница логистической регрессии всегда будет оставаться линейной .

В завершение урока отмечается, что понимание визуализации границ помогает осознать диапазон моделей, которые можно построить. Следующим критически важным этапом является обучение модели — выбор оптимальных параметров $w$ и $b$ с помощью функции потерь и градиентного спуска .