Стэнфорд о методах вероятностного вывода: Байесовские сети

Stanford Online 615 1 ч 15 мин 2 мин 09.03.2026
Главное

🤖 Вероятностный вывод в байесовских сетях: от точных методов к сэмплированию 0:05

Лекция 13 курса Stanford CS221 посвящена методам байесовских сетей — мощного инструмента для представления мира и неопределенностей в нем. В качестве отправной точки используется концепция совместного распределения вероятностей как некой «базы данных». Хотя точный вывод путем формирования этого распределения математически корректен, он становится вычислительно невозможным при наличии большого количества переменных (например, $2^{100}$ комбинаций для 100 переменных). Для решения этой проблемы используются методы аппроксимации: сэмплирование с отклонением (rejection sampling) и сэмплирование Гиббса (Gibbs sampling).

🎲 Аппроксимация: от сэмплирования с отклонением к методу Гиббса 10:15

Сэмплирование с отклонением основано на идее прогона вероятностной программы, которая возвращает выборку из совместного распределения, после чего отбрасываются все результаты, не удовлетворяющие условиям задачи. Однако, по мнению лектора, этот метод крайне неэффективен, если evidence (свидетельство) встречается редко — можно провести миллионы итераций и не получить ни одного подходящего события.

Метод Гиббса — это итеративный подход, который является частным случаем алгоритмов цепей Маркова — Монте-Карло (MCMC).

🛠 Оптимизация: Марковское одеяло 39:37

Для ускорения вычислений в методе Гиббса используется концепция «марковского одеяла» (Markov blanket). Суть идеи заключается в том, что при обновлении значения конкретной переменной нет нужды учитывать всю байесовскую сеть целиком — достаточно ограничиться её «соседями».

🔗 Условная независимость и анализ графов 58:41

Важной частью работы с байесовскими сетями является понимание независимости переменных, которая тесно связана со структурой графа. Лектор подчеркивает, что визуальная связность не всегда означает статистическую зависимость (и наоборот).

Для определения того, являются ли две переменные условно независимыми при заданных условиях, применяется алгоритм работы с графами:

  1. Закрасить (учесть) узлы-свидетели.
  2. Рекурсивно удалить все незакрашенные «листья» графа.
  3. Соединить родителей узлов (процесс, который лектор называет «женитьбой родителей»).
  4. Проверить, существует ли путь между интересующими переменными, не проходящий через закрашенные узлы.

Если такой путь отсутствует, переменные считаются условно независимыми. Этот графический подход позволяет эффективно анализировать сложные сети, не прибегая к тяжелым вычислениям с тензорами.

💬 Цитаты

«Это как бег в мешках: ты привязан к другому человеку и не можешь двигаться, пока не начнет двигаться он.»

Лектор Stanford Online 56:47
👥 Спикер
📖 Термины
Марковское одеяло
Множество узлов в байесовской сети, включающее родителей и детей конкретного узла, достаточное для определения его условного распределения.
Сэмплирование Гиббса
Итеративный алгоритм MCMC, используемый для получения последовательности выборок из многомерного вероятностного распределения.
Evidence (свидетельство)
Набор наблюдаемых данных или переменных, на основе которых производится вероятностный вывод.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Bayesian Networks Gibbs Sampling Rejection Sampling Markov Blanket