Ученые на World Science Festival обсудили влияние теории вероятностей на ИИ

World Science Festival 535 тыс. 1 ч 23 мин 15 мин 03.11.2015
Главное

Каким образом математические прозрения малоизвестного пресвитерианского священника XVIII века стали фундаментом для создания современного искусственного интеллекта? На этот и многие другие вопросы ответили ведущие мировые ученые, собравшиеся на Всемирном фестивале науки (World Science Festival), чтобы обсудить глубинное влияние теории вероятностей на физику, медицину, робототехнику и нашу повседневную жизнь. Дискуссия продемонстрировала, как человечество постепенно отказывается от иллюзии строгого детерминизма в пользу гибкого вероятностного мышления.

🎲 Теорема Байеса: как преподобный XVIII века изменил искусственный интеллект 0:00

История современных технологий уходит корнями в глубь XVIII столетия, когда английский пресвитерианский священник Томас Байес попытался математически описать процесс выведения образованных догадок в условиях жесткого дефицита информации. Байес ушел из жизни, так и не успев опубликовать свои труды, однако его друг, философ Ричард Прайс, обнаружил записные книжки покойного и в 1763 году издал его теорию в научном журнале, после чего успешно применил ее для реформирования страхового бизнеса. Позже, в 1812 году, французский математик Пьер-Симон Лаплас развил эти идеи в полноценный математический аппарат, известный сегодня как условная вероятность.

Суть байесовского подхода заключается в постоянном обновлении первоначальной гипотезы по мере поступления новых объективных данных. Классическим примером, иллюстрирующим силу условной вероятности, является расчет точности медицинских тестов. Представим гипотетический сценарий: вероятность заразиться лихорадкой денге во время недельного отпуска на Бермудских островах составляет всего 1 на 10 000 (или 0,01%). Вернувшись домой, турист проходит тест на вирус, точность которого составляет внушительные 99,9%. Тест оказывается положительным. Большинство людей в такой ситуации впадают в панику, однако трезвый байесовский анализ показывает совершенно иную картину.

В рамках большой популяции на каждого одного больного человека приходится 99 999 здоровых. Если все они пройдут тест с точностью 99,9%, то прибор безошибочно определит одного реального носителя инфекции (99,9% от 1), но при этом выдаст ложноположительный результат для 0,1% здоровых людей, что составит ровно 10 человек (0,1% от 99 999 округленно). Таким образом, из 11 человек, получивших пугающий положительный результат, болен будет лишь один. Реальная вероятность того, что данный конкретный пациент действительно заражен, составляет всего 1 из 11, то есть около 9%, а вовсе не 99,9%. Этот абстрактный пример имеет колоссальное практическое значение: в реальной медицинской практике аналогичные математические драмы разворачивались в 1980-х годах вокруг тестирования на ВИЧ.

Несмотря на очевидную практическую пользу, концепция условной вероятности на протяжении долгого времени сталкивалась с жестким сопротивлением сторонников частотного подхода. Частотническая школа утверждает, что истинную вероятность события можно определить исключительно на основе огромных массивов твердых, объективных экспериментальных данных. Если подбросить монету один раз, и она упадет орлом, делать вывод о ее стопроцентной склонности к орлу глупо; необходимо совершить тысячи бросков, чтобы статистика приблизилась к заветным 50%. Частотническая вероятность требует многократного повторения эксперимента, в то время как байесовский метод позволяет действовать в ситуациях, когда действовать приходится вслепую.

Именно поэтому легендарный британский математик Алан Тьюринг во время Второй мировой войны обратился к байесовскому анализу, чтобы взломать шифры секретных немецких радиопередач, включая сообщения, исходившие непосредственно от Гитлера. Долгое время академическое противостояние продолжалось, пока в 1980-х годах исследователи искусственного интеллекта не уперлись в тупик детерминизма. Попытки запрограммировать машины жесткой логикой «если X истинно, то происходит Y» терпели крах из-за бесконечного числа случайных переменных реального мира. Ситуацию в 1988 году в корне изменил ученый Джуда Перл, который перезапустил индустрию искусственного интеллекта, внедрив в компьютерные алгоритмы байесовские вероятностные сети. В результате в 2011 году суперкомпьютер Watson от IBM смог разгромить людей в интеллектуальном телешоу Jeopardy!, оперируя внутри своего процессора байесовскими цепочками рассуждений.

🏛️ От теории к практике: парадоксы теории вероятностей в реальной жизни 5:47

Модератор дискуссии Джон Хоккенбери открыл встречу с наглядной демонстрации случайности, бросая теннисные мячи в зрительный зал. По его словам, люди сталкиваются с вероятностями ежесекундно, однако их интуитивная оценка шансов часто оказывается ошибочной. Хоккенбери иронично заметил, что вероятность победы хоккейной команды «Рейнджерс» в решающем седьмом матче после череды триумфов вчера вечером внезапно оказалась равной нулю. Он также поделился личной историей: у него дома подрастают две пары близнецов — три девочки и один мальчик. Окружающие часто изумляются, спрашивая, какова была вероятность такого события, на что Хоккенбери неизменно отвечает: «Внутри моего дома эта вероятность составляет ровно 100%».

В состав экспертной панели вошли ведущие специалисты из самых разных областей науки:

Хоккенбери в шутку добавил, что уровень понимания теории вероятностей у этих ученых настолько высок, что, появись они в казино Лас-Вегаса, их незамедлительно арестовали бы и доставили в аэропорт. При этом ведущий обратил внимание на важный аспект: вероятность того, что среди участников дискуссии окажется кто-то, кроме белых мужчин, в данный момент равна нулю. По мнению Хоккенбери и всех присутствующих ученых, академическое сообщество обязано целенаправленно работать над повышением вероятности предоставления равных возможностей в науке для женщин и представителей различных социодемографических групп.

🌌 Квантовая вероятность: мир суперпозиции и кошачьих парадоксов 10:49

Переходя к фундаментальным основам физики, Масуд Мохсени подчеркнул, что квантовая вероятность кардинально отличается от всего, с чем человек сталкивается в макромире. Законы квантовой механики, управляющие поведением атомов и молекул в субатомном масштабе — это не абстрактная математическая модель, а фундаментальная причина, объясняющая, почему вообще существует стабильная материя и мы сами.

Главной иллюстрацией этого феномена служит знаменитый двухщелевой эксперимент. Если в классическом мире взять пулемет и начать беспорядочно стрелять по стене с двумя вертикальными прорезями, пули будут пролетать либо через первую, либо через вторую щель, формируя на экране позади стены две отчетливые зоны максимальной концентрации попаданий. Однако если заменить пулемет на электронную пушку и начать стрелять одиночными электронами, на регистрирующем экране возникнет интерференционная картина в виде чередующихся темных и светлых полос. Электрон начинает вести себя как волна. Согласно квантовой теории, в отсутствие наблюдения частица фактически проходит через обе щели одновременно.

Масуд Мохсени пояснил, что в квантовых вычислениях это свойство позволяет кодировать информацию в виде суперпозиции состояний нуля и единицы. В классическом компьютере бит может находиться строго в одном состоянии в единицу времени, тогда как квантовый кубит пребывает в обоих состояниях сразу, пока не осуществлено измерение.

Для наглядности исследователь из Google привел пример с Нью-Йоркской публичной библиотекой:

«Представьте, что в библиотеке среди миллиона книг кто-то случайным образом сделал пометку на первой странице одной-единственной книги и спрятал ее. Классическому человеку, чтобы найти эту книгу, в среднем потребуется проверить половину фонда — около 500 тысяч книг. Квантовый же субъект способен разделиться на миллион виртуальных копий, войти в состояние суперпозиции, одновременно проверить все книги, обменяться результатами в виртуальном пространстве и выдать точный ответ всего за одну тысячу попыток. Это дает доказанное квадратичное ускорение, известное как алгоритм квантового поиска Гровера».

Разговаривая о суперпозиции, ученые неизбежно затронули знаменитый мысленный эксперимент Эрвина Шрёдингера с котом, предложенный физиком в 1935 году в качестве ответа на Эйнштейновский EPR-парадокс. Мохсени напомнил механику этого парадокса: радиоактивный распад атома является абсолютно вероятностным событием. Если поместить атом в закрытый ящик вместе со счетчиком Гейгера, который при фиксации распада разбивает ампулу с ядовитым газом, находящийся там же кот до момента открытия ящика будет пребывать в физическом состоянии суперпозиции — он одновременно и жив, и мертв.

Сегодня компания Google пытается извлечь практическую пользу из этих парадоксальных квантовых состояний. Мохсени продемонстрировал слайд с рефрижератором растворения — массивной установкой, охлаждающей квантовый чип до температур, близких к абсолютному нулю, для достижения эффекта сверхпроводимости. В Лаборатории квантового ИИ Google экспериментируют с массивом сверхпроводящих контактов на базе процессора от компании D-Wave. По словам Мохсени, помимо алгоритма Шора, обеспечивающего экспоненциальное ускорение при факторизации больших чисел, квантовые процессоры открывают революционные возможности для квантового машинногольного обучения. Джон Хоккенбери в шутку поинтересовался, какова вероятность того, что Google тайно зальет жидкий азот в смартфоны пользователей, на что Мохсени твердо ответил: «Ноль».

👧 Загадка «девочки по имени Флорида» и ловушки нашего разума 31:22

Леонард Млодинов продолжил тему условной вероятности, отметив, что крупнейшие корпорации, такие как Google, непрерывно анализируют пользовательские данные, высчитывая индивидуальные вероятности реакции на рекламу именно на основе байесовской статистики. Чтобы продемонстрировать, насколько человеческий разум пасует перед теорией вероятностей, Млодинов предложил разобрать две классические математические загадки.

Первая — знаменитая «задача о двух дочерях». Представим деревню, в которой живут 4000 семей, в каждой из которых по два ребенка. По законам распределения шансы делятся поровну:

Если нам доподлинно известно, что в выбранной наугад семье есть как минимум одна дочь, какова вероятность того, что у них две девочки? Дополнительная информация позволяет полностью исключить из рассмотрения сегмент семей с двумя мальчиками. Остается 3000 семей, из которых две девочки воспитываются лишь в 1000. Таким образом, верный ответ — 1 из 3 (или 33,3%), что часто шокирует людей, интуитивно ожидающих увидеть 50%.

Вторая загадка — «девочка по имени Флорида» — доводит этот парадокс до абсурда. Условия те же: в семье двое детей, один из которых — девочка, но теперь добавляется крошечная деталь: её зовут Флорида. Считается, что это крайне редкое имя, встречающееся с частотой, например, 1 на 1000 девочек. Изменяет ли знание имени итоговую вероятность того, что в семье две девочки? Аудитория в зале разделилась, посчитав упоминание имени отвлекающим шумом и трюком.

Однако Млодинов математически доказал обратное. Если провести детальное дробление выборки с учетом редкого имени, выяснится следующее: среди 1000 семей с двумя девочками имя Флорида будет носить либо первая дочка (1 случай), либо вторая (1 случай). Вероятностью того, что обеих дочерей назовут Флоридой, из-за её ничтожности можно пренебречь. В сегментах с одним ребенком-девочкой (МД и ДМ) также окажется по одной семье, где девочку зовут Флорида.

В итоге в масштабах всей деревни останется всего 4 семьи, где есть хотя бы одна дочь по имени Флорида, и в 2 из этих 4 семей детей будет двое девочек. Вероятность мгновенно взлетает с 1/3 до 1/2 (50%). По объяснению Млодинова, обладание редким именем требует «большего критического объема» девочек в популяции, что автоматически смещает математическое ожидание в пользу многодетных девичьих семей. Млодинов добавил, что в ходе исторических исследований обнаружил любопытный факт: в определенный период в Шотландии каждую четвертую девочку звали Мэри, и при изменении переменной вероятности имени математическая модель плавно возвращает результат от 1/2 обратно к 1/3, исключая любые логические противоречия.

В качестве интермедии ученые разыграли на сцене классический парадокс Монти Холла, пригласив студентку из Нью-Йоркского университета по имени Лорен. Ей предложили выбрать одну из трех дверей, за одной из которых скрывался автомобиль. Лорен выбрала дверь №3. После этого ведущий открыл пустую дверь №2 и предложил девушке изменить свое решение и переключиться на дверь №1. Лорен отказалась, сославшись на то, что тройка — ее любимое число, и в результате проиграла. Как пояснил Млодинов, стратегия смены двери удваивает шансы на успех (до 2/3), поскольку действия ведущего не являются случайными — Монти Холл намеренно избегает открытия двери с автомобилем, тем самым вливая в систему новую ценную информацию.

🧬 Медицинская геномика: иллюзия генетического детерминизма 40:44

В сфере здравоохранения теория вероятностей сегодня производит подлинную революцию, ломая устоявшиеся стереотипы. Доктор Роберт Грин отметил, что исторически медицина опиралась на жесткий генетический детерминизм. Первые открытые заболевания, такие как болезнь Хантингтона или фенилкетонурия (ФКУ), развивались со стопроцентной гарантией при наличии соответствующих мутаций. Однако подавляющее большинство современных генетических маркеров указывают исключительно на вероятностные риски, а не на гарантированный приговор.

Ярким примером манипуляции общественным восприятием через статистику служат социальные ролики. Грин привел в пример известную социальную рекламу с участием актрисы Фелисити Хаффман, заявляющей, что «одна из восьми женщин заболевает раком груди». С точки зрения эпидемиологии это чистая правда, но с колоссальной оговоркой: этот показатель отражает совокупный риск в течение всей жизни женщины. Данные Национального института рака США (NCI) демонстрируют совершенно иную возрастную динамику:

Грин продемонстрировал на слайде результаты собственного геномного профилирования. Тесты выявили у него повышенный риск развития мерцательной аритмии, рака простаты и венозной тромбоэмболии. При этом в графе «целиакия» его риск превышал средний в 1,98 раза, хотя абсолютная вероятность стремилась к нулю. Генетик пояснил, что это иллюстрирует критически важную разницу между кумулятивным (абсолютным) и относительным рисками. Если реклама пугает тем, что ваш риск заболеть рассеянным склерозом вырос в 3 раза, это звучит ужасно, но если базовый риск в популяции равен 1%, то ваш индивидуальный риск составит всего 3%, что по-прежнему ничтожно мало.

«Мы невероятно плохи в восприятии вероятностей в медицине, мы до сих пор во многом мыслим на уровне средневековых пиявок, — признал доктор Грин. — Расшифровка генома — это не чтение книги судеб. Нам предстоит переварить колоссальные массивы данных, учитывая, что в геноме человека содержится 3 миллиарда пар оснований, где мы находим около 5 миллионов индивидуальных вариантов. Существует огромная вероятность банальных ошибок при секвенировании, ложной интерпретации патогенности мутаций и непредсказуемого влияния эпигенетики, микробиома и окружающей среды».

В подтверждение слов коллеги Леонард Млодинов поделился глубоко личной историей из 1980-х годов. Проходя рутинный тест для оформления страховки, он неожиданно получил положительный результат на ВИЧ. Его лечащий врач с прискорбием сообщил, что вероятность ошибки теста составляет всего 1 на 1000 (0,1%), фактически приговорив молодого ученого к смерти. Млодинов, будучи математиком, даже находясь в состоянии шока, сумел просчитать байесовскую условную вероятность.

В те годы базовая вероятность заражения ВИЧ для гетеросексуального мужчины без факторов риска составляла примерно 1 на 10 000. Доктор перепутал частоту ложноположительных результатов с реальной точностью диагноза в конкретных условиях. Из 10 000 аналогичных людей тест выявил бы одного реального больного и выдал бы 10 ложных срабатываний у здоровых. Настоящий шанс Млодинова оказаться больным составлял лишь 1 из 11 (около 9%). Повторный анализ полностью подтвердил его правоту — тест был ошибочным.

🤖 Робототехника и алгоритм SLAM: как машины ориентируются в хаосе 56:47

Современная робототехника и беспилотный транспорт также неспособны функционировать в рамках старой детерминистической парадигмы. Как объяснил Аллан Питерс, сама по себе конструкция автомобиля или робота строго детерминирована. Однако окружающий мир глубоко стохастичен и зашумлен.

Основополагающая аксиома автономных систем, по словам Питерса, звучит так: «Движение структурирует восприятие, а восприятие структурирует движение». Если беспилотный автомобиль зафиксирует статичную картинку, он не сможет адекватно оценить дорожную обстановку. Но как только машина начинает движение, сенсоры фиксируют изменение перспективы: припаркованные автомобили начинают смещаться назад относительно робота, в то время как движущиеся сохраняют позицию или меняют её иначе. Динамика позволяет алгоритмам мгновенно сужать вероятностное распределение и отсекать ложные гипотезы.

Питерс попытался объяснить сложнейшее рекурсивное уравнение локализации на обычном языке, признав, что английский язык категорически не подходит для описания подобных математических структур. Процесс можно описать на бытовом примере: вы выходите из метро на станции Юнион-сквер и видите перед собой аптеку Walgreens. Опираясь только на этот зрительный факт, вы дезориентированы, поскольку аптека находится на пересечении нескольких путей, и вы можете стоять как перед Food Emporium, так и перед Best Buy. Но если ваш мозг задействует память о том, через какой именно выход вы только что поднялись, неопределенность мгновенно схлопывается до единственной верной локации. Ваша уверенность базируется на комбинации текущего наблюдения, памяти о предыдущем действии и изначальном убеждении.

На этом принципе построена классическая робототехническая «задача о похищенном роботе» (Kidnapped Robot Problem). Робота внезапно помещают в неизвестный коридор здания, у него есть внутренняя карта, но он не знает своей начальной точки. Продвигаясь вперед, робот сканирует двери: обнаружение первой двери порождает несколько пиков вероятности на карте. Движение дальше мимо пустых стен отсекает часть вариантов. Когда робот натыкается на вторую дверь, расположенную на специфическом расстоянии от первой, массив данных сопоставляется с картой, и машина со стопроцентной точностью локализует себя в пространстве.

Ещё более сложной технологией является алгоритм SLAM (Simultaneous Localization and Mapping) — одновременная локализация и построение карты. В условиях, когда у робота вообще нет карты объекта, он вынужден одновременно формировать математическую модель окружения через свои датчики и непрерывно высчитывать собственные координаты в этой строящейся вселенной.

Питерс также рассказал о применении теории вероятностей при обучении роботов Robonaut для NASA: прямое управление машиной через VR-очки и перчатки физически изматывало операторов, поэтому ученые внедрили алгоритмы автономного обучения. Робот многократно повторял задачу под управлением человека, рассчитывал статистику микродвижений и в итоге самостоятельно генерировал предсказания для автономного выполнения операций. Аналогичные вероятностные расчеты лежат в основе удержания равновесия знаменитого четырехногого робота BigDog от Boston Dynamics, чьи ноги ежесекундно просчитывают оптимальные точки опоры на скользкой или неровной поверхности.

🔮 Философия случайности: удача, свобода воли и многомерные вселенные 1:14:20

В финальной части дискуссии ученые ответили на острые вопросы из социальных сетей. Один из пользователей Twitter поинтересовался, имеет ли понятие удачи реальный математический смысл и не является ли свобода воли иллюзией. Комментируя этот философский вызов, Леонард Млодинов привел ироничную аналогию с Уолл-стрит: если тысяча управляющих взаимных фондов будут подбрасывать монетку, чисто статистически среди них обязательно найдутся те, у которых раз за разом будет выпадать орел. Они получат многомиллионные бонусы и признание коллег, хотя их успех обусловлен исключительно законами распределения случайных величин в большой выборке.

Отвечая на вопрос о квантовой суперпозиции и параллельных вселенных, Масуд Мохсени пояснил, что многомировая интерпретация действительно предполагает физическое расщепление Вселенной на альтернативные конфигурации при каждом квантовом событии. В такой модели в одной вселенной кот Шрёдингера жив, а в другой — мертв. Однако сам Мохсени признался, что является сторонником классической Копенгагенской интерпретации, которая рассматривает квантовую механику прагматично — исключительно как строгий математический формализм для предсказания результатов конкретных физических экспериментов.

В завершение эксперты сошлись во мнении, что человечество переживает фундаментальный цивилизационный сдвиг. Классический детерминизм Исаака Ньютона, описывавший Вселенную как точные часы, уступает место пониманию того, что реальный мир наполнен неустранимым шумом и хаосом. Прогресс в медицине, по словам доктора Грина, сегодня напрямую связан с переходом в эру больших данных, примером чему служит запуск национальной базы данных Precision Medicine Initiative, аккумулирующей геномы одного миллиона граждан для точного расчета априорных вероятностей.

Масуд Мохсени подытожил, что в условиях нарастающей сложности технологий людям необходимо учиться хеджировать риски подобно управляющим хедж-фондов, просчитывая все сценарии развития своей жизни и карьеры. Леонард Млодинов призвал общество к философскому спокойствию и умению «немного расслабиться». По его мнению, люди склонны приписывать личным заслугам успехи, созданные слепой удачей, и чрезмерно винить себя за провалы, продиктованные случайным стечением обстоятельств.

В качестве финального напутствия Млодинов процитировал легендарного пионера компьютерной индустрии Томаса Уотсона: «Если вы хотите преуспеть, вам нужно пройти через огромное количество неудач». Вероятность успеха — это функция от числа совершенных попыток, и единственный способ обыграть судьбу — продолжать действовать.

💬 Цитаты

«Представьте, что в библиотеке среди миллиона книг кто-то случайным образом сделал пометку на первой странице одной-единственной книги и спрятал ее... Квантовый же субъект способен... выдать точный ответ всего за одну тысячу попыток.»

Масуд Мохсени 16:06

«Мы невероятно плохи в восприятии вероятностей в медицине, мы до сих пор во многом мыслим на уровне средневековых пиявок.»

Роберт Грин 53:41

«Если вы хотите преуспеть, вам нужно пройти через огромное количество неудач.»

Леонард Млодинов 1:23:04
👥 Спикеры
📚 Упомянутые книги
📖 Термины
Условная вероятность
Вероятность наступления одного события при условии, что другое событие уже произошло.
Суперпозиция
Способность квантовой частицы одновременно находиться в нескольких альтернативных состояниях до момента измерения.
Ложноположительный результат
Ошибка диагностического теста, при которой здоровый пациент ошибочно классифицируется как больной.
Алгоритм SLAM
Метод автономного картирования и локализации робота в незнакомой среде в режиме реального времени.
Эпигенетика
Область генетики, изучающая изменения активности генов, не связанные с нарушением первичной структуры ДНК.
📊 Цифры
🗓 Хронология
  1. 1763 год Ричард Прайс посмертно публикует революционные математические заметки Томаса Байеса об оценке вероятностей.
  2. 1812 год Пьер-Симон Лаплас развивает теорию Байеса в математический аппарат условной вероятности.
  3. 1935 год Эрвин Шрёдингер формулирует мысленный эксперимент с котом в ответ на EPR-парадокс Эйнштейна.
  4. 1988 год Джуда Перл совершает прорыв в сфере искусственного интеллекта благодаря внедрению байесовских сетей.
  5. 2011 год Суперкомпьютер IBM Watson побеждает людей в телевикторине Jeopardy! за счет вероятностных алгоритмов.
⚖️ Другая сторона
Математика и физика Томас Байес Леонард Млодинов Google Quantum AI алгоритм SLAM Джуда Перл