Квантовый детектив: как физики Perimeter Institute учат ИИ искать причины, а не совпадения

Perimeter Institute 15,4 тыс. 1 ч 4 мин 10 мин 08.10.2020
Главное

Публичная лекция физиков Perimeter Institute Роберта Спеккенса и Эли Вулфа посвящена удивительному пересечению квантовой механики и теории причинно-следственного вывода. Ученые демонстрируют, как методы поиска скрытых связей, разработанные для дата-сайентистов, помогают решать фундаментальные загадки физики, и наоборот — как квантовый подход реформирует современный искусственный интеллект и медицину. Авторы предлагают взглянуть на физика-теоретика как на заправского детектива, расследующего преступления против логики, которые подстраивает нам природа.

🕵️‍♂️ Рождение причинно-следственного детектива 5:32

Роберт Спеккенс предлагает начать с новой научной области — причинно-следственного вывода (causal inference), развивающегося на стыке статистики и машинного обучения. Лучший способ понять суть работы исследователя в этой сфере — представить его в роли детектива. Уликами для такого сыщика служат статистические корреляции, а его главная цель — восстановить истинную историю о причинах и следствиях, стоящую за этими цифрами.

Пожарные и парадокс корреляции

Спеккенс иллюстрирует это классическим примером из «первого дня школы детективного дела»: анализом эффективности пожарных бригад при тушении имущества. Если собрать сырые данные, обнаружится странная позитивная корреляция: чем больше пожарных отправляется на объект, тем больший материальный ущерб в итоге фиксируется. Наивный наблюдатель мог бы сделать опасный вывод о том, что для минимизации ущерба нужно отправлять меньше спасателей.

Однако корреляция не означает причинно-следственную связь. Очевидным объяснением здесь выступает скрытая общая причина (common cause) — масштаб самого пожара. На крупные возгорания диспетчер посылает много машин, и там же фиксируется наибольший ущерб. Если стратифицировать (разбить) данные по размеру пожара, то внутри каждой отдельной группы корреляция сменится на противоположную, интуитивно понятную негативную корреляцию: чем больше пожарных борется с конкретным типом огня, тем меньше разрушений он приносит.

Медицинские дилеммы и ограничения экспериментов

Второй пример касается эффективности вымышленного лекарства. Статистика показывает, что среди принявших препарат выздоровели 79%, тогда как среди тех, кто его не принимал, — лишь 43%. Спеккенс предупреждает: даже здесь нельзя слепо верить корреляции. Потенциальной общей причиной может выступать «забота о здоровье» (health consciousness). Люди, склонные вести здоровый образ жизни, чаще выздоравливают сами по себе, и они же активнее ищут и принимают новые медикаменты.

Если этот фактор скрыт и не зафиксирован в картах, на помощь приходит классический инструмент — рандомизированное контролируемое исследование (РКИ). С помощью подбрасывания монетки пациентов делят на группы, разрывая связь между их личными качествами и приёмом лекарства. Но РКИ дороги, часто неэтичны (нельзя заставить людей курить для проверки рака) или физически невозможны, например, в астрофизике.

В качестве альтернативы Спеккенс описывает метод «инструментальных переменных». Если в разных странах действуют разные официальные рекомендации по лечению, и это влияет на приём лекарства, но никак не связано с личной заботой пациента о здоровье, то корреляция между рекомендацией и выздоровлением доказывает истинную каузальную силу препарата.

Экономика образования и скрытые переменные

Третий пример взят из экономики труда: связь между получением диплома и будущим уровнем зарплаты. Положительную корреляцию здесь можно объяснить скрытым фактором — врождёнными способностями (aptitude). Способный человек легче поступает в вуз и успешнее строит карьеру, даже если бы он не учился.

По мнению Спеккенса, в этой схеме часто присутствует прямая связь между статусом семьи (инструментом) и будущим доходом, минуя сам диплом (например, за счёт связей богатых родителей). Чтобы понять, имеет ли ценность само образование, исследователи используют математические ограничения — «инструментальные неравенства». Если статистическое распределение нарушает эти неравенства, это доказывает наличие неучтённых прямых каузальных связей.

Для глубокого погружения в тему Спеккенс рекомендует научно-популярную книгу:

🌌 Квантовый мир глазами Шерлока Холмса: теорема Белла 20:02

Роберт Спеккенс делится личной историей: около 10 лет назад он осознал, что многие концептуальные парадоксы квантовой механики проистекают именно из путаницы между корреляцией и причинностью. Каузальный подход полностью трансформировал его взгляды на квантовую теорию. Ярчайшим примером здесь выступает знаменитая теорема Белла, которую Спеккенс предлагает переформулировать как детективное расследование.

Три подозреваемых в квантовом деле

В эксперименте Белла источник создает две частицы, которые разлетаются в противоположные стороны к двум детекторам. На каждом детекторе экспериментатор может выбрать одну из двух настроек (0 или 1) и зафиксировать один из двух исходов (0 или 1). Квантовая теория предсказывает сильные корреляции между исходами, что неоднократно подтверждалось на практике. Каузальный детектив ищет структуру, способную это объяснить:

  1. Подозреваемый №1: Классическая общая причина. Предполагается, что частицы при рождении получают скрытые свойства, определяющие исходы. Математическим следствием такой структуры являются неравенства Белла. Однако квантовые корреляции их нарушают. Физик констатирует: этот подозреваемый вне подозрений, классическая общая причина невозможна.
  2. Подозреваемый №2: Сверхсветовое влияние. Настройка левого детектора мгновенно влияет на исход правого. Такая модель объясняет данные, но, как утверждает Спеккенс, она глубоко неестественна. Эксперимент можно поставить так, что сигнал должен был бы распространяться быстрее скорости света, что вступает в прямое противоречие с теорией относительности Эйнштейна. Физики не хотят жертвовать согласием между квантовой теорией и относительностью.
  3. Подозреваемый №3: Квантовая общая причина. Этот подозреваемый появился именно благодаря каузальному анализу. Структура графа остается прежней (есть общая причина), но сама природа этой причины меняется. Это больше не классическая переменная, а экзотический математический объект. По словам Спеккенса, квантовая механика требует от нас пересмотреть само фундаментальное понятие каузальности, точно так же, как теория относительности заставила пересмотреть понятия пространства и времени.

Мост между Беллом и Перлом

Спеккенс указывает на поразительное концептуальное единство между работами Джона Белла и Джуды Перла. Они использовали абсолютно одинаковые каузальные диаграммы и математические инструменты (неравенства), но для противоположных целей:

Более того, разработанные недавно инструментальные неравенства теперь успешно применяются в квантовых лабораториях для верификации экзотических квантовых состояний.

📈 От абстрактной теории к сложным системам 31:10

Эли Вулф продолжает тему, напоминая знаменитые слова Шерлока Холмса из произведений Артура Конан Дойля: «Когда вы исключите невозможное, то всё, что останется, даже самое невероятное, должно быть правдой». С этой точки зрения теорема Белла 1964 года — это чистокровный результат из области каузального вывода, опередивший свое время. Однако Джон Белл рассматривал простейший граф, тогда как реальная жизнь подбрасывает куда более сложные структуры.

Метод инфляции: универсальное оружие против ложных гипотез

Вулф демонстрирует примеры реальных каузальных графов из современных научных публикаций: схему из 9 переменных, описывающую влияние пола и гендера на потерю зубов в стоматологии; динамику экосистем в сельском хозяйстве; сложнейшие переплетения факторов прогрессирования болезней, рисков смертности и побочных эффектов в медицине.

Чтобы работать с системами любой сложности, команда исследователей из Perimeter Institute разработала мощный математический инструмент — метод инфляции (inflation technique). По утверждению Вулфа, этот алгоритм позволяет взять абсолютно любую каузальную диаграмму и рассчитать для неё строгие математические ограничения (неравенства). Если экспериментальные данные нарушают эти ограничения, гипотеза объявляется ложной. Это позволяет находить ранее неизвестные маркеры скрытых процессов.

Квантовые технологии и диагностика аппаратных «багов»

Вулф выделяет три ключевые причины, почему квантовые физики так увлечены каузальным выводом:

  1. Создание квантовых технологий. Нарушение неравенств Белла уже подарило миру квантовую криптографию, защищенную самими законами физики от перехвата. Переход к сложным графам необходим для проектирования квантового интернета, где переплетаются квантовая запутанность и классические слои передачи данных. Каузальный анализ позволяет инженерам четко понимать: работает ли их сеть на квантовых принципах или в ней есть скрытый дефект («баг»).
  2. Тестирование квантового «железа». При сборке квантовых компьютеров на базе металлических кубитов и магнитных полей возникает масса наведенных шумов и ошибок в архитектуре схем. Инструменты каузального моделирования позволяют проводить прецизионную диагностику: анализируя статистику выходов, алгоритм выявляет реальную физическую структуру процессов внутри чипа и локализует неисправности.
  3. Фундаментальное познание природы. Поскольку наша Вселенная фундаментально квантовая, Вулф настаивает, что при изучении микромира и сложных биохимических процессов ученые обязаны использовать квантовый каузальный вывод (quantum causal inference), допуская, что скрытые причины имеют квантовую природу.

🩺 Квантовый физик спасает британское здравоохранение 43:23

Чтобы доказать практическую ценность такого подхода для обычных людей, Эли Вулф рассказывает историю Кирона Гиллигана Ли (Kieron Gilligan Lee). Кирон учился в Perimeter Institute на магистерской программе под руководством Спеккенса, затем защитил докторскую диссертацию по квантовой теории в Оксфорде, после чего был нанят британской медицинской технологической компанией Babylon Health. Компания искала экспертов по каузальности для улучшения систем автоматической диагностики.

Ошибка искусственного интеллекта: почему диабет «вызывал» боль в груди

Babylon Health разработала мобильное приложение, в котором пользователь может перечислить свои симптомы чат-боту на базе искусственного интеллекта, а тот ставит предварительный диагноз. Кирон внедрил в систему строгий алгоритм каузального анализа и сравнил его работу со старым алгоритмом компании. Выяснилось, что старая нейросеть допускала критические логические ошибки.

Вулф приводит наглядный пример: пациент жалуется на острую боль в груди (стенокардию). Это симптом опасных состояний: инфаркта, легочной инфекции или коллапса легкого. Однако старый ИИ от Babylon Health при такой жалобе выдавал подозрение на... сахарный диабет.

Диабет физически не способен вызвать стенокардию. Причина сбоя крылась в каузальной путанице:

Ассоциация против контрфактического анализа

Старая нейросеть выдавала диабет просто потому, что это слово чаще всего встречалось в медицинских картах людей со стенокардией. По словам Вулфа, ИИ безупречно находил корреляцию (ассоциацию), но отвечал на в корне неверный вопрос. Система выдавала сопутствующее заболевание вместо первопричины.

Медицинский диагностический алгоритм должен отвечать на контрфактический вопрос: «Какое именно заболевание мне нужно вылечить, чтобы с максимальной вероятностью устранить имеющиеся симптомы?». Переход от простого поиска статистических паттернов машинного обучения к полноценному каузальному моделированию, осуществленный Кироном Гиллиганом Ли, позволил поднять точность диагностики Babylon Health сразу на 30%.

💬 Открытая дискуссия: нейросети, пандемия и советы молодым учёным 50:55

В финальной части лекции ведущий Грег Дик озвучивает вопросы от зрителей трансляции на YouTube, что выливается в глубокое обсуждение перспектив ИИ и уроков истории.

Почему нейросетям не обойтись без причинности

Отвечая на вопрос о том, нельзя ли просто «скормить» все данные глубокой нейросети и отказаться от каузальных моделей, Эли Вулф категоричен: без понимания причинности ИИ всегда будет выдавать лишь поверхностные ассоциации.

Роберт Спеккенс добавляет, что для создания сильного общего искусственного интеллекта (AGI) критически необходима прозрачность (transparency). Каузальные модели позволяют ИИ «объяснять» человеку логику своих решений: система способна просчитать последствия различных гипотетических интервенций и выбрать оптимальное действие. По мнению Спеккенса, ведущие мировые специалисты в области ИИ сегодня единогласно признают каузальный вывод обязательным компонентом будущих интеллектуальных систем.

Парадокс Симпсона в данных о COVID-19

Спеккенс отмечает, что каузальный анализ незаменим в борьбе с текущими кризисами, такими как пандемия COVID-19. В качестве примера он приводит реальное исследование статистических данных марта-апреля 2020 года по Китаю и Италии.

Сырые данные демонстрировали парадокс Симпсона: общий уровень смертности (case fatality rate) от коронавируса в Китае был ниже, чем в Италии. Однако если разбить данные по возрастным группам, выяснялось, что в каждой отдельной возрастной категории смертность в Италии была ниже, чем в Китае. Разгадка крылась в демографии: в Италии население в среднем намного старше, а пожилые люди каузально более уязвимы для вируса. Без инструментов каузального вывода политики и медики могли бы сделать в корне неверные выводы об эффективности мер в этих странах.

Уроки истории: как причинный вывод спас миллионы жизней

Спеккенс напоминает исторический прецедент: пятидесятилетнюю дискуссию (1900–1950 гг.) о связи курения и рака легких. Когда в 1950 году каузальные исследования выявили жесткую корреляцию между сигаретами и опухолями, великий статистик Рональд Фишер выступил с критикой, заявив, что корреляция не доказывает вину табака. Фишер предположил существование скрытого генетического фактора, который одновременно вызывает у человека тягу к курению и предрасположенность к раку.

Точку в споре поставил исследователь Джером Корнфилд. Он математически доказал: чтобы объяснить столь мощную корреляцию исключительно генетикой, этот гипотетический ген должен был бы обладать абсолютно нереальной, стопроцентной каузальной силой, полностью подавляющей влияние социума и окружения. Этот каузальный аргумент Корнфилда убедил медицинское сообщество. Спеккенс с сожалением констатирует: если бы полноценная теория каузального вывода была оформлена на несколько десятилетий раньше, человечество смогло бы спасти миллионы жизней гораздо быстрее.

Напутствие будущим физикам

Для школьников и студентов, мечтающих заниматься наукой, Эли Вулф дает практичный совет: не бояться и писать ученым напрямую («холодные письма»). Сам Вулф оказался в Perimeter Institute после того, как прочитал статью Спеккенса, восхитился ею, нашел спорные моменты и написал профессору на почту, что вылилось в многолетнее сотрудничество. Спеккенс поддерживает коллегу, призывая много читать и глубоко копать в темы, которые по-настоящему зажигают интерес.

В завершение лекции Вулф, отвечая на полушутливый вопрос ведущего о Шерлоке Холмсе, выражает уверенность: знаменитый сыщик определенно стал бы блестящим квантовым физиком, ведь квантовая теория полна таких тайн, мимо которых истинный детектив просто не смог бы пройти.

💬 Цитаты

«Уликами для каузального детектива служат статистические корреляции, а его главная цель — восстановить истинную историю о причинах и следствиях.»

Роберт Спеккенс 06:24

«Квантовая механика требует от нас пересмотреть само фундаментальное понятие каузальности, точно так же, как теория относительности заставила пересмотреть понятия пространства и времени.»

Роберт Спеккенс 27:08

«Если мы используем машинное обучение без причинности, мы получаем ассоциацию, а не каузальные выводы. Зачем соглашаться на ассоциацию?»

👥 Спикеры
📚 Упомянутые книги
📖 Термины
Причинно-следственный вывод (Causal Inference)
Область статистики и машинного обучения, изучающая методы установления истинных каузальных связей на основе наблюдений.
Рандомизированное контролируемое исследование (РКИ)
Эксперимент, в котором участники распределяются по группам случайно, что исключает влияние скрытых общих причин.
Инструментальная переменная
Внешний фактор, который влияет на исследуемую причину, но не связан со скрытыми общими причинами следствия.
Теорема Белла
Физическая теорема, доказывающая невозможность объяснить квантовые корреляции с помощью классических скрытых параметров.
Метод инфляции
Математический алгоритм, разработанный для вывода ограничений и проверки гипотез в сложных каузальных сетях.
Парадокс Симпсона
Статистический эффект, при котором направленность связи между признаками меняется на противоположную при объединении групп данных.
📊 Цифры
🗓 Хронология
  1. 1950 Публикация масштабного исследования, показавшего сильную корреляцию между курением и раком легких.
  2. 1964 Джон Белл формулирует свою знаменитую теорему, заложившую основы квантового каузального анализа.
  3. 2008 Роберт Спеккенс присоединяется к команде исследователей Perimeter Institute.
  4. 2014 Эли Вулф начинает работу в качестве научного сотрудника в Perimeter Institute.
  5. 2020 Всплеск исследований по анализу данных COVID-19 с применением методов причинно-следственного вывода.
⚖️ Другая сторона
Математика и физика Роберт Спеккенс Эли Вулф Perimeter Institute Теорема Белла causal inference