Как генеалогические тесты помогли поймать Убийцу из Золотого штата

Veritasium 9,9 млн 26 мин 9 мин 30.09.2021
Главное

В середине 2010-х годов дело «Убийцы из Золотого штата», терроризировавшего Калифорнию на протяжении десятилетия, казалось окончательно зашедшим в тупик. Однако технологический прорыв в потребительской генетике открыл для следствия принципиально новый путь. Ведущий научно-популярного канала Veritasium Дерек Маллер подробно разбирает, как с помощью открытых баз данных и ДНК дальних родственников удалось вычислить серийного убийцу, и почему этот триумф правосудия вызывает серьёзные споры о праве на конфиденциальность.

🎭 Хроника террора: от мелких краж до «Убийцы из Золотого штата» 0:00

История одного из самых опасных преступников Америки началась в середине 1970-х годов в небольшом калифорнийском городке Вайсейлия. Поначалу злоумышленник промышлял серийными кражами со взломом, за что получил прозвище «Вайсейлийский взломщик». Преступник похищал мелкие суммы, монеты и ювелирные украшения, однако вскоре его действия стали гораздо более агрессивными.

Спустя всего полгода, в 1976 году, он перебрался в Сакраменто. В течение следующих трёх лет география его преступлений расширилась на всю северную часть Калифорнии, где он совершил более 50 случаев сексуального насилия. В этот период пресса и полиция дали ему новое имя — «Насильник из восточного района».

В 1979 году преступник сместился в Южную Калифорнию, начав действовать в округе Санта-Барбара, где перешёл к убийствам. Там его стали называть «Оригинальным ночным сталкером». Лишь спустя годы следствие связало все эти преступления воедино, осознав, что за ними стоит один человек, ныне известный как «Убийца из Золотого штата».

Долгое время единственным связующим звеном для детективов оставался почерк преступника (modus operandi). Нападения были тщательно спланированы: он всегда носил маску или капюшон, шорты и футболку. Злоумышленник врывался в дома, где находились мужчина и женщина, связывал их, после чего клал на спину мужчины стопку тарелок. Он угрожал убить обоих, если услышит звон посуды, уводил женщину в другую комнату и совершал насилие. Перед уходом он мог часами обыскивать дом, есть продукты хозяев и забирать мелкие вещи.

Ему удавалось оставаться неуловимым, поскольку он никогда не оставлял отпечатков пальцев, всегда работая в перчатках и маске. Общий список его подтверждённых преступлений включает как минимум 12 убийств и 50 изнасилований. Серия внезапно оборвалась в 1986 году. По мнению Дерека Маллера, это не было случайностью: именно в 1986 году в криминалистике впервые раскрыли убийство с помощью ДНК-анализа. Ведущий предполагает, что преступник внимательно следил за новостями науки и понял, что оставляемые им биологические следы рано или поздно заставят его поплатиться.

🧬 Технологический тупик: почему федеральная база CODIS оказалась бессильна 3:27

Следователь Пол Хоулс, посвятивший выслеживанию убийцы десятки лет, подчёркивает, что преступник совершил одну роковую ошибку — он не мог предугадать стремительное развитие генетики и оставил свои биологические следы по всей Калифорнии. В распоряжении Хоулса оказались три нетронутых набора для сбора улик после сексуального насилия, из которых выделили чистый профиль ДНК преступника. Однако самого по себе ДНК-профиля было недостаточно, его требовалось с чем-то сравнить.

В 1990 году ФБР начало работу над национальной генетической базой данных CODIS (Combined DNA Index System), где хранятся профили осуждённых преступников и подозреваемых лиц. Идентификация в CODIS строится на анализе коротких тандемных повторов (STR) — участков ДНК, которые многократно дублируются в определённых хромосомах. Изначально лаборатории сравнивали данные по 13 маркерам, а в 2017 году их число расширили до 20.

Хотя Дерек Маллер отмечает, что такой объём информации кажется незначительным, вероятность совпадения всех маркеров у двух разных людей ничтожно мала. Сегодня база CODIS насчитывает более 18 миллионов профилей.

ДНК «Убийцы из Золотого штата» загрузили в CODIS ещё в 2001 году. С тех пор система проводила непрерывный поиск, но не выдала ни одного совпадения. Следствие задействовало даже базы Интерпола, предполагая, что убийца мог уехать из страны, но поиски не принесли результатов.

Причина неудачи крылась в фундаментальном ограничении системы: поиск по STR-маркерам в CODIS эффективен только для родственников первой и второй степени — то есть родителей, детей или родных братьев и сестёр. Чтобы проводить полноценный анализ более глубоких родственных связей, криминалистам требовалось исследовать значительно больше точек в геноме.

🔍 Эпоха SNP-маркеров: как устроена потребительская генетика 5:41

Параллельно с тупиком в криминалистике развивалась гражданская наука. После завершения проекта «Геном человека», в рамках которого учёные секвенировали 3 миллиарда нуклеотидов, на рынке появились частные компании, предлагающие ДНК-тесты напрямую потребителям. Эти тесты дают несоизмеримо больше данных, чем криминалистическая система ФБР.

Для изучения этой технологии Дерек Маллер посетил штаб-квартиру компании Family Tree DNA в Хьюстоне, Техас. Процесс анализа устроен следующим образом:

В основе таких тестов лежит использование специальных микрочипов (microarray), способных одновременно считывать данные 24 человек. На каждом чипе измеряется порядка 710 000 индивидуальных оснований ДНК (букв A, T, G, C), называемых SNP (однонуклеотидные полиморфизмы).

Дерек Маллер напоминает, что геном всех людей совпадает примерно на 99,9%, и различия между индивидами кроются лишь в оставшихся 3 миллионах оснований. Именно эти точечные изменения букв (SNP) определяют наши уникальные черты — например, за появление голубых глаз отвечает изменение всего одной буквы генома. На микрочипе размещены тысячи коротких отрезков ДНК, специфичных для конкретных SNP, что позволяет фиксировать вариации.

Результаты такого сканирования позволяют определять географическое происхождение человека, предрасположенность к заболеваниям и степень родства. Передача генетического материала похожа на перемешивание двух колод карт: ребёнок получает ровно половину от каждого из родителей, образуя длинные идентичные цепочки. У внуков с бабушками и дедушками совпадает уже около четверти «колоды», а блоки идентичных карт становятся короче.

Чтобы установить родство, нет необходимости читать весь геном целиком. Маркеры SNP распределены по ДНК примерно каждые 2000 оснований. Если при сравнении двух профилей обнаруживаются протяжённые участки с совпадающими SNP, можно с уверенностью утверждать, что и вся ДНК между ними идентична. Измеряя длину и количество этих совпадающих блоков, алгоритмы точно вычисляют степень родства.

🌳 Метод генеалогического древа: прорыв в деле Дианджело 10:27

Детективы понимали, что ключ к разгадке лежит за закрытыми дверями коммерческих гигантов вроде 23andMe и Ancestry.com, аккумулировавших миллионы профилей. Правоохранительные органы не имеют права проводить поиски в их закрытых базах, однако следователи нашли легальный обходной путь. Они обратились к независимому открытому сайту GEDmatch, созданному для того, чтобы люди могли добровольно загружать свои ДНК-данные для поиска родственников.

Когда специалисты загрузили очищенный профиль «Убийцы из Золотого штата» в базу GEDmatch, система выдала совпадения на уровне третьих кузенов (четвероюродных братьев или сестёр). Эти люди имели всего около 1% общей ДНК с убийцей, но этого хватило для старта.

Процесс вычисления преступника превратился в масштабное генеалогическое расследование:

  1. Из обнаруженных дальних родственников при помощи традиционной генеалогии начали выстраивать обратные семейные древа.
  2. Следователи использовали открытые источники: переписи населения, некрологи, старые газетные статьи и специализированные порталы вроде findagrave.com.
  3. Древа разных людей вели назад во времени, пока не пересеклись на одной паре общих прапрабабушки и прапрадедушки. Из этого следовал вывод: разыскиваемый маньяк является прямым потомком этой же семейной пары.

После этого начался обратный, куда более трудоёмкий процесс — идентификация всех без исключения потомков этих предков. В XIX веке (например, в 1840-х годах) в американских семьях стандартно рождалось по 15 детей, поэтому генеалогическое древо разрасталось в геометрической прогрессии и в итоге охватило более 1000 человек.

Для сужения круга подозреваемых следствие применило криминалистические фильтры. Детективы знали, что убийца — белый мужчина, родившийся примерно между 1940 и 1960 годами, его рост составляет от 5 футов 8 дюймов до 5 футов 10 дюймов, и он находился в Сакраменто в 1976 году и в Южной Калифорнии в 1980-х.

В результате огромный массив сократился всего до пяти мужчин. За ними установили наружное наблюдение. Полицейские выследили одного из подозреваемых у магазина Hobby Lobby в районе Сакраменто и тайно сняли образец ДНК с ручки двери его автомобиля. Спустя несколько дней они получили второй, подтверждающий образец с выброшенной им бумажной салфетки.

Анализ показал стопроцентное совпадение с ДНК с мест преступлений. Бывший офицер полиции Джозеф Джеймс Дианджело был арестован и идентифицирован как «Убийца из Золотого штата». Команда всего из шести человек раскрыла дело сорокачетырехлетней давности за четыре с половиной месяца.

⚖️ Проблема «стеклянного общества»: баланс между безопасностью и приватностью 14:05

Поимка Дианджело открыла шлюзы для раскрытия сотен других преступлений: еженедельно с помощью генетической генеалогии начали идентифицировать убийц по делам 1970–1980-х годов. На момент создания видео этим методом успешно раскрыли более 70 старых дел. Представители правоохранительных органов называют генетическую генеалогию самым революционным инструментом со времён внедрения дактилоскопии. При этом масштабы потенциальной работы огромны: в США насчитывается около 100 000 нераскрытых убийств и порядка 650 000 дел о сексуальном насилии, где у следствия есть образцы ДНК.

Однако у технологии есть пугающая обратная сторона, которую Дерек Маллер называет эффектом деанонимизации «вслепую». Раньше преступники без криминального прошлого могли чувствовать себя в безопасности, зная, что их ДНК никогда принудительно не изымалась. Теперь их судьба им не принадлежит: достаточно, чтобы тест сдал их троюродный или четвероюродный брат. По данным исследования Ancestry DNA, средний житель Великобритании имеет около 175 третьих кузенов, а каждый человек делит идентичные генетические блоки примерно с 1000 родственников в прошлом и будущем.

Статистика показывает, что для контроля над обществом не нужна всеобщая обязательная база данных:

По мнению критиков, человечество «в состоянии лунатизма» заходит в сценарий тотального генетического надзора. Главные опасения экспертов, разделяемые Дереком Маллером, связаны с возможной дискриминацией со стороны медицинских страховых компаний. Если данные попадут в руки страховщиков, они смогут выявлять предрасположенность к болезням (например, к болезни Паркинсона) и взвинчивать цены на полисы. Генетическую информацию, в отличие от кредитной карты, невозможно аннулировать или поменять.

После дела Дианджело в генеалогическом сообществе вспыхнул скандал, когда администрация GEDmatch нарушила собственные правила ради раскрытия нападения на пожилую органистку в Юте. Хотя женщина выжила (что формально не подпадало под условия работы полиции — только убийства и изнасилования), сайт предоставил доступ к данным. Под давлением возмущённых генеалогов GEDmatch сбросил настройки всех пользователей, обязав их вручную соглашаться на сотрудничество с полицией (opt-in). Позже сервис выкупила компания Verogen, и сегодня около 73% новых пользователей GEDmatch добровольно дают согласие на криминалистический поиск.

Пол Хоулс признаёт, что баланс между общественной безопасностью и правом на частную жизнь остаётся открытым и болезненным вопросом, который, по его мнению, неизбежно придётся решать Верховному суду США. На чашах весов находятся абстрактная уступка приватности из-за действий дальнего родственника и конкретное горе матери, чья дочь была убита. Технологии обогнали законодательство, вынуждая общество делать сложный коллективный выбор.

💬 Цитаты

«В конечном счёте этот инструмент и все связанные с ним опасения окажутся в Верховном суде страны.»

Дерек Маллер 24:31

«Кто-то, находящийся в дальнем родстве с правонарушителем, внёс свою ДНК в базу данных, и преступникам пора начинать нервничать.»

Дерек Маллер 15:53
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
STR (короткие тандемные повторы)
Повторяющиеся участки ДНК, количество которых уникально для каждого человека и используется в базе CODIS.
SNP (однонуклеотидный полиморфизм)
Отличия в ДНК в одну нуклеотидную букву, позволяющие определять дальнее родство.
CODIS
Федеральная база данных ДНК США, объединяющая профили осуждённых лиц.
📊 Цифры
🗓 Хронология
  1. 1976 Преступник начинает совершать налёты и изнасилования в Сакраменто под именем East Area Rapist.
  2. 1979 Злоумышленник перемещается в Южную Калифорнию и начинает совершать убийства.
  3. 1986 Преступная деятельность маньяка внезапно прекращается.
  4. 1990 ФБР начинает развёртывание криминалистической системы CODIS.
  5. 2001 ДНК Убийцы из Золотого штата загружается в базу CODIS, но совпадений нет многие годы.
  6. 2018 Благодаря сайту GEDmatch следователи вычисляют и арестовывают Джозефа Джеймса Дианджело.
⚖️ Другая сторона
Биология и медицина GEDmatch Джозеф Джеймс Дианджело Дерек Маллер криминалистика