Закир Думеримик: «Пакеты данных в интернете идут по самому дешевому пути, а не по кратчайшему»

Stanford Online 4,2 тыс. 54 мин 5 мин 04.02.2025
Главное

Современный интернет давно перестал быть просто набором протоколов и кабелей, превратившись в сложнейшую экосистему, где пересекаются интересы государств, корпораций и миллиардов пользователей. Закир Думеримик, профессор компьютерных наук Стэнфордского университета, посвятил свою карьеру эмпирическому изучению этой глобальной сети, используя инструменты крупномасштабного сканирования для выявления скрытых закономерностей. В рамках вебинара Stanford Online ученый рассказал, как на самом деле движутся пакеты данных, почему безопасность в офисах ниже, чем дома, и как бизнес-интересы диктуют архитектуру мировой паутины.

🔍 Эмпирический подход к изучению цифрового хаоса 4:30

Изучение интернета осложняется его децентрализованной природой: сотни тысяч сетей управляются разными операторами, от гигантов вроде AT&T до локальных провайдеров . По словам Закира Думеримика, не существует единого центра сбора данных, поэтому ученым приходится строить собственные системы измерения для анализа реального поведения сети.

Методология исследований лаборатории Думеримика включает:

Примером инновационного подхода стало изучение спутниковых сетей Starlink . Вместо того чтобы покупать тысячи терминалов, команда Думеримика научилась измерять задержки пакетов (latency) между Стэнфордом и оконечными точками спутниковой связи, анализируя тысячи подключений одновременно . Это позволило выявить регионы с аномальной производительностью, не соответствующей теоретическим моделям.

🤖 Роль машинного обучения в безопасности 9:44

В условиях, когда пространство адресов IPv6 составляет $2^{128}$ (что сопоставимо с числом атомов в известной Вселенной), традиционные методы поиска устройств не работают . По мнению Закира Думеримика, машинное обучение (ML) становится критически важным инструментом для классификации данных:

  1. Идентификация устройств: ML помогает отличить обычный роутер от промышленного контроллера или веб-сервера, даже если их интерфейсы на разных языках .
  2. Детекция угроз: алгоритмы позволяют отличить трафик обычного сотрудника, работающего из дома, от действий злоумышленника, захватившего ту же машину .
  3. Поиск паттернов: системы обучаются находить устройства по косвенным признакам — например, по специфическим портам, используемым в конкретных сетях .

Исследователи используют инструменты собственной разработки: сканер ZMap (на который приходится большинство сканирований в интернете), а также ZGrab и ZDNS . Новая система Retina позволяет анализировать трафик крупных провайдеров для оценки состояния криптографии в масштабе всей сети .

🛡️ Парадокс безопасности: офис против дома 16:03

Одно из самых масштабных исследований команды Думеримика — «Worldwide view of the World Wide Web» — выявило неожиданную закономерность в поведении пользователей . Вопреки расхожему мнению, безопасность интернет-соединений в ночное время и в выходные дни выше, чем в рабочие часы .

Причины этого парадокса:

Также исследование зафиксировало четкое разделение устройств: мобильный трафик доминирует в сфере развлечений по вечерам, в то время как десктопы остаются основным инструментом для бизнес-задач в рабочие часы .

💰 Экономика пакетов: «дешевый путь» вместо «кратчайшего» 28:48

Классическое академическое представление об интернете как об иерархической структуре, где пакеты всегда идут по кратчайшему пути через протокол BGP, устарело. Закир Думеримик утверждает, что сегодня пакеты движутся по самому дешевому, а не самому короткому маршруту .

Ключевые изменения в инфраструктуре:

Таким образом, ядро интернета перестает быть общественным достоянием и превращается в арену жестких коммерческих переговоров, где стоимость передачи данных определяет маршрут каждого пакета .

🌍 Политическая балканизация интернета 35:16

Интернет, задумывавшийся как открытая и глобальная сеть, постепенно фрагментируется. Процесс «балканизации» проявляется в усилении государственного контроля и региональных различиях в доступе к контенту .

Закир Думеримик выделяет несколько аспектов этой трансформации:

  1. Технологический суверенитет: страны (например, Китай с его «Великим файерволом») стремятся контролировать, какой контент пересекает их национальные границы .
  2. Войны сертификатов: браузеры (Chrome, Firefox) сейчас единолично решают, каким удостоверяющим центрам (CA) доверять. Некоторые правительства задаются вопросом, почему американские компании решают, какие сайты в их стране считаются безопасными, и пытаются внедрить собственные государственные CA .
  3. Запреты приложений: дискуссии вокруг блокировки TikTok в США — пример того, как опасения по поводу контроля контента другим государством влияют на архитектуру сети .

По словам ученого, даже во время вооруженных конфликтов, таких как российско-украинский, исследователи фиксируют изменения в маршрутизации трафика в режиме реального времени, что подтверждает прямую зависимость интернета от геополитики .

📵 Токсичность и дезинформация: взгляд исследователя 42:31

Лаборатория Думеримика также изучает социальные аспекты: кибербуллинг и распространение пропаганды. Исследование работы журналистов в соцсетях показало, что для многих из них ежедневный поток оскорблений стал частью профессии .

Проблемы анализа токсичного контента:

В заключение Думеримик подчеркнул, что его курс «The Modern Internet» в Стэнфорде нацелен на то, чтобы студенты понимали интернет таким, какой он есть сегодня — с платными IP-адресами, аукционами, атаками в реальном времени и сложной политикой, а не по учебникам 20-летней давности .

💬 Цитаты

«В реальности пакеты идут по самому дешевому пути, а не по кратчайшему, потому что ядро интернета — это не общественная служба, а бизнес.»

Закир Думеримик 30:34

«Безопасность интернета во время рабочих часов ниже, чем в выходные, потому что бизнес медленнее внедряет новые протоколы.»

Закир Думеримик 18:46
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Пиринг (Peering)
Соглашение между интернет-провайдерами о прямом обмене трафиком без оплаты услуг посредников.
BGP (Border Gateway Protocol)
Основной протокол динамической маршрутизации в интернете, определяющий путь пакетов между сетями.
Балканизация интернета
Процесс распада глобальной сети на изолированные национальные или региональные сегменты.
Удостоверяющий центр (CA)
Организация, которая подтверждает подлинность веб-сайтов, выдавая им цифровые сертификаты.
📊 Цифры
🗓 Хронология
  1. 2013 Выпуск сканера ZMap, изменившего подход к измерению интернета (упоминается контекстно).
  2. 2022 Анализ изменений в маршрутизации трафика в Восточной Европе после начала конфликта.
  3. 2024 Текущий период преподавания курса 'The Modern Internet' в Стэнфорде.
⚖️ Другая сторона
Технологии и IT Zakir Durumeric ZMap Starlink кибербезопасность Stanford Online