# Geospatial Machine Learning with Kumar Chellapilla - 607

Источник: https://www.youtube.com/watch?v=2WYSOwjNcTs
Канал: The TWIML AI Podcast
Опубликовано: 22.12.2022

---

Геопространственные данные долгое время оставались «вещью в себе» из-за колоссальных объемов, специфических форматов и необходимости сложной предварительной обработки. Однако на конференции AWS re:Invent Кумар Челлапилла, генеральный менеджер подразделения ML и AI сервисов в AWS, объявил о запуске поддержки геопространственного машинного обучения в Amazon SageMaker. Эта инициатива призвана объединить миры традиционных ГИС-специалистов и современных дата-сайентистов, автоматизируя «черную работу» по подготовке спутниковых снимков и картографических данных.

## 🌍 Новая эра геопространственного ML
[[JUMP:00:40]]

Кумар Челлапилла, ветеран индустрии с 25-летним стажем, стоявший у истоков обучения нейросетей на GPU в Microsoft Research [01:06], отмечает фундаментальный сдвиг в области данных. Если раньше работа со спутниками была прерогативой государств и корпораций-гигантов, то сегодня отрасль переживает взрывной рост.

Согласно данным Челлапиллы, количество спутников на орбите растет экспоненциально:

*   Еще два года назад их было менее 1000 [07:03].
*   В ближайшее время ожидается запуск от 8 000 до 9 000 новых аппаратов [07:16].
*   В десятилетней перспективе на орбите может находиться до 100 000 спутников [07:16].

Современные спутники превратились из многомиллионных «монстров» в компактные «обувные коробки» стоимостью около 100 тысяч долларов, которые сгорают в атмосфере через два года, заменяясь более совершенными моделями [07:41]. Этот поток данных создает проблему «недифференцированной тяжелой работы» (undifferentiated heavy lifting), которую AWS стремится взять на себя.

## 🛰️ Решение проблемы «тяжелых» данных
[[JUMP:05:04]]

Главная трудность работы с геоданными — их масштаб. Кумар приводит пример: фотография с iPhone весит несколько мегабайт, тогда как спутниковый снимок штата Калифорния может весить от 10 гигабайт до 10 терабайт [08:07]. Традиционные модели компьютерного зрения (CV) рассчитаны на изображения в десятки мегапикселей, в то время как геопространственные данные оперируют терапикселями [08:32].

Amazon SageMaker Geospatial ML предлагает три ключевых направления упрощения работы:

1.  **Доступ к данным в один клик:** Интеграция с каталогами Planet Labs, Foursquare, данными Sentinel-2 и Landsat через Amazon Open Data [12:42]. Больше не нужно месяцами вести переговоры о лицензировании и скачивать терабайты на локальные серверы.
2.  **Автоматизация препроцессинга:** Встроенные инструменты для тайлинга (разрезания огромных снимков на фрагменты), орторектификации и удаления облаков [08:45, 19:17].
3.  **Специализированные алгоритмы:** Например, сервис сопоставления карт (map matching), который превращает тысячи «шумных» GPS-точек с погрешностью в 10 метров в чистую траекторию движения по дорожной сети [18:39].

## 📈 Бизнес-кейсы: от сельского хозяйства до страхования
[[JUMP:15:48]]

Технология уже находит применение в различных вертикалях. Кумар выделил несколько ключевых направлений:

*   **Автопром (BMW):** Компания использует гео-ML для анализа профилей вождения и выбора мест для установки зарядных станций для электромобилей [16:14].
*   **Логистика и цепочки поставок:** Отслеживание морских контейнеров. В мире их всего около 24 000 [11:21]. Даже при разрешении 0,5–1 метр на пиксель контейнеры размером с автобус отчетливо видны, что позволяет предсказывать экономические показатели портов [11:48].
*   **Экология и мониторинг:** Спутники со специализированными датчиками (например, от компании GHG Sat) позволяют напрямую измерять утечки метана, что гораздо эффективнее математического моделирования [10:04].
*   **Ритейл (выбор локаций):** Анализ пешеходного трафика и демографии районов для открытия новых точек, например Starbucks или McDonald’s [31:31].

## 🤖 Почему классическое CV не всегда подходит для спутников
[[JUMP:19:44]]

Челлапилла отмечает парадокс: несмотря на десятилетие со времен триумфа AlexNet (в 2012 году), в геопространственной сфере до сих пор нет своего аналога ImageNet [20:07]. Хотя такие задачи, как семантическая сегментация (например, выделение типов почв или лесных массивов), активно развиваются, специфика данных требует иных подходов.

По мнению Кумара, у геоданных есть преимущество перед обычными фото: поверхность Земли не меняется так быстро, как мода или лица людей [22:09]. Это позволяет накапливать «слои» информации об одном и том же объекте десятилетиями, создавая сверхточные модели. 

Интересной деталью дискуссии стало обсуждение «лени» современных разработчиков. Кумар в шутку заметил, что выпускники вузов сегодня стараются запихнуть любые данные в глубокие нейросети (Deep Net), чтобы не заниматься ручным проектированием признаков (feature engineering), и SageMaker Geospatial ML поддерживает этот тренд, предоставляя предварительно обученные модели [25:49].

## 🔮 Будущее: Диффузионные модели и Цифровые двойники
[[JUMP:32:39]]

В будущем Челлапилла видит большой потенциал в использовании генеративных моделей для геопространственных задач [34:50]:

*   **Super Resolution:** Искусственное повышение разрешения снимков.
*   **In-painting:** Заполнение «дыр» в данных, возникших из-за облачности, на основе исторических кадров того же участка [35:42].
*   **Прогнозирование:** Генерация изображений того, как лесной массив будет выглядеть через 5 лет с учетом текущих темпов вырубки.

Конечная цель AWS — конвергенция двух сообществ. ГИС-эксперты (традиционные картографы) должны освоить облачные вычисления и Jupyter Notebook, а современным дата-сайентистам пора научиться работать с координатами и спектральными каналами [39:15]. Челлапилла прогнозирует, что это слияние произойдет в ближайшие 2–5 лет, превращая геопространственное ML из нишевой дисциплины в стандартный инструмент любого аналитика данных.