Димитрис Зермас из Sentara: «90% успеха ИИ в агротехе — это не алгоритмы, а данные»

The TWIML AI Podcast 672 38 мин 4 мин 06.02.2023
Главное

В современном сельском хозяйстве точность данных решает всё: от правильного подсчета всходов зависит, нужно ли пересевать поле, что напрямую влияет на многомиллионную прибыль агропромышленных холдингов. Димитрис Зермас, ведущий специалист в Sentara, в подкасте TWIML AI рассказал Сэму Чаррингтону о том, как его компания переходит от классического компьютерного зрения к глубокому обучению и почему в индустрии Precision Agriculture (точного земледелия) борьба за качество данных важнее, чем за количество архитектур нейросетей.

🤖 Робототехника и сельское хозяйство: Путь Sentara 1:40

Компания Sentara позиционирует себя как разработчик комплексных решений: от собственного «железа» до облачных платформ аналитики . Специфика отрасли требует создания специализированных инструментов, которые невозможно найти в массовом сегменте.

Основные технологические решения компании:

Зермас, первый сотрудник группы анализа данных в компании, отмечает, что индустрия постоянно требует повышения производительности: клиенты хотят анализировать больше акров за меньшее время, что диктует переход к максимально автоматизированным пайплайнам .

🌽 От классических алгоритмов к Deep Learning 7:55

Четыре года назад аналитика в Sentara основывалась на классическом компьютерном зрении. Однако такие методы оказались нежизнеспособными в неконтролируемых условиях полей .

Основными проблемами классического подхода стали:

  1. Изменчивость освещения: Облака, меняющиеся углы солнца в течение дня и тени полностью сбивали алгоритмы, основанные на жестких порогах и фильтрах .
  2. Типы почв: Цвет и текстура земли в разных регионах требовали постоянной ручной перенастройки параметров .
  3. Сложность поддержки: Пайплайны становились настолько громоздкими, что тестировать и обновлять их было почти невозможно .

Переход на глубокое обучение (Deep Learning) показал «существенное улучшение результатов» уже в первых экспериментах . Это позволило алгоритмам стать более автономными, справляясь с факторами, которые ранее требовали сложного ручного кодинга.

🔍 Проблема «Corner Cases» в океане данных 14:26

Несмотря на наличие миллионов снимков высокого разрешения (типичный кадр имеет размер 3000x4000 пикселей), Sentara столкнулась с переизбытком однотипных данных и нехваткой редких сценариев .

Ключевые трудности при масштабировании моделей:

По мнению Зермаса, главная задача теперь — не собрать больше данных, а научиться искать «иглу в стоге сена»: выявлять уникальные кадры, которые действительно могут улучшить обучение модели .

🎯 Zero-Shot Learning: Как аннотировать меньше, а получать больше 19:51

Для оптимизации процесса Sentara внедрила подход, основанный на Zero-Shot Learning и обучении без учителя (unsupervised clustering). Это решение призвано снизить «тревожность» инженеров по поводу того, всё ли разнообразие условий покрыто обучающей выборкой .

Механика работы системы:

  1. Даунсайз и эмбеддинги: Огромные изображения уменьшаются и пропускаются через сеть-энкодер, которая переводит картинку в высокомерное векторное пространство (embedding space) .
  2. Кластеризация: В этом пространстве алгоритм группирует изображения по визуальному сходству.
  3. Аугментация для обучения инвариантности: Чтобы сеть не группировала снимки просто по направлению рядов, применяются случайные вращения. Это заставляет алгоритм игнорировать ориентацию посевов и фокусироваться на содержательных признаках (состояние почвы, тип растений) .

Результаты использования этого метода:

☁️ Эксплуатация и стратегия сбора данных 31:33

Зермас подчеркивает: его ответ на вопрос «сколько данных вам нужно?» всегда звучит одинаково — важнее разнообразие, а не количество . Для обучения новой культуры (например, картофеля) ему предпочтительнее иметь по 2 снимка из 10 разных штатов, чем 1000 снимков с двух соседних полей .

Применение ИИ-подхода изменило рабочий цикл компании:

В завершение беседы Димитрис Зермас резюмировал свою философию: если раньше он считал, что успех решения на 80% зависит от данных, то теперь этот показатель вырос до 90% .

💬 Цитаты

«Раньше я думал, что 80% решения — это данные. Теперь я считаю, что 90% решения — это данные.»

Димитрис Зермас 35:49

«Мне не нужно больше изображений, мне нужно разнообразие изображений.»

Димитрис Зермас 30:10
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Precision Agriculture
Стратегия управления сельским хозяйством, использующая технологии для наблюдения и реагирования на изменчивость полей.
Zero-Shot Learning
Способность модели машинного обучения правильно классифицировать объекты, которые она не видела в процессе обучения.
Volunteer corn
Кукуруза, которая вырастает на поле из остатков прошлогоднего урожая и считается сорняком для текущей посадки.
Fixed-wing drone
Беспилотник самолетного типа, обладающий большей дальностью и временем полета по сравнению с мультироторными дронами.
📊 Цифры
🗓 Хронология
  1. 4 года назад Димитрис Зермас присоединился к Sentara как первый сотрудник отдела аналитики.
  2. Май Начало типичного сезона вегетации, когда нагрузка на системы анализа данных возрастает.
⚖️ Другая сторона
Искусственный интеллект Sentara Precision Agriculture Zero-Shot Learning Dimitris Zermas Компьютерное зрение