В современном сельском хозяйстве точность данных решает всё: от правильного подсчета всходов зависит, нужно ли пересевать поле, что напрямую влияет на многомиллионную прибыль агропромышленных холдингов. Димитрис Зермас, ведущий специалист в Sentara, в подкасте TWIML AI рассказал Сэму Чаррингтону о том, как его компания переходит от классического компьютерного зрения к глубокому обучению и почему в индустрии Precision Agriculture (точного земледелия) борьба за качество данных важнее, чем за количество архитектур нейросетей.
🤖 Робототехника и сельское хозяйство: Путь Sentara 1:40
Компания Sentara позиционирует себя как разработчик комплексных решений: от собственного «железа» до облачных платформ аналитики . Специфика отрасли требует создания специализированных инструментов, которые невозможно найти в массовом сегменте.
Основные технологические решения компании:
- Собственные датчики и БПЛА: Sentara производит мультиспектральные камеры и дрон с фиксированным крылом, который запускается с руки и может находиться в воздухе около часа, покрывая значительно бо́льшие площади, чем стандартные квадрокоптеры .
- Аналитическая платформа: Набор ПО для автоматического подсчета растений, определения густоты всходов и оценки общего состояния посевов на основе снимков с воздуха .
- Практическая ценность: По словам Зермаса, инструменты помогают агрономам в критически важные периоды — например, через месяц после посадки — принять решение о необходимости пересева .
Зермас, первый сотрудник группы анализа данных в компании, отмечает, что индустрия постоянно требует повышения производительности: клиенты хотят анализировать больше акров за меньшее время, что диктует переход к максимально автоматизированным пайплайнам .
🌽 От классических алгоритмов к Deep Learning 7:55
Четыре года назад аналитика в Sentara основывалась на классическом компьютерном зрении. Однако такие методы оказались нежизнеспособными в неконтролируемых условиях полей .
Основными проблемами классического подхода стали:
- Изменчивость освещения: Облака, меняющиеся углы солнца в течение дня и тени полностью сбивали алгоритмы, основанные на жестких порогах и фильтрах .
- Типы почв: Цвет и текстура земли в разных регионах требовали постоянной ручной перенастройки параметров .
- Сложность поддержки: Пайплайны становились настолько громоздкими, что тестировать и обновлять их было почти невозможно .
Переход на глубокое обучение (Deep Learning) показал «существенное улучшение результатов» уже в первых экспериментах . Это позволило алгоритмам стать более автономными, справляясь с факторами, которые ранее требовали сложного ручного кодинга.
🔍 Проблема «Corner Cases» в океане данных 14:26
Несмотря на наличие миллионов снимков высокого разрешения (типичный кадр имеет размер 3000x4000 пикселей), Sentara столкнулась с переизбытком однотипных данных и нехваткой редких сценариев .
Ключевые трудности при масштабировании моделей:
- Пересечение растений: Когда кукуруза подрастает (через 1.5 месяца), листья начинают перекрывать друг друга, и разделить отдельные растения становится сложно даже для человека .
- Дисбаланс данных: Редкие условия (аномалии, сорняки, специфические типы почв) теряются в массе стандартных изображений здоровых полей .
- Аномалии («Volunteer corn»): Зермас приводит пример кукурузы, выросшей случайно из семян прошлого года — такие растения нужно уметь отличать от целевого посева .
По мнению Зермаса, главная задача теперь — не собрать больше данных, а научиться искать «иглу в стоге сена»: выявлять уникальные кадры, которые действительно могут улучшить обучение модели .
🎯 Zero-Shot Learning: Как аннотировать меньше, а получать больше 19:51
Для оптимизации процесса Sentara внедрила подход, основанный на Zero-Shot Learning и обучении без учителя (unsupervised clustering). Это решение призвано снизить «тревожность» инженеров по поводу того, всё ли разнообразие условий покрыто обучающей выборкой .
Механика работы системы:
- Даунсайз и эмбеддинги: Огромные изображения уменьшаются и пропускаются через сеть-энкодер, которая переводит картинку в высокомерное векторное пространство (embedding space) .
- Кластеризация: В этом пространстве алгоритм группирует изображения по визуальному сходству.
- Аугментация для обучения инвариантности: Чтобы сеть не группировала снимки просто по направлению рядов, применяются случайные вращения. Это заставляет алгоритм игнорировать ориентацию посевов и фокусироваться на содержательных признаках (состояние почвы, тип растений) .
Результаты использования этого метода:
- Объем данных для ручной разметки удалось сократить на 40% без потери качества моделей .
- Процесс аннотации в компании сложен: каждый кадр проверяют минимум двое людей, затем вычисляется индекс согласия (agreement score). Сокращение выборки дает колоссальную экономию времени и средств .
☁️ Эксплуатация и стратегия сбора данных 31:33
Зермас подчеркивает: его ответ на вопрос «сколько данных вам нужно?» всегда звучит одинаково — важнее разнообразие, а не количество . Для обучения новой культуры (например, картофеля) ему предпочтительнее иметь по 2 снимка из 10 разных штатов, чем 1000 снимков с двух соседних полей .
Применение ИИ-подхода изменило рабочий цикл компании:
- In-season аналитика: Благодаря автоматизации отбора данных, оценку новых снимков можно проводить в выходные, а уже в понедельник начинать обучение обновленной нейросети . Раньше приходилось ждать окончания сезона вегетации из-за трудоемкости ручного анализа .
- Целевой сбор данных: Теперь компания может точно сказать пилотам, в какое время и при каких погодных условиях нужно произвести съемку, чтобы закрыть «белые пятна» в наборе данных (например, нехватку снимков в облачную погоду) .
В завершение беседы Димитрис Зермас резюмировал свою философию: если раньше он считал, что успех решения на 80% зависит от данных, то теперь этот показатель вырос до 90% .