Алгоритм на базе ML для аграрной компании
Помогли оптимизировать процессы и увеличить прибыль за счет внедрения умных технологий в бизнес-практику агропредприятия.Клиент
Аграрная компания, занимается выращиванием и переработкой сельскохозяйственной продукции с 2014 года. Работает с самыми разными культурами – от пшеницы до подсолнечника.
Количество сельхозугодий предприятия растет с каждым годом, а с ними – и число работников, которые их обслуживают. Например, агрономы делают массу трудоемкой работы вручную, что требует дополнительного времени и ресурсов. Ключевые фигуры компании задумались об оптимизации и обратили внимание на Data Science как способ, который поможет обогатить инструментарий землеуправления и позволит не раздувать штат.
Вызовы
Компания обратилась к нам в 2023 году. Пришла за разработкой алгоритма на базе ИИ, который будет собирать важные практические сведения о состоянии полей и растений в период вегетации, а также поможет своевременно принимать операционные решения.
То, с чем пришел клиент, – задача классификации объектов, ее решает машинное обучение (ML). Однако способов классификации множество – среди них нужно выбрать эффективный и наименее требовательный к ресурсам.

Подбор метода классификации
Какой метод сможет работать с разными классами сложных данных, обеспечив при этом высокую точность и надежность модели? Нужно также учитывать, что данные будут несбалансированными, с большим количеством шумов. А еще важно, чтобы модель легко встроилась в существующую инфраструктуру.

Многозадачность
Помимо выявления проблем на полях компания хотела внедрить оценку урожайности для прогнозирования прибыли.
Это означало, что перед нами стоит не одна, а целых две практических задачи. Однако если построить два модуля на едином пайплайне (сегментацию и регрессию для прогноза), то это сэкономит бюджет.
Процесс разработки
Как работает мониторинг на базе нашей модели
Все технологические операции по сбору материалов в полях выполняют агродроны, оснащенные RGB-камерами.
Сбор
Дроны снимают поля с заданным GSD и перекрытием кадров, отправляют изображения на сервер. Снимки агрегируются в ортофотопланы с фиксированным разрешением.
Постпроцессинг
Алгоритм проводит предварительную обработку изображений: выравнивает освещенность, нормализует масштаб, чтобы снизить ложные срабатывания.
Признаки
Модель анализирует обработанные изображения. Для каждого пикселя считает цветовые и текстурные признаки.
Классификация
SVM относит пиксели к классам. Соседние метки объединяются в полигоны проблемных зон, границы уточняются морфологией.
Что мы сделали и как это работает:
1. Критически оценили варианты реализации на старте
В агротехе для анализа полевых снимков используют глубокие нейросети. Например, уже ставший индустриальным стандартом U-Net-класс моделей: его архитектура идеально заточена под сегментацию.
Однако у нас были ограничения: у клиента отсутствовала GPU-инфраструктура (парк машин высокой мощности для скоростных вычислений). Кроме того, U-Net требует много времени на дообучение, а у нас его не было – сжатые сроки были обусловлены сезонностью работ в полях.
Требовалось найти более быструю и дешевую альтернативу. Вот почему мы поступили иначе: выбрали метод опорных векторов (SVM) – и сделали это сознательно.
2. Как работает метод опорных векторов (SVM)
Морфологические признаки – RGB-индексы, текстура и форма объектов – у здоровых растений одного и того же вида одинаковы.
Используя характеристики эталонных изображений культур, SVM классифицирует пиксели. Все здоровые растения окажутся с одной стороны, а все поврежденные или сорняки — с другой. После чего изображения с аномалиями будет обрабатывать уже другой алгоритм, который поможет точнее выявить и описать проблему.
3. Подготовили обучающие материалы
С помощью агрономов предприятия отобрали эталонные фотографии растений каждого вида на разных фазах развития – от всходов до полной спелости, когда урожай готов к сбору. Разметили правильные категории и подали в ядро для обучения. Повторяли манипуляции до тех пор, пока не перебрали все двенадцать видов культур, которыми занимается предприятие.
Для оценки работоспособности модели и набора параметров применили метод перекрестной проверки: тестировали на разных наборах данных, чтобы исключить ошибки. Когда убедились, что все настроено и обрабатывается верно, интегрировали алгоритмы в систему мониторинга полей.
4. Добавили оценку урожайности
С помощью XGBoost обучили алгоритм оценивать уровень вегетации, определять спелость культур и прогнозировать урожайность. Это отдельный модуль с данными об истории погоды и фенологических фазах. На его основе получаются графики по участкам и по сезонам, график прогнозного и фактического урожая.
– Ориентируясь на эту информацию, руководство оценивает, сколько урожая получится на каждом участке.
– Можно подбирать оптимальное время, когда лучше выходить в поле, чтобы собирать только зрелый урожай.
Технологии
Бэкенд
Python
База данных
PostgreSQL + PostGIS
Мониторинг
Grafana + Prometheus
Библиотека
OpenCV
Библиотека
Scikit-Learn
Библиотека
XGBoost
Инфраструктура
Kubernetes
Инфраструктура
Docker
Результат
Мы научили модель различать, как выглядит здоровое растение и как – проблемное, искать и классифицировать признаки на новых снимках. SVM – метод, который мы использовали для решения этой прикладной задачи, – дал нужное качество при ограниченных ресурсах, оказался проще, дешевле и быстрее в подготовке и реализации.
Пример нашего клиента по внедрению умных технологий в бизнес-процессы показателен:
- Уменьшение операционных расходов за сезон за счет точечной обработки проблемных зон и сокращения лишних работ.
- У агрономов уходит меньше времени на обходы полей: вместо двух-трех дней обходов они получают карту с состоянием культур в течение нескольких часов после съемки.
- Экономия на удобрениях и химии на 10% благодаря тому, что препараты применяются только там, где это действительно нужно.
- Прогноз урожайности стал надежнее: отклонение прогноза от фактического сбора не превышает 7–10%.
- Проблемные участки выявляются заранее — минимум на неделю раньше, чем при ручных проверках.
снизились операционные расходы предприятия за сезон.
требуется, чтобы карта состояния поля стала доступна после полета дронов.
Что происходит дальше:
Мы получаем запрос, обрабатываем его в течение 24 часов и связываемся по указанным вами e‑mail или телефону для уточнения деталей.
Подключаем аналитиков и разработчиков. Совместно они составляют проектное предложение с указанием объемов работ, сроков, стоимости и размера команды.
Договариваемся с вами о следующей встрече, чтобы согласовать предложение.
Когда все детали улажены, мы подписываем договор и сразу же приступаем к работе.