Ученые разработали инструмент машинного обучения, который может обучаться самостоятельно, с минимальным внешним руководством, различать аэрофотоснимки цветущих и нецветущих трав - прогресс, который значительно увеличит темпы сельскохозяйственных полевых исследований, говорят они. Работа проводилась с использованием изображений тысяч разновидностей трав мискантуса, каждая из которых имеет свои особенности и сроки цветения.
Точное дифференцирование признаков сельскохозяйственных культур в различных условиях на разных этапах цикла выращивания - сложная задача, считает Эндрю Лики, профессор биологии растений и наук о растениях в Иллинойсском университете в Урбане-Шампейне, который руководил новой работой совместно с Себастьяном Варелой, ученым из Центра передовых инноваций в области биоэнергетики и биопродуктов, которым руководит Лики.
По словам Лики, новый подход может быть применим и к многочисленным другим культурам и проблемам компьютерного зрения. Результаты опубликованы в журнале Plant Physiology.
«Время цветения - ключевой признак, влияющий на урожайность и адаптацию многих культур, включая мискантус, к различным регионам выращивания. Но повторные визуальные осмотры тысяч отдельных растений, выращенных в ходе масштабных полевых испытаний, очень трудоемки», - поясняет Лики.
Автоматизация этого процесса путем сбора изображений с помощью беспилотников и использования искусственного интеллекта для извлечения соответствующих данных из этих изображений может упростить процесс и сделать его более управляемым.
Но создание моделей ИИ, которые могут различать тонкие особенности на сложных изображениях, обычно требует огромных объемов данных, аннотированных человеком, говорит Лики: «Создание этих данных занимает очень много времени. А методы глубокого обучения, как правило, очень зависят от контекста».
По его словам, это означает, что при изменении контекста (например, когда модель должна различать особенности другой культуры или одной и той же культуры в разных местах или в разное время года) ее, скорее всего, придется переобучать с использованием новых аннотированных изображений, отражающих эти новые условия.
«Существует множество примеров, когда люди предоставляли доказательства концепции использования ИИ для ускорения использования сенсорных технологий - от датчиков листьев до спутников - в приложениях в селекции, почвоведении и растениеводстве, но сейчас это не очень широко распространено или не так широко распространено, как можно было бы надеяться. Мы считаем, что одной из главных причин этого является огромный объем усилий, необходимых для обучения инструмента ИИ», - сказал Лики.
Чтобы сократить потребность в обучающих данных, аннотированных человеком, Варела обратился к известному методу побуждения двух моделей ИИ к соревнованию друг с другом в так называемой «генеративно-состязательной сети» или GAN.
Распространенное применение GAN - одна модель генерирует поддельные изображения желаемой сцены, а вторая модель просматривает изображения, чтобы определить, какие из них поддельные, а какие настоящие.
Со временем модели совершенствуют друг друга, сказал Варела. Модель один генерирует более реалистичные подделки, а модель два лучше отличает поддельные изображения от настоящих.
В процессе модели приобретают визуальный опыт в конкретной теме, что позволяет им лучше анализировать детали любых новых изображений, с которыми они сталкиваются. Варела предположил, что он мог бы использовать этот самостоятельно созданный опыт для сокращения количества аннотированных изображений, необходимых для обучения моделей различению множества различных культур. В процессе он создал «эффективно контролируемую генеративную и состязательную сеть», или ESGAN.
В серии экспериментов исследователи проверили точность своего ESGAN по сравнению с существующими протоколами обучения ИИ. Они обнаружили, что ESGAN «сократил потребность в аннотированных человеком данных на один-два порядка» по сравнению с «традиционными, полностью контролируемыми подходами к обучению».

Схема ESGAN и рабочий процесс данных, включая подмодели генератора (G) и дискриминатора (D), используемые для оценки состояния цветения. Источник: Plant Physiology (2025). DOI: 10.1093/plphys/kiaf132
Новые результаты представляют собой значительное сокращение усилий, необходимых для разработки и использования индивидуально обученных моделей машинного обучения для определения времени цветения «с участием других мест, популяций или видов», сообщают исследователи. «И этот подход прокладывает путь к преодолению аналогичных проблем в других областях биологии и цифрового сельского хозяйства», подчеркнули исследователи.
Лики и Варела продолжат работать с селекционером мискантуса Эриком Саксом, чтобы применить новый метод к данным многоштатного селекционного испытания мискантуса.
Целью испытания является разработка регионально адаптированных линий мискантуса, которые можно использовать в качестве сырья для производства биотоплива и биопродуктов с высокой стоимостью на землях, которые в настоящее время нерентабельны для сельского хозяйства.
«Мы надеемся, что наш новый подход смогут использовать и другие, чтобы облегчить внедрение инструментов ИИ для улучшения сельскохозяйственных культур, охватывающих более широкий спектр признаков и видов, тем самым способствуя широкому развитию биоэкономики», - заключил Лики, профессор Института геномной биологии имени Карла Р. Воеза, Института устойчивого развития, энергетики и окружающей среды и Центра цифрового сельского хозяйства при Университете Иллинойса.
Источник: University of Illinois at Urbana-Champaign.
На заглавном фото примеры: (А) вид растений мискантуса с формирующимися соцветиями с земли, далее с БПЛА – (B, C) растений, еще не достигшие полного цветения, (D, E) после цветения. Источник: Plant Physiology (2025). DOI: 10.1093/plphys/kiaf132
