|
|
9 months ago | |
|---|---|---|
| .gitignore | 9 months ago | |
| README.md | 9 months ago | |
| main.py | 9 months ago | |
README.md
МОДЕЛИРОВАНИЕ НЕЙРОСЕТЕВОГО АНАЛИЗА ФОТОГРАФИЙ ЛИСТЬЕВ КАРТОФЕЛЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА СЕГМЕНТАЦИИ ПОРАЖЕННЫХ ЧАСТЕЙ РАСТЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ЗАБОЛЕВАНИЙ
Ключевые слова: сегментация изображений, U-Net, BEIT, анализ заболеваний растений, машинное обучение, глубокое обучение.
Аннотация
В рамках данной работы разобран подход к автоматизированному анализу фотографий листьев картофеля для выявления заболеваний с использованием методов глубокого обучения. Основное внимание уделено применению архитектуры U-Net для сегментации пораженных участков листьев и модели BEIT для классификации заболеваний. Рассмотренный метод позволяет эффективно обрабатывать большие объемы данных, что делает его применимым в сельском хозяйстве для мониторинга состояния растений.
Введение
Современное сельское хозяйство сталкивается с необходимостью автоматизации процессов мониторинга состояния растений для своевременного выявления заболеваний. Одним из ключевых методов является анализ изображений листьев, который позволяет обнаруживать признаки болезней на ранних стадиях. Однако ручной анализ таких изображений требует значительных временных и трудовых затрат.
В данной работе предлагается подход, основанный на использовании нейронных сетей для автоматизированного анализа изображений листьев картофеля. Основная задача заключается в сегментации пораженных участков листьев и классификации заболеваний. Для этого используются две модели: U-Net для сегментации и BEIT для классификации.
Основная часть
1. Теоретическая база
1.1. Сегментация изображений с использованием U-Net
U-Net — это сверточная нейронная сеть, разработанная для биомедицинской сегментации изображений. Архитектура U-Net состоит из двух частей: энкодера и декодера. Энкодер выполняет сжатие изображения, извлекая признаки, а декодер восстанавливает пространственное разрешение, создавая маску сегментации ref.
Преимущества U-Net:
- Высокая точность сегментации даже при ограниченном количестве данных.
- Возможность работы с изображениями высокого разрешения.
1.2. Классификация изображений с использованием BEIT
BEIT (Bidirectional Encoder Representation from Image Transformers) — это модель, основанная на архитектуре Transformer, адаптированная для задач классификации изображений. BEIT использует предобученные веса на больших наборах данных, что позволяет достичь высокой точности даже на небольших специализированных наборах данных ref.
Преимущества BEIT:
- Высокая точность классификации.
- Возможность использования предобученных моделей для задач с ограниченным количеством данных.
2. Подготовка данных
2.1. Формирование набора масок для обучения U-Net
Для обучения модели U-Net был использован датасет New Plant Diseases Dataset. Из исходного набора данных были отобраны 50% изображений, для которых вручную созданы маски пораженных участков листьев.
2.2. Разделение данных
Набор данных для обучения U-Net был разделен на две части:
- 80% — для обучения.
- 20% — для валидации.
3. Обучение моделей
3.1. Обучение U-Net
Модель U-Net обучалась на подготовленном наборе данных с использованием функции потерь BCEWithLogitsLoss и оптимизатора Yogi. Обучение проводилось в течение XX эпох с размером пакета X.
Результаты обучения:
- Точность сегментации на валидационном наборе данных составила XX%.
- Среднее значение Dice Score — X.XX.
3.2. Подготовка данных для BEIT
После обучения U-Net все изображения из исходного набора данных были обработаны для создания сегментированных версий. Эти данные использовались для обучения модели BEIT.
3.3. Обучение BEIT
Модель BEIT обучалась на сегментированных изображениях с использованием предобученных весов. Обучение проводилось в течение XX эпох с размером пакета X.
Результаты обучения:
- Точность классификации на тестовом наборе данных составила XX%.
- Среднее значение Dice Score — X.XX.
4. Оценка эффективности
4.1. Тестирование на изображениях из набора данных
Модель U-Net успешно сегментировала пораженные участки листьев, а BEIT корректно классифицировал заболевания на XX% изображений.
4.2. Тестирование на новых изображениях
Для проверки обобщающей способности модели были использованы изображения, не входящие в исходный набор данных. Результаты показали, что модель выдает точность XX% на новых данных.
Заключение
Предложенный подход демонстрирует высокую эффективность в задаче автоматизированного анализа фотографий листьев картофеля для выявления заболеваний. Использование U-Net для сегментации и BEIT для классификации позволяет достичь высокой точности даже на ограниченных наборах данных.
Дальнейшие исследования могут быть направлены на расширение набора данных и улучшение моделей для работы с другими видами растений и заболеваниями.
Библиографический список
Рисунок 1 – Пример сегментации пораженных участков листьев картофеля с использованием U-Net.
Рисунок 2 – Пример изображения и его карты значимости.
Таблица 1 – Результаты обучения моделей.
| Модель | Точность на валидации | Dice Score |
|---|---|---|
| U-Net | % | 0 |
| BEIT | % | 0 |