Agricultural product pattern detection and control using farmer registration data and open source code EO-Learn library
Autor: | Şimşek, Fatih Fehmi |
---|---|
Přispěvatelé: | Durduran, S. Savaş, NEÜ, Fen Bilimleri Enstitüsü, Harita Mühendisliği Anabilim Dalı |
Jazyk: | turečtina |
Rok vydání: | 2022 |
Předmět: | |
Popis: | Doktora Tezi Coğrafi bilgi sistemleri ile uzaktan algılama verilerindeki boyut ve hacim artışı özellikle bölgesel ve ülkesel ölçekteki çalışmalarda, kullanıcıları daha hızlı, entegre ve hazır platform arayışına sokmuştur. Özellikle uydulara ait spektral, zamansal ve mekânsal çözünürlük arttıkça, çok zamanlı görüntülerin de kullanılması ile birçok görüntü ön işleme işlemleri, referans verilerin hazırlanması, eğitim-test verilerinin belirlenmesi ve sınıflandırma çalışmalarının yapılması, hem çok zaman hem de karmaşık bir hal almaktadır. Gelişen teknoloji ile uzaktan algılama çalışmalarında kullanılan bu ve benzeri durumları kolaylaştıracak kütüphaneler ve platformlar oluşturulmaya başlanmış olup bunlardan biri de açık kaynak kodlu EO-Learn kütüphanesidir. EO-Learn kütüphanesi, dünya gözlemi ve uzaktan algılama uygulamalarında, birbirine bağlı entegre iş akışları ve makine öğrenmesi ile derin öğrenme algoritmalarını kullanarak çalışan açık kaynak kodlu bir python kütüphanesidir. Bu tez çalışmasında ÇKS beyanlı parsellerden yer doğruluk verisi oluşturularak, EO-Learn kütüphanesi ile Denizli Çivril-Baklan Ovası’nda 2017-2021 yılları arasında beş farklı, Eskişehir-Çifteler bölgesinde ise iki farklı olmak üzere toplam yedi farklı sınıflandırma çalışması, hububat (buğday-arpa), haşhaş, meyve ağacı, nadas, şeker pancarı, üzüm, yonca, ayçiçeği, kabak ve mısır ürünleri için yapılmıştır. Çalışmada 15 gün aralıklı Sentinel-2 görüntüleri kullanılmış olup, her Sentinel-2 görüntüsüne ait mavi (bant-2), yeşil (bant-3), kırmızı (bant-4) , yakın kızılötesi (bant-8), kısa dalga kızılötesi-1 (bant-11), kısa dalga kızılötesi-2 (bant-12), bantları ile bantlardan üretilen NDVI, NDWI, SAVI ve üç adet Tasseled cap dönüşümü (TCB-TCG-TCW) olmak üzere toplamda 12 farklı özellik sınıflandırma çalışmasına dâhil edilmiştir. Geniş alanlarda yapılacak tarımsal ürün desen sınıflandırma çalışmalarında, sınıflandırılacak her ürün için araziden yer doğruluk verisi toplamak çok zamanlı alıcı olmakla beraber maliyetli ve sürdürülebilir değildir. Bu nedenle, tez çalışmasının ana hedeflerinden biri de Çiftçi Kayıt Sistemi’ne (ÇKS) kayıtlı parsellerin sınıflandırma çalışmasında yer doğruluk verisi olarak kullanılmasını sağlamaktır. ÇKS beyanlı parseller üzerinde yapılan incelemede, parsellerde geometrik ve öznitelik olarak birçok farklılık ve hataların bulunduğu, bunun yanı sıra ekilen ürün ile beyan edilen ürün arasında ise uyuşmazlıklar olduğu tespit edilmiştir. Beyan esaslı bu parsellerden yer doğruluk verisi oluşturmak için bir dizi işlem adımı uygulanmış ve parsellerin temizlenmesi için özgün bir uygulama geliştirilmiştir. Parsellerin düzenlenmesi ve temizlenmesi sonucunda Denizli Çivril-Baklan Ovası’nda beş yıl için ortalama 75000’den parselden 13000 adedi, Eskişehir-Çifteler bölgesinde ise iki yıl için ortalama 27000 parselden 6000 adedi yer doğruluk verisi olarak kullanılmıştır. ÇKS beyanlı parsellerden oluşturulan yer doğruluk verileri ve açık kaynak kodlu EO-Learn kütüphanesi kullanılarak tarımsal ürün desen sınıflandırması yapılmıştır. Sınıflandırma sonucunda K katmanlı çapraz doğrulama yöntemi ile birinci doğruluk analizi, sınıflandırma çalışmasında test verisi olarak kullanılmayan, dışardan bir veri seti olan Tarım Sigortaları Havuzu (TARSİM) parselleri ile de ikinci doğruluk analizi yapılmıştır. Birinci doğruluk analizi sonucunda Denizli Çivril Baklan Ovası’nda 2017- 2018-2019-2020 ve 2021 yılları için sırasıyla %92,8 - %94,7 - %93,5 - %93,5 - %93,9 Eskişehir Çifteler bölgesinde ise 2019 yılı için %92,4 2020 yılı için ise %90,2 genel doğruluk oranına ulaşılmıştır. TARSİM parselleri ile yapılan doğruluk analizinde Denizli Çivril Baklan Ovası’nda 2017-2018-2019-2020 ve 2021 yılları için sırasıyla %94,1 - %88,3 - %92,0 - %90,1 - %90,6 Eskişehir Çifteler bölgesinde ise 2019 yılı için %90,1 2020 yılı için ise %88,4 genel doğruluk oranına ulaşılmıştır. Sınıflandırma sonucunda ürün bazında da doğruluk oranı yüksek olup, yakın fenolojik evrelere sahip ürünlerin birbirleri ile belirli oranda karıştığı tespit edilmiştir. Geliştirilen uygulama ile ÇKS beyanlı parsellerden oluşturulan yer doğruluk verisi ve açık kaynak kodlu EO-Learn kütüphanesi kullanılarak yapılan sınıflandırma çalışmasında yüksek başarı sağlanmıştır. Eo-Learn kütüphanesi ile yapılan çalışmanın, klasik yöntemlere yapılan çalışmalara kıyasla 10 kat daha az veri boyutu kapsadığı ve işlem süresinin ise 14 kat daha kısa olduğu sonucuna varılmıştır. Farklı alanlarda, farklı ürünlerle, farklı doğruluk analizleri ile birçok kere yapılan ve yüksek başarım sağlayan bu çalışma, bölgesel ya da ülkesel ölçekte hızlı, güvenilir ve sürdürebilir olarak kullanılabileceğini göstermektedir. The growing size and volume of geographical information systems and remote sensing data have prompted users to seek a more rapid, integrated, and ready platform, particularly in regional and national studies. Many image preprocessing processes, preparation of reference data, determination of training-test data, and classification studies take a long time and become more complex with the use of multi-temporal images, especially as the spectral, temporal, and spatial resolution of satellites increases. With the advancement of technology, libraries and platforms have begun to emerge to aid in these and similar situations encountered in remote sensing studies, one of which is the open source EO-Learn library. The EO-Learn library is a Python open source library that runs earth observation and remote sensing applications by utilizing interconnected integrated workflows as well as machine learning and deep learning algorithms. In this thesis, a classification study was carried out by creating ground truth data from parcels with ÇKS declaration with the EO-Learn library. In this study between 2017-2021 seven different classification studies were carried out, five in Denizli Çivril-Baklan Plain and two in Eskişehir-Çifteler region for wheat, hash fruit tree, fallaow, sugar beet, vineyard, clover, sunflower, squash , maize. Sentinel-2 images with 15- day intervals were used in the study, and a total of 12 different attributes were included in the classification study including; the blue (bant-2), green (bant-3), red (bant-4) , NIR (bant-8), SWIR-1 (bant-11), SWIR-2 (bant-12) bands and NDVI, NDWI, SAVI, and three Tasseled cap transformation (TCB-TCG-TCW) produced from bands of each Sentinel-2 image. In large-scale agricultural product pattern classification studies, collecting data from the field for each product to be classified is very time consuming and costly and not sustainable. As a result, one of the primary goals of the thesis research is to ensure that parcels registered in the Farmer Registration System (ÇKS) are used as ground truth data in the classification study. During the examination of the parcels with ÇKS declaration, it was discovered that there are many differences and errors in terms of geometric and attribute as well as significant inconsistencies between the planted product and the declared product. To generate ground truth data from these declaration-based parcels, a series of process steps were used, and a unique application was developed to determine the parcels. As a result of the parcel arrangement and cleaning, 13000 out of 75000 parcels on average for five years in the Denizli Çivril-Baklan Plain and 6000 out of 27000 parcels on average over two years in the Eskişehir-Çifteler region were used as ground truth data. The agricultural product pattern classification was performed using ground truth data generated from parcels with ÇKS declarations and the open source EO-Learn library. Following the classification, the first accuracy analysis was performed with the K-layer cross-validation method whereas a second accuracy analysis was also carried out with the Tarım Sigortaları Havuzu (TARSİM) parcels, which is an external data set that was not used as test data in the classification study. As a result of the first accuracy analysis; in Denizli Çivril Baklan Plain, the overall accuracy rate of 92.8% - 94.7% - 93.5% - 93.5% - 93.9% was achieved for the years 2017-2018-2019-2020 and 2021, respectively. For Eskişehir Çifteler region, the overall accuracy rate was 92.4% for 2019 and 90.2% for 2020. In the accuracy analysis made with TARSİM parcels, 94.1% - 88.3% - 92.0% - 90.1% - 90.6% for the years 2017-2018-2019-2020 and 2021 in Denizli Çivril Baklan Plain, whereas in Eskişehir Çifteler region, the overall accuracy rate was 90.1% for 2019 and 88.4% for 2020. As a result of the classification, the accuracy rate is also high on the basis of the product, and it has been determined that the products with close phenological stages are mixed with each other at a certain rate. With the developed application, high success was achieved using the ground truth data generated from the ÇKS declaration based parcels and the classification study conducted using the open source EO-Learn library. In comparison to studies using traditional methods, the Eo-Learn library resulted in 10 times less data size and 14 times shorter processing time. This study, which has been conducted numerous times in various fields, with various products, and with various accuracy analyses and has achieved high success, demonstrates that it can be used quickly, reliably, and sustainably on a regional or national scale |
Databáze: | OpenAIRE |
Externí odkaz: |