Structural scene analysis of remotely sensed images using graph mining

Autor: Özdemir, Bahadır
Přispěvatelé: Aksoy, Selim, Bilgisayar Mühendisliği Anabilim Dalı
Rok vydání: 2010
Předmět:
Popis: Uydu teknolojisindeki gelişmeler ve Dünya'nın geniş bir yüzeyini kapsayan detaylı görüntülerin mevcut olması, uydu görüntülerinde otomatik içerik çıkarma ve sınıflandırma yapabilen akıllı sistemlere duyulan ihtiyacı her geçen gün arttırmaktadır. Yeni nesil sensörlerden alınan çok yüksek uzamsal çözünürlüklü görüntülerdeki artan detaylar yeni uygulamaları mümkün kılmakla birlikte temel nesnelerin sezimini zorlaştırmaktadır. Görüntü yapıları hakkındaki bağlamsal bilgiler birbirinden bağımsız nesnelerin sezimini geliştirme potansiyeline sahiptir. Bu nedenle, özünde heterojen olan görüntü bölgelerinin tanımlanması, görüntü içeriğini anlamak için alternatif bir yoldur. Bileşik yapılar olarak da bilinen bu bölgeler birçok farklı türdeki temel nesnelerden oluşmaktadır. Kelimeler-torbası gibi popüler gösterimler, yerel operatörler kullanılarak çıkarılan temel nesne parçalarını kullanır fakat mekansal bilgi eksikliği nedeniyle onların yapısını tutamaz. Dolayısıyla, bileşik yapıların sezimi spektral, uzaysal ve yapısal bilgilerin ortak modellenmesini içeren yeni görüntü gösterimlerini zorunlu kılar.Biz, çizgelerin gösterim gücü ile kelimeler-torbası gösteriminin verimliliğini birleştiren bir görüntü gösterimi öneriyoruz. Önerilen yöntem üç bölümden oluşmaktadır. İlk bölümde, veri kümesindeki her bir görüntü yerel görüntü özellikleri ve onların uzamsal ilişkileri kullanılarak çizge yapısına dönüştürülür. Dönüştürme yöntemi ilk olarak gri seviye eşiklemesi ile elde edilen en kararlı uç bölgelerden, ilgili yerel yamaları tespit eder. Sonra, bu yamalar bir yerel bilgi çizelgesi oluşturmak için nicelendirilir, ve yamaları çizge düğümü gibi göstererek ve onları Voronoi mozaiğinden elde edilen kenarlarla birleştirerek her bir görüntü için bir çizge inşa edilir. Görüntülerin çizgelere dönüştürülmesi bir soyutlama düzeyi sağlar ve sınıflandırma için geriye kalan işlemler çizgeler üzerinde yapılır. Önerilen yöntemin ikinci bölümü görüntü çizgelerinin sınıflandırılması için en önemli altçizgelerin kümesini seçen bir çizge madenciliği algoritmasıdır. Önerdiğimiz çizge madenciliği algoritması ilk olarak her sınıf için sık görülen altçizgeleri bulur, sonra sınıf içinde görülme dağılımları açısından altçizgeler ve sınıflar arasındaki bağıntı miktarları ölçülerek en ayırt edici olanları seçer; ve son olarak altçizgeler arasındaki fazlalığı dikkate alarak en iyi temsil edenlerin seçmesiyle küme boyutunu küçültür. Altçizge kümesi madenciliğinden sonra her bir görüntü çizgesi, her bir bileşeninin bu kümenin belli bir altçizgesinin görüntüde görülme sayısını tuttuğu bir histogram vektörü ile gösterilir. Altçizge histogram gösterimi görüntü çizgelerinin istatistiksel sınıflandırıcılar kullanılarak sınıflandırılmasını mümkün kılar. Yöntemin son bölümü etiketli verilerinden model öğrenilmesini içerir. Görüntülerin anlamsal sahne türlerine sınıflandırılması için destek vektör makineleri (DVM) kullanıyoruz. Ek olarak, görüntüler üzerine dağılan temalar, aynı veriler üzerinde öğretilen gizli Dirichlet tahsisi (GDT) modeli kullanılarak keşfedilir. Bu sayede, farklı sahne türlerinden heterojen bir içeriğe sahip görüntüler bir tema dağılım vektörü olarak gösterilebilirler. Bu gösterim tema analizi ile görüntülerin daha ileri düzeyde sınıflandırılmasını sağlar.Antalya'nın bir Ikonos görüntüsü üzerindeki deneyler önerilen gösterimin karmaşık sahne türlerinin sınıflandırılmasındaki etkinliğini göstermektedir. DVM modeli Antalya görüntüsünden kesilen görüntülerde sekiz üst düzey anlamsal sınıf için umut verici sınıflandırma doğruluğu elde etti. Ayrıca, GDT modeli tüm uydu görüntüsünde ilginç temalar keşfetti. The need for intelligent systems capable of automatic content extraction and classification in remote sensing image datasets, has been constantly increasing due to the advances in the satellite technology and the availability of detailed images with a wide coverage of the Earth. Increasing details in very high spatial resolution images obtained from new generation sensors have enabled new applications but also introduced new challenges for object recognition. Contextual information about the image structures has the potential of improving individual object detection. Therefore, identifying the image regions which are intrinsically heterogeneous is an alternative way for high-level understanding of the image content. These regions, also known as compound structures, are comprised of primitive objects of many diverse types. Popular representations such as the bag-of-words model use primitive object parts extracted using local operators but cannot capture their structure because of the lack of spatial information. Hence, the detection of compound structures necessitates new image representations that involve joint modeling of spectral, spatial and structural information.We propose an image representation that combines the representational power of graphs with the efficiency of the bag-of-words representation. The proposed method has three parts. In the first part, every image in the dataset is transformed into a graph structure using the local image features and their spatial relationships. The transformation method first detects the local patches of interest using maximally stable extremal regions obtained by gray level thresholding. Next, these patches are quantized to form a codebook of local information and a graph is constructed for each image by representing the patches as the graph nodes and connecting them with edges obtained using Voronoi tessellations. Transforming images to graphs provides an abstraction level and the remaining operations for the classification are made on graphs. The second part of the proposed method is a graph mining algorithm which finds a set of most important subgraphs for the classification of image graphs. The graph mining algorithm we propose first finds the frequent subgraphs for each class, then selects the most discriminative ones by quantifying the correlations between the subgraphs and the classes in terms of the within-class occurrence distributions of the subgraphs; and finally reduces the set size by selecting the most representative ones by considering the redundancy between the subgraphs. After mining the set of subgraphs, each image graph is represented by a histogram vector of this set where each component in the histogram stores the number of occurrences of a particular subgraph in the image. The subgraph histogram representation enables classifying the image graphs using statistical classifiers. The last part of the method involves model learning from labeled data. We use support vector machines (SVM) for classifying images into semantic scene types. In addition, the themes distributed among the images are discovered using the latent Dirichlet allocation (LDA) model trained on the same data. By this way, the images which have heterogeneous content from different scene types can be represented in terms of a theme distribution vector. This representation enables further classification of images by theme analysis.The experiments using an Ikonos image of Antalya show the effectiveness of the proposed representation in classification of complex scene types. The SVM model achieved a promising classification accuracy on the images cut from the Antalya image for the eight high-level semantic classes. Furthermore, the LDA model discovered interesting themes in the whole satellite image. 113
Databáze: OpenAIRE