Ein Ensemble von Deep-Learning-Verfahren zur Klassifizierung der Landbedeckung anhand von SAR-Zeitreihen
Ein Ensemble von Deep-Learning-Verfahren zur Klassifizierung der Landbedeckung anhand von SAR-Zeitreihen
Erdbeobachtungsdaten über die Landbedeckung dienen zunehmend als wichtige Quelle für die Einschätzung der Ressourcen infolge des Anstiegs der Weltbevölkerung. Dank der verfügbaren dichten Zeitreihen von Synthetisches Aperturradar (SAR)-Bildern, wie sie von der Sentinel-1-Mission geliefert werden, und neuer Maschinelles Lernen (ML)-Methoden, kann die Landbedeckung zuverlässig und aktuell detektiert werden. Diese Arbeit untersucht die Verwendung von Inception-Knoten in Neural Network (Faltungsneuronales Netzwerk) (NN) für die pixelbasierte Klassifizierung der Landbedeckung auf Basis von SAR-Zeitreihen der Sentinel-1 Mission. Sie untersucht die Leistung des Modells sowohl mit Zeitreihen reiner Rückstreuwerte als auch mit Zeitreihen aus der Interferometrisches Synthetisches Aperturradar (InSAR)-Kohärenzschätzung von Sentinel-1. Das optimale Design der Netzwerkarchitektur wird mit der Methode der Gittersuche in der Hyperparameteroptimierung bestimmt. Darüber hinaus wird der Effekt der Einbeziehung direkt angrenzender Pixel in die Netzwerkvorhersage untersucht. Die höchst erreichte Gesamtgenauigkeit beträgt 95% bei Verwendung der Rückstreuwerte aus SAR-Bildern. Bei Verwendung von Zeitreihen der InSAR-Kohärenzschätzungen ergibt sich eine geringere Gesamtgenauigkeit von 84%. Es wird festgestellt, dass das Netzwerk unter Verwendung von Inception-Modulen wichtige Merkmale aus den Zeitreihen extrahieren und erlernen kann. Dieses Modell berücksichtigt Polarimetrie, Flugrichtung und die lokale Umgebung von 3x3 Pixeln, um die Klassenzugehörigkeit eines Pixels zu bestimmen. Dabei verbessert die Berücksichtigung direkt angrenzender Pixel die Gesamtgenauigkeit des Netzwerks um 5%. Bei Verzicht auf Inception-Knoten innerhalb der Architektur sinken die Genauigkeiten. Die Modelle werden mit jeweils identischen Daten aus dem Integriertes Verwaltungs- und Kontrollsystem (INVEKOS) und dem Amtliches Topographisch-Kartographisches Informationssystem (ATKIS) trainiert. Im Untersuchungsgebiet werden alle Feldfrüchte berücksichtigt, die mehr als 1% der Produktion des Bundeslandes Nordrhein-Westfalen (NRW) (aus INVEKOS) ausmachen. Dies umfasst 13 Kulturarten: Grünland, Erbsen, Kartoffeln, Mais, Raps, Zuckerrüben, Hafer, Triticale, Sommergerste, Wintergerste, Roggen, Weizen und Ackerbohnen. Zusätzlich werden 6 Klassen aus dem ATKIS-Datensatz extrahiert, die im Vergleich zu den landwirtschaftlichen Flächen ein weniger dynamisches Erscheinungsbild aufweisen. Diese Klassen umfassen bebaute Gebiete, Wälder und forstwirtschaftlich genutzte Flächen, Gewässer, Asphalt (Straßennetze), Moor- und Heidelandschaften. Die vorgestellten Ergebnisse zeigen den Mehrwert der Verwendung von Inception-Modulen bei der Landbedeckungsklassifikation, der sich durch höhere Genauigkeiten und eine bessere Robustheit gegenüber Fehlern in den Trainingsdaten auszeichnet.
Earth observation data is increasingly serving as an important source for assessing resources due to the rise in the world population. Thanks to the available dense time series of SAR images, as provided by the Sentinel-1 mission, and new machine learning methods, a reliable system for monitoring land cover can be developed. This work investigates the use of Inception nodes in neural networks for pixel-based classification of land cover using SAR time series of the Sentinel-1 mission. It examines the performance of the model with both time series of pure backscatter values and time series from the InSAR coherence estimation of Sentinel-1. The optimal design of the network architecture is determined using the grid search method in hyperparameter optimization. Furthermore, the effect of including directly adjacent pixels in the network prediction isexamined. The highest achieved overall accuracy is 95% when using the backscatter values from SAR images. Using time series of InSAR coherence estimations, a lower overall accuracy of 84% is achieved. It is found that the network, using Inception modules, can extract and learn important features from the time series. This model considers polarimetry, flight direction, and the local environment of 3x3 pixels to determine the class membership of a pixel. The inclusion of directly adjacent pixels improved the overall accuracy of the network by 5%. Comparison with similar architectures that do not use Inception nodes shows lower accuracies. The models are trained with identical data from InVeKoS and ATKIS. In the study area, all crops that account for more than 1% of the production in the state of North Rhine-Westphalia are considered. This includes 13 crop types out of InVeKoS dataset: grassland, peas, potatoes, corn, rapeseed, sugar beets, oats, triticale, summer barley, winter barley, rye, wheat, and field beans. Additionally, 6 classes from the ATKIS dataset are extracted, which show a less dynamic appearance compared to agricultural areas. These classes include built-up areas, forests and forestry areas, water bodies, asphalt (road networks), moorlands, and heathlands. The presented results demonstrate the added value of using Inception modules in land cover classification using SAR time series, which is characterized by higher accuracies and improved robustness against errors in training data.

