Selbstüberwachtes maschinelles Lernen seismologischer Daten - Identifizierung und Clustering von seismischen Ereignisarten
Projektbeschreibung
Die Identifikation und Klassifikation seismischer Signale ist eine zentrale Aufgabe der Seismologie und bildet die Grundlage für das Verständnis geologischer Prozesse sowie für die Bewertung seismischer Gefährdung. Unterschiedliche Signalquellen, wie tektonische Erdbeben, induzierte Ereignisse oder Sprengungen, weisen charakteristische zeitliche und spektrale Eigenschaften auf. Mit dem stetigen Wachstum seismologischer Datensätze steigt jedoch der Bedarf an automatisierten, skalierbaren Methoden zur effizienten und zuverlässigen Analyse dieser Daten.
Ziel dieses Projekts ist die Entwicklung und Anwendung selbstüberwachter Machine-Learning-Verfahren zur automatischen Identifikation und Gruppierung seismischer Ereignisse. Dabei kommen moderne Deep-Learning-Architekturen wie Vision Transformer (ViT) und das selbstüberwachte Lernverfahren DINO (Self-Distillation with No Labels) zum Einsatz. Diese Methoden ermöglichen es, informative Merkmalsrepräsentationen direkt aus großen, nicht annotierten Datensätzen zu extrahieren, ohne auf manuell gelabelte Trainingsdaten angewiesen zu sein. Die so gewonnenen Repräsentationen werden anschließend mit Clustering-Verfahren wie k-Means oder DBSCAN analysiert, um verschiedene Signaltypen automatisch zu erkennen und zu unterscheiden.
Ein besonderer Fokus liegt auf der Analyse seismischer Daten aus der Region NW-Böhmen/Vogtland, die durch regelmäßige Erdbebenschwärme gekennzeichnet ist. Ein vorhandener, manuell erstellter Ereigniskatalog dient dabei zur Validierung und Bewertung der entwickelten Methoden. Zusätzlich werden Verfahren der erklärbaren künstlichen Intelligenz (Explainable AI, XAI) eingesetzt, um die Entscheidungsprozesse der Modelle nachvollziehbar zu machen und die geophysikalische Bedeutung der identifizierten Signalmerkmale zu untersuchen.
Langfristig soll die entwickelte Methodik auf größere seismologische Netzwerke und komplexe geologische Regionen übertragen und in automatisierte Auswertungssysteme integriert werden. Das Projekt leistet damit einen wichtigen Beitrag zur effizienten Analyse großer seismischer Datensätze und zur Verbesserung der seismologischen Überwachung.