Dr. Mario Trouillier ist derzeit Postdoc im DIG-IT! Projekt in der Arbeitsgruppe für Landschaftsökologie und Ökosystemdynamik. Dabei verwendet er in seiner Forschung maschinelles Lernen wie verstärkte Regressionsbäume oder tiefe neuronale Netze für die Analyse des Baumwachstums. Im Rahmen unserer Interviewreihe hatten wir die Möglichkeit, Herrn Trouillier einige Fragen zu stellen. In diesem Beitrag finden Sie die spannenden Antworten von Herrn Trouillier.
Bitte beschreiben Sie kurz, was Ai For Life für Sie ausmacht. Wie schätzen Sie den langfristigen Stellenwert eines solchen Netzwerks ein?
Ai for Life ist eine tolle Plattform an der Universität Greifswald die den Austausch zwischen Wissenschaftler:innen rund um das Thema künstliche Intelligenz – oder sagen wir besser “Machine Learning“ – fördert. Das besondere ist der Austausch zwischen den unterschiedlichen Instituten, denn es geht um Methoden, welche in verschiedensten Disziplinen Anwendung finden. Bilderkennungsalgorithmen finden beispielsweise Einsatz in Medizin, Fernerkundung und Mikrobiologie. Genau darin liegt auch der langfristige Nutzen von Ai for Life: man lernt verschiedenste neue Methoden kennen und versteht dann, wie man diese im eigenen Forschungsbereich einsetzen kann.
Sprechen wir kurz über Ihre Schwerpunkte. Am Institut für Botanik und Landschaftsökologie beschäftigen Sie sich unter anderem mit der Nutzung von maschinellem Lernen für die Analyse des Wachstums von Bäumen. Welche Rolle spielen Anwendungen der künstlichen Intelligenz heute bereits in der Landschaftsökologie?
Waldwachstumsmodelle gibt es schon sehr lange. Bäume und Wälder sind jedoch sehr komplexe Systeme bei der eine Vielzahl von Variablen interagieren, beispielsweise Klima- und Bodenparameter, Baumphysiologie, Holzanatomie, oder all die Interaktionen zwischen verschiedenen Pflanzen-, Tier- und Pilzarten. Ein realistische Waldwachstumsmodell zu erstellen ist dadurch sehr schwierig.
Machine Learning Methoden ermöglichen es, dass die einzelnen Prozesse und “Regeln“, denen die Bäume folgen, nicht manuell programmiert werden müssen. Die Modelle lernen all die Muster und Zusammenhänge in den Daten von selbst. Man braucht lediglich einen großen Datensatz, zum Beispiel Klimadaten, Baumparameter und die Wachstumsraten der Bäume in einem Jahr. Mit diesen Daten kann man dann ein künstliches neurales Netzwerk trainieren. Das Modell kann dann die Wachstumsrate der Bäume unter verschiedensten Bedingungen vorhersagen.
Generell findet KI bisher aber noch vergleichsweise selten Anwendung in der Landschaftsökologie. Zum einen dauert es meist etwas bis die neusten Entwicklungen auch für Nicht-Computerwissenschaftler:innen nutzbar sind. Frameworks wie TensorFlow oder PyTorch sind in den letzten Jahren zum Glück viel besser und auch leichter nutzbar geworden. Zum anderen müssen Ökolog:innen sich in die neuen Methode einarbeiten und verstehen, welche ihrer Fragestellungen oder Probleme sich mit Machine Learning lösen lassen. In unserem Projekt DIG-IT! nutzen wir Beispielsweise Deep Learning, um Pollen aus Seesedimenten, Fledermausarten, Holzzellen oder Wurzeln auf Bildern zu erkennen. Diese Art der automatischen Bildanalyse ermöglicht es sehr effizient große Bilddatenbanken auszuwerten und erschließen so völlig neue Forschungsmöglichkeiten.
Wie schätzen Sie die weitere Entwicklung in der Forschung im Bereich agentenbasierter Modelle und künstlichen neuronalen Netzen ein?
Agenten- oder individuenbasierte Modelle sind ein wichtiges Werkzeug in der Ökologie. Typischerweise programmiert man dabei manuell das Verhalten der “Individuen“ (Bäume, Tiere, Bakterien, Partikel, etc.), um dann in Simulationen zu beobachten wie sich diese unter verschiedenen Bedingungen verhalten. Oft kann man dann in der Simulation Selbstorganisation und emergente Eigenschaften beobachten. Man kann zum Beispiel die Populationsdynamik von Tieren in einer Landschaft, oder die Entwicklung von Wäldern modellieren, wenn man weiß wie sich die einzelnen Tiere oder Bäume verhalten. Das Schwierige dabei ist es aber, genau die richtigen Regeln zu finden, nach denen sich die einzelnen Individuen verhalten sollen.
Künstliche neurale Netzwerke können dieses Problem lösen, indem sie die Individuen basierten Modelle auf den Kopf stellen: Anstatt das Verhalten der Individuen manuell zu programmieren, kann man ein künstliches neurales Netzwerk nutzen, um diese Verhaltensegeln zu erlernen. Man kann also fragen: Wenn ich diese Populationsdynamik einer Tierpopulation beobachtet habe, welchen Verhaltensregeln folgen dann die einzelnen Individuen? Wenn ich diese Waldstruktur beobachtet habe, welchen Wachstumsregeln müssen Einzelbäume dann folgen? Dieser Ansatz eröffnet völlig neue Möglichkeiten.
Werden Methoden wie maschinelles Lernen zur Verarbeitung großer Datensätze und andere KI-gestützte Anwendungen bei der Erforschung ökologischer und botanischer Fragestellungen in Zukunft eine noch größere Rolle einnehmen?
Auf jeden Fall! Wir haben gerade erst begonnen, Machine Learning Methoden zu nutzen. Momentan nutzen wir dieses neue Werkzeug hauptsächlich für die Automatisierung, also zum Beispiel für die automatischen Auswertung tausender Bilder. Viele weitere Anwendungen sind aber noch wenig erforscht, wie das Beispiel der individuenbasierten Modelle oben zeigt.
Stoßen Sie bei der Methodik des maschinellen Lernens aktuell auf besondere Herausforderungen? Gibt es etwas, das sich Ihrer Meinung nach noch verbessern müsste, damit künstliche Intelligenz effektiver und effizienter in der Landschaftsökologie eingesetzt werden könnte?
Eine der größten Herausforderungen sind die Daten. Machine Learning Methoden brauchen oft riesige Datenmengen für das Training. Besonders für das sogenannte supervised learning müssen Bilder (oder andere Daten) erst von Menschen manuell gelabelt und segmentiert werden. Dieser Aufbau von großen und qualitativ hochwertigen Trainingsdatensätzen wird zukünftig sicher einen wichtige Rolle in der Ökologie spielen.
Für die Forschung im Wald werden wir große Monitoring Netzwerke aufbauen müssen. Die Daten der Bundeswaldinventur sind gut, reichen aber nicht aus. Um besser zu verstehen wie Bäume wachsen, müssen wir den “Puls der Wälder“ live messen. Dazu werden Dendrometer den Zuwachs der Bäume im Minutentakt aufzeichnen, Minirhizotrone werden stündlich das Wachstum der Wurzeln analysieren, und Klimastationen werden Temperatur, Niederschlag und Luftfeuchte messen.
Außerdem werden wir natürlich Ökolog:innen brauchen, die nicht nur biologisches Fachwissen mitbringen, sondern auch programmieren können. In den Schule und Studiengängen müssen entsprechende Grundlagenkurse angeboten werden, damit die nächste Generation von Ökolog:innen wie selbstverständlich mit Python, R oder anderen Programmiersprachen umgehen können.
Wir bedanken uns für das Interview und sind gespannt, welche Entwicklungen der Einsatz von künstlicher Intelligenz in Fragestellungen der Ökologie in Zukunft bereithält. Alle spannenden Neuigkeiten rund um Ai for Life erfahren Sie wie immer als erstes hier auf unserer Website, daher raten wir zu einem regelmäßigen Besuch!