Algorithmen

Der Themenschwerpunkt Algorithmen befasst sich mit der Entwicklung und Adaption von Methoden der künstlichen Intelligenz für Fragestellungen im Bereich der Lebenswissenschaften. Dabei werden sowohl komplett neue Methoden entwickelt, als auch bestehende Verfahren angepasst um praxisrelevante biomedizinische Fragestellungen mit Methoden des Data Mining und der künstlichen Intelligenz adressieren zu können.

Beteiligte Arbeitsgruppen

Prof. Dr. Lars Kaderali

Institut für Bioinformatik
Universitätsmedizin Greifswald
AG Kaderali

Prof. Dr. Stefan Simm

Institut für Bioinformatik
Universitätsmedizin Greifswald
AG Simm

Prof. Dr. Mario Stanke

Institut für Mathematik und Informatik
Universität Greifswald
AG Stanke

Prof. Dr. Joscha Diehl

Juniorprofessur für Stochastische Analysis
Universität Greifswald 

Dr. Markus Becker

Arbeitsgruppe Dr. Markus Becker
Leibniz-Institut für Plasmaforschung und Technologie e.V.

Projekte

  • Vorprozessierung von Daten: Biomedizinische Daten haben oft besondere Eigenschaften, die die Anwendung von KI-Methoden erschweren: Hohe Varianz, sehr heterogene Verteilungen, fehlende Werte, Mischung aus diskreten und kontinuierlichen Daten, geringe Fallzahl aber große Merkmalsanzahl, Confounder. Dieses Projekt befasst sich mit Methoden der Vorprozessierung von Daten als Grundlage für weitere KI-Anwendungen.
  • Regularisierungsverfahren: Anwendungen in der Medizin leiden oft an im Vergleich zu anderen KI-Anwendungsfällen kleinen Fallzahlen, bei gleichzeitig komplexen und hochdimensionalen Merkmalsräumen. Regularisierungsmethoden und die Integration von biologischem und medizinischem Vorwissen sind daher wichtige Voraussetzungen für viele KI-Algorithmen.
  • Hierarchische Bayes’sche Netze: Erklärbarkeit von KI-Ergebnissen ist gerade bei medizinischen Fragestellungen eine wichtige Voraussetzung für deren erfolgreiche Translation in die Anwendung. Bayes’sche Netze und grafische Modelle sind daher hervorragend geeignete Methoden, um z.B. Zusammenhänge zwischen Risikofaktoren und manifester Erkrankung aus Daten zu lernen und zu visualisieren. Dieses Projekt befasst sich mit der Entwicklung von neuen Methoden zum Lernen von hierarchischen Bayes’schen Netzen, mit vielfältigen Anwendungen in Medizin und Epidemiologie.
  • Deep Learning: Tiefe neuronale Netze (Deep Learning-Methoden) haben in den letzten Jahren einen wahren Boom erlebt, mit vielfältigen Anwendungen vor allem auch in der Bildprozessierung. In diesem Projekt entwickeln wir Deep Learning-Verfahren weiter für die Analyse komplexer klinischer und molekularer Datensätze, wobei ein Fokus insbesondere auf der Integration heterogener Daten liegt, und die Integration biologischen Vorwissens eine zentrale Rolle spielt. Anwendungen sind z.B. die Identifikation von molekularen Schlüsselmechanismen bei Alterungsprozessen und altersassoziierten Erkrankungen.
  • Whole-Genome-Regression: In großem Maße erbliche phänotypische Merkmale wie zum Beispiel die Körpergröße beim Menschen sind durch das Genom mitbestimmt. Solche Merkmale können in komplexen Fällen, in denen ein Zusammenhang mit vielen genotypischen Merkmalen wie sogenannten Single Nucleotide Polymorphisms (SNPs) besteht, mit den gängigen linearen Regressionsmethoden oft viel schlechter aus dem Genom geschätzt werden als die Erblichkeit des Merkmals erwarten lässt. In diesem Projekt werden maßgeschneiderte nicht-lineare Machine-Learning-Methoden zur Regression entwickelt und an einer Kohorte von ca. einer halben Million Probanden getestet.
  • Diskriminativ trainierte Modelle molekularer Evolution: Die Modellklasse der Wahl zur Modellierung von evolvierenden Sequenzen sind Markowketten stetiger Zeit, die durch Ratenmatrizen parametrisiert werden. Es werden neue Methoden entwickelt, diese Ratenmatrizen so zu schätzen, dass das Modell anhand der Unterschiede zwischen Sequenzen möglichst gut verschiedene Klassen unterscheiden kann. Anwendungen sind die Identifikation neuer proteinkodierender Sequenzen in Genomen und das Finden von räumlich benachbarten Residuen von Proteinen, die nur als Sequenz zur Verfügung stehen (Contact Map).
  • Genomannotation: Das Finden der Gene und im Falle von Eukaryoten ihrer Exon-Intron-Struktur in Genomen bezeichnet man als strukturelle Genomannotation. Wir entwickeln hierfür zur Verringerung der Fehleranzahl das Programm AUGUSTUS unter Anderem mit Methoden des maschinellen Lernens weiter. Ein Vorhaben ist die Integration von heterogenen Evidenzquellen und mehreren konkurrierenden Annotationen zu einer möglichst genauen Annotation unter Berücksichtigung von alternativem Spleißen.
  • Multiples Sequenzalignment: In diesem Projekt wird das klassische Problem, bei einer Menge von als verwandt angenommenen Sequenzen, die sich entsprechenden Positionen zu identifizieren, neu aufgenommen und als Problem maschinellen Lernens aufgefasst. Zum Einsatz kommen hier sogenannte Graph-Neuronale-Netze. Dabei werden mit den Knoten und Kanten eines Graphen jeweils Tensoren assoziiertet und iterativ und durch lokales versenden von „Nachrichten“ neu berechnen, etwa um Kanten oder Knoten oder den Graphen zu klassifizieren.
  • Reinforcement Learning für eine epidemiologische Interventionsstrategie: Die zufällige Verbreitung einer Krankheit durch Ansteckung kann durch Maßnahmen (z.B. Testen, Reduzierung der Ansteckungswahrscheinlichkeiten) bekämpft werden. Die Maßnahmen aus einem gegebenen Maßnahmenkatalog können mit „Kosten“ verbunden sein und ggf. beschränkt sein auf Unterpopulationen, die zum Beispiel örtlich definiert sein können. Ihre zeitliche Planung kann ein schwieriges Optimierungsproblem darstellen. In diesem neuen Projekt soll basierend auf einem Simulationsmodell für die Verbreitung eines Erregers mittels Reinforcement Learning eine Interventionsstrategie optimiert werden.
  • Bildanalyse: In verschiedenen Einzelprojekten werden für zwei- bzw. dreidimensionale Bilddaten (Fotos, Mikroskopie, fMRI) Convolutional Neuronal Networks trainiert, um die Bilder zu klassifizieren, zu segmentieren oder um darauf Objekte zu identifizieren.

Publikationen

Publikationen folgen

Kontakt

Prof. Dr. Lars Kaderali
e-mail: lars.kaderali@med.uni-greifswald.de