Der Themenschwerpunkt Algorithmen befasst sich mit der Entwicklung und Adaption von Methoden der künstlichen Intelligenz für Fragestellungen im Bereich der Lebenswissenschaften. Dabei werden sowohl komplett neue Methoden entwickelt, als auch bestehende Verfahren angepasst um praxisrelevante biomedizinische Fragestellungen mit Methoden des Data Mining und der künstlichen Intelligenz adressieren zu können.
Beteiligte Arbeitsgruppen
Prof. Dr. Lars Kaderali
Institut für Bioinformatik
Universitätsmedizin Greifswald
AG Kaderali
Prof. Dr. Stefan Simm
Institut für Bioinformatik
Universitätsmedizin Greifswald
AG Simm
Prof. Dr. Mario Stanke
Institut für Mathematik und Informatik
Universität Greifswald
AG Stanke
Prof. Dr. Joscha Diehl
Professur für Stochastische Analysis
Universität Greifswald
Dr. Markus Becker
Arbeitsgruppe Dr. Markus Becker
Leibniz-Institut für Plasmaforschung und Technologie e.V.
Projekte
- Grundlagenmodelle:
Es werden Grundlagenmodelle für Genome entwickelt, wie GPT ein Grundlagenmodell für natürliche Sprache ist. Eine Herausforderung ist dabei, Alternativen für den Attention-Mechanismus (Aufmerksamkeit) zu finden, die eine lange Aufmerksamkeitsspanne haben, da dies bei Genomen besonders von Vorteil ist. Eine zweite Herausforderung, ist die Entwicklung von Modellen, die in der Lage sind, eine einfache Grammatik zu berücksichtigen. - Vorprozessierung von Daten:
Biomedizinische Daten haben oft besondere Eigenschaften, die die Anwendung von KI-Methoden erschweren: Hohe Varianz, sehr heterogene Verteilungen, fehlende Werte, Mischung aus diskreten und kontinuierlichen Daten, geringe Fallzahl aber große Merkmalsanzahl, Confounder. Dieses Projekt befasst sich mit Methoden der Vorprozessierung von Daten als Grundlage für weitere KI-Anwendungen. - Regularisierungsverfahren:
Anwendungen in der Medizin leiden oft an im Vergleich zu anderen KI-Anwendungsfällen kleinen Fallzahlen, bei gleichzeitig komplexen und hochdimensionalen Merkmalsräumen. Regularisierungsmethoden und die Integration von biologischem und medizinischem Vorwissen sind daher wichtige Voraussetzungen für viele KI-Algorithmen. - Hierarchische Bayes’sche Netze:
Erklärbarkeit von KI-Ergebnissen ist gerade bei medizinischen Fragestellungen eine wichtige Voraussetzung für deren erfolgreiche Translation in die Anwendung. Bayes’sche Netze und grafische Modelle sind daher hervorragend geeignete Methoden, um z.B. Zusammenhänge zwischen Risikofaktoren und manifester Erkrankung aus Daten zu lernen und zu visualisieren. Dieses Projekt befasst sich mit der Entwicklung von neuen Methoden zum Lernen von hierarchischen Bayes’schen Netzen, mit vielfältigen Anwendungen in Medizin und Epidemiologie. - Deep Learning:
Tiefe neuronale Netze (Deep Learning-Methoden) haben in den letzten Jahren einen wahren Boom erlebt, mit vielfältigen Anwendungen vor allem auch in der Bildprozessierung. In diesem Projekt entwickeln wir Deep Learning-Verfahren weiter für die Analyse komplexer klinischer und molekularer Datensätze, wobei ein Fokus insbesondere auf der Integration heterogener Daten liegt, und die Integration biologischen Vorwissens eine zentrale Rolle spielt. Anwendungen sind z.B. die Identifikation von molekularen Schlüsselmechanismen bei Alterungsprozessen und altersassoziierten Erkrankungen. - Diskriminativ trainierte Modelle molekularer Evolution:
Die Modellklasse der Wahl zur Modellierung von evolvierenden Sequenzen sind Markowketten stetiger Zeit, die durch Ratenmatrizen parametrisiert werden. Es werden neue Methoden entwickelt, diese Ratenmatrizen so zu schätzen, dass das Modell anhand der Unterschiede zwischen Sequenzen möglichst gut verschiedene Klassen unterscheiden kann. Eine Anwendung ist die Identifikation neuer proteinkodierender Sequenzen in Genomen. - Genomannotation:
Das Finden der Gene und im Falle von Eukaryoten ihrer Exon-Intron-Struktur in Genomen bezeichnet man als strukturelle Genomannotation. Wir entwickeln hierfür zur Verringerung der Fehleranzahl das Programm AUGUSTUS unter Anderem mit Methoden des maschinellen Lernens weiter. Ein Vorhaben ist die Integration von heterogenen Evidenzquellen und mehreren konkurrierenden Annotationen zu einer möglichst genauen Annotation unter Berücksichtigung von alternativem Spleißen. - Reinforcement Learning für eine epidemiologische Interventionsstrategie:
Die zufällige Verbreitung einer Krankheit durch Ansteckung kann durch Maßnahmen (z.B. Testen, Reduzierung der Ansteckungswahrscheinlichkeiten) bekämpft werden. Die Maßnahmen aus einem gegebenen Maßnahmenkatalog können mit „Kosten“ verbunden sein und ggf. beschränkt sein auf Unterpopulationen, die zum Beispiel örtlich definiert sein können. Ihre zeitliche Planung kann ein schwieriges Optimierungsproblem darstellen. In diesem neuen Projekt soll basierend auf einem Simulationsmodell für die Verbreitung eines Erregers mittels Reinforcement Learning eine Interventionsstrategie optimiert werden. - Bildanalyse:
In verschiedenen Einzelprojekten werden für zwei- bzw. dreidimensionale Bilddaten (Fotos, Mikroskopie, fMRI) Convolutional Neuronal Networks trainiert, um die Bilder zu klassifizieren, zu segmentieren oder um darauf Objekte zu identifizieren.
Publikationen
Publikationen folgen
Kontakt
Prof. Dr. Lars Kaderali
e-mail: lars.kaderali@med.uni-greifswald.de