TP1 - SASKit

Biomarker Discovery für Pankreaskarzinom, Schlaganfall und deren Komorbidität basierend auf humanen, Tier und in-vitro Daten.

Die bioinformatische Auswertung konzentriert sich für die Biomarkeridentifikation auf die Analyse der Transkriptom und Proteindaten, auf das klinische Blutbild und phänotypische Daten, sowie öffentlich zugängliche Daten. Wir streben einfach zu interpretierende diagnostische/theranostische Biomarker für die Verschlechterung bzw. Gesundung, und letztendlich für therapeutische Interventionen, an. Maschinelles Lernen von Biomarkern beginnt mit einfachen, korrelationsbasierten Ansätzen, die im Prinzip alle Messwerte beinhalten können, für die mehrere Zeitpunkte oder Konditionen existieren. Die Daten mit der höchsten Korrelation und korrelationsbasierte Subnetzwerke werden anschließend mit Detail untersucht. Wir würden z.B. erwarten, dass die longitudinale Veränderung entzündlicher Blutkomponenten (z.B. neutrophile Granulozyten) mit entzündungsassoziierter Genexpression in verschiedenen Geweben, Altersklassen und ganz allgemein dem Seneszenzstatus korreliert. Wir werden auch die vielversprechendsten Standardanalysen für Omicsdaten anwenden, wie Genontologien und Anreicherungsuntersuchungen von Stoffwechselwegen. Sobald ausreichend Daten zu unseren klinischen Endpunkten verfügbar sind, wie z.B. Verlaufs/Überlebens und Genesungsdaten, werden wir auch Cox Regressionsmodelle, Supportvektormaschinen (SVM), Random Forests und Neuronale Netze einsetzen.
Der Parallelogrammansatz wird eine wichtige Komponente in unserer Analyse sein. Hier extrapolieren wir Expressionsdaten für eine Spezies/Gewebe Kombination, aus den Daten der drei anderen Kombinationen (2 Arten & 2 Gewebe). Dies erlaubt uns Expressionsdaten für humane Gewebe zu schätzen, auf die wir keinen Zugriff haben. Der tatsächliche Extrapolationsschritt kann auf verschiedenen Methoden basieren, die wir für Interaktions-, Subnetzwerk- und Stoffwechselwegdaten optimieren werden. Im Laufe von Voruntersuchungen stellten wir fest, dass es keine geeigneten öffentlich zugänglichen Datensätze gibt, aber wir kontaktierten erfolgreich die Autoren von van der Velpen (2016) und konnten deren Daten über die Effekte von Isoflavon in Blut und Fettgewebe in Menschen und Ratten erhalten. Wir benutzten diese Daten um eine einfache Parallelogramm Methode auf Ebene der Stoffwechselwege zu testen. In der Tat erlaubte das Verhältnis der Veränderungen zwischen Blut und Fett der Ratte gute Vorhersagen für humanes Fettgewebe basierend auf humanem Blut. Die Veränderungen des KEGG Reaktionsweges für zelluläre Seneszenz wurde mit einem Fehler von lediglich 3% extrapoliert.


Parallelogramm Ansatz: Expressionsveränderungen für Transkripte, die an zellulärer Seneszenz und anderen Reaktionswegen beteiligt sind, werden aufaddiert und das Verhältnis Blut/Fett ist für Mensch und Ratte aufgetragen. Werte nahe 1 bedeuten eine große Ähnlichkeit zwischen Blut und Fettgewebe. In diesem einfachen Vorversuch liegt der Punkt für zelluläre Seneszenz (schwarz) nahe bei den Koordinaten 1/1, ebenso wie die Punkte diverser anderer Reaktionswege. Dies deutet auf ein gutes Ergebnis der Extrapolation hin.