TP 10
RESEARCH DATA MANAGEMENT/BIOINFORMATICS – A TOOL FOR SYSTEMS MEDICINE
Das Ziel ist die Implementierung eines spezifischen Datenmanagement-Werkzeugs für die Nutzung im Forschungskonsortium. Das Ziel des Subprojektes ist die Implementierung eines Datenmanagement-Werkzeugs für alle Teilnehmer des Projektes, insbesondere aber für die Interpretation von molekularen Hochdurchsatzdaten und die Selektion von geeigneten Patientenkohorten. Es wird eine integrative Plattform für unterschiedliche Datentypen geschaffen, die den hohen Ansprüchen des deutschen Datenschutzes genügt und klinische Studiendaten, Biomaterialdaten und deren Metadaten und Resultate aus der Analyse von Genomik, Transkriptomik, Proteomik oder Metabolomik beinhaltet. Dieses Tool wird zunächst als Demonstrator mit Grundfunktionalitäten zur Verfügung stehen. Spätere Versionen werden mehr Funktionalitäten für NGS-Daten, Visualisierung und Schnittstellen zu anderen System besitzen. Es soll dafür eine Anforderungsanalyse erstellt werden, auf die ein technischer Entwurf der Forschungsinfrastruktur und ein Datenschutzkonzept folgen. Die Datenquellen und -formate werden im Anschluss analysiert und zugreifbar gemacht. An dieser Stelle sollen die Kernfunktionalitäten der Infrastruktur bereitgestellt werden. Die unterschiedlichen Ontologien der Quellsysteme sollen danach evaluiert und durch einen Terminologienserver vereinheitlicht und zugreifbar gemacht werden. Daraufhin soll die Integration von NGS-Daten evaluiert, und sofern möglich, umgesetzt werden. Die Infrastruktur soll danach um eine Präsentations- und Analysemöglichkeit erweitert werden. Zum Schluss soll der Zugriff auf konföderierte Daten evaluiert werden.
Keywords: data management; i2b2; tranSMART; privacy; analysis; data sources; ETL; ontology; semantics; research database; research data warehouse; NGS; next generation sequencing