TP 2

Datenmanagement und –integration

Das Teilprojekt etabliert ein zentrales Datenmanagementsystem für das Konsortium, in dem die existierenden Daten mit externen Datenquellen integriert werden. Dabei werden die Hochdurchsatzdaten auf mehreren Ebenen (GWAS, Exom, Transkriptom, Proteom) integriert und auf öffentlich verfügbare biologische Netzwerkdaten projiziert. Normalisierung und konsistente Datenprozessierung (von den Rohdaten) stellen dabei die Vergleichbarkeit der Daten sicher. Durch ein zentrales webbasiertes Interface erhalten die Mitglieder des Konsortiums Zugriff auf diese Daten. Automatische Datenextraktion wird über ein REST-Interface zum Data-Warehouse unterstützt. Die automatische Prozessierung der Daten über eine Workflow-Engine ermöglicht auch komplexe Analysen.


Keywords: Bioinformatics, Parkinson’s disease, data management, omics