Zum Inhalt springenZur Suche springen

Datenanalyse

Da die bioinformatische Auswertung von Datensätzen in jedem Projekt eine zentrale Rolle spielt, bietet das GTL selbstverständlich Unterstützung bei der Auswertung Ihrer Daten an.

Generell unterscheiden wir zwischen drei verschiedenen Stufen der Datenauswertung:

Level 1: Generation of raw per-sample FastQ files and basic QC statistics, data delivery
Level 2: Standard semi-automated analysis generating the baseline for experiment specific result evaluation, basic sanity check
Level 3: Experiment specific result evaluation requiring manual custom analysis including expert knowledge and platforms enabling the same.

Die Datenauswertung auf Level 1 ist hierbei immer fester Bestandteil jedes Auftrages. Die Auswertungen nach Level 2 und 3 sind optional.

Auswertung von Microarray-Daten

Für die Analyse und Interpretation von DNA-Microarray Daten verfügen wir über etablierte und optimierte Auswertestrategien. Abhängig vom jeweilig verwendeten experimentellen Design und der verwendeten Microarray Plattform kommen verschiedene Software-Pakete zur statistischen Datenanalyse zum Einsatz (GeneSpring GX, Partek Genomic Suite, Bioconductor-R-Pakete). So generieren wir für Sie spezifische Genexpressionsprofile und führen diverse Clusteranalysen durch (hierarchisches Clustering, Principal Component Analysis PCA). Die Identifikation differentiell exprimierter Gene erfolgt anschließend über verschiedene statistische Methoden bis hin zur mehrfaktoriellen Varianzanalyse (ANOVA; analysis of variance) inklusive Fehlerkorrektur bei multiplen Tests. Zur funktionellen Analyse der differentiell exprimierten Gene können wir sowohl GeneOntology Analysen als auch detaillierte Netzwerk- und Pathway-Analysen durchführen.

Auswertung von NGS-Daten

Für die Analyse von umfangreichen NGS-Datensätzen stehen uns verschiedene kommerzielle und open source Software-Pakete sowie die entsprechenden IT-Ressourcen zur Verfügung.

Während der primären Datenanalyse wird die Qualität der generierten Rohdaten (Sequenzreads im fastq- / xsq-Format) überprüft und dokumentiert.

Für die Bewertung der Sequenzdaten werden u.a. folgende Parameter herangezogen:

  • Korrekte Erkennung der Barcodes / Demultiplexing
  • Readzahlen pro Lauf / Lane / Chip / Sample etc.
  • Readlängenverteilung
  • Durchschnittliche Qualität der Reads

Die detaillierte sekundäre Datenanalyse (read mapping, DeNovo Assembly, miRNA detection, etc.) bzw. die Analyse der differentiellen Genexpression wird mit den entsprechenden geeigneten Softwarepaketen durchgeführt (CLCbio Genomics Workbench, Partek Genomics Suite, etc.).

Auf Wunsch führen wir weiter gehende, tertiäre Datenanalysen auf funktioneller Ebene durch (Ingenuity Pathway Analysis).

Verantwortlichkeit: