Zum Inhalt springen Zur Suche springen

PacBio - Whole Genome Sequencing

Beim Whole Genome SMRT Sequencing wird die hochmolekulare DNA zunächst einheitlich geschert, und ohne Amplifikationsschritt zur Vorbereitung der Bibliotheken eingesetzt. Durch einen optionalen size-selection Schritt können kürzere Fragmente vor der Sequenzierung entfernt werden.

Je nach Fragestellung des Projektes, können zwei verschiedene Arten Reads in der Sequenzierung generiert werden. Die erste Variante ist es möglichst lange Reads zu erzeugen, dabei werden die individuellen DNA Fragmente nur einmal abgelesen (CLR – Continuous Long Reads). Diese Methode eignet sich besonders gut um strukturelle Varianten zu detektieren, die Fehlerrate liegt hier bei ca. 15 %. Eine Sequel SMRT Cell (8M) sollte in Verbindung mit dem CLR Workflow mind. 100 Gb an CLR Output Daten liefern.

Die zweite Möglichkeit ist es individuelle DNA Fragmente mit einer mittleren Größe von 15-20 kb mehrmals abzulesen. Aus den einzelnen Subreads kann dann eine hoch akkurate Konsensussequenz gebildet werden, so genannte HiFi (high fidelity) oder CCS (Circular consensus sequence) Reads. Die Fehlerrate liegt hier nur noch bei 0,1 %. Diese Methode eignet sich besonders gut um z.B. SNVs (Single Nucleotide Variants) zu detektieren oder für de novo Genom Assemblies, für die dann keine zusätzlichen Short Read Daten mehr benötigt werden.
Eine Sequel SMRT Cell (8M) sollte in Kombination mit dem CCS Workflow ca. 15 Gb an HiFi Daten liefern. Der Sequel II hat gegenüber dem Vorläufermodell einen ca. 10-fach höheren Output. Durch diesen höheren Output ist es jetzt auch möglich für z.B. humane Genome HiFi Reads zur Detektion von SNVs und InDels zu nutzen oder ein de novo Genom Assembly aus 15-20kb HiFi Reads zu generieren. Die Anzahl an benötigten SMRT Cells – und damit ein Faktor zur Berechnung der Sequenzierkosten – variiert je nach Genomgröße des sequenzierten Organismus und gewünschter Coverage.

  • Gap Filling: Das PacBio Assembly wird nur verwendet, um Lücken oder Unklarheiten in einem bereits bestehenden short-read scaffold Genom zu überspannen
  • Strukturvarianten (SV) Detektion: Hier wird das de novo assemblierte PacBio Genom gegen ein bekanntes Referenzgenom gemappt, um große strukturelle Unterschiede (z.B. Insertionen / Deletionen / Inversionen) zu detektieren
  • Hybrid assembly: Hier werden long und short read Daten in einem assembly kombiniert, um die Fehler beider Ansätze möglichst gering zu halten
  • De novo assembly: Es wird ein komplett neues, qualitativ hochwertiges Genom des Organismus erstellt, im Idealfall mit einer Sequenz pro Chromosom / Plasmid

Proben mit kleinen Genomen, z.B. Bakterien, können gemultiplexed werden. Proben mit großen Genomen müssen ggf. auf mehreren SMRT Cells parallel sequenziert werden, um eine ausreichend hohe Coverage zu erhalten.

Bitte beachten Sie unsere Probenanforderungen: