Nanopore-Sequenzierung
Wie funktioniert die Nanoporen-Sequenzierung in Kürze:
Nanopores sind winzige synthetische Proteinporen (stellen Sie sich diese als kleine Tunnel vor), die an einer Membran befestigt sind und den Durchgang von DNA ermöglichen. Dabei ist zu berücksichtigen, dass durch den Durchgang von Ionen (d. h. elektrisch geladenen Atomen) durch die Nanopore ein konstanter elektrischer Strom fließt. Wenn ein DNA-Molekül die Nanopore passiert, verursacht jedes Nukleotid eine kleine Unterbrechung des internen Ionenstroms in der Pore. Diese Unterbrechung wird dann von einem Chip mit einer Frequenz von 5 kHz gemessen. Die gemessene Unterbrechung des elektrischen Stroms wird dann als „Squiggle“-Signal ausgegeben, das dann in Computerdateien im fast5- oder pod5-Format gespeichert wird. Da bestimmte Kombinationen von Nukleotiden zu charakteristischen Unterbrechungen des Ionenstroms führen, kann dieses Squiggle-Signal mit Hilfe spezieller Algorithmen wie neuronaler Netze in genetischen Code übersetzt werden. In diesem Fall wird die Erzeugung von Squiggle- und genetischen Sequenzdaten als „Sequenzierung“ bezeichnet, während die Übersetzung vom Squiggle-Signal in DNA-Sequenzdaten allein allgemein als „Basecalling“ bezeichnet wird. Die Nanopore-Technologie ermöglicht das Basecalling in Echtzeit, wodurch die Zeitspanne zwischen der Sequenzierung der Proben und der Datenproduktion verkürzt wird. Das Basecalling kann auch im Nachhinein erfolgen, was in der Regel mit den genaueren, aber rechenintensiveren Basecalling-Algorithmen geschieht. Diese Algorithmen werden bezeichnet als: Fast, High Accuracy (HAC) und Super High Accuracy (SUP) Algorithmen, die einen Kompromiss zwischen der Sequenzgenauigkeit und den für Ihre Ausführung erforderlichen Rechenressourcen darstellen.
Nukleotid bezieht sich auf einen der 4 molekularen Bausteine oder Basen, die den so genannten genetischen Code in der DNA bilden: dies sind Adenin (A), Cytosin (C), Guanin (G) und Thymin (T)).
In diesem Fall ist ein Sequenzierungs-Read eine abgeleitete Sequenz von Squiggle- oder häufiger Basenpaaren (d. h. ein sogenanntes Squiggle-Signal), die einem einzelnen DNA-Fragment ganz oder teilweise entspricht.
Read Genauigkeit: Damals und heute
In der Vergangenheit wies die Nanopore-Sequenzierung eine höhere Fehlerquote auf als andere DNA-Sequenzierungstechnologien. Einige Studien der letzten Jahre berichteten über eine überhöhte Fehlerquote von bis zu 8 %, die hauptsächlich auf die Schwierigkeiten der Nanopores bei der genauen Unterscheidung von Homopolymeren zurückzuführen war.
Dank der Verbesserungen bei den Fließzellen, der Reaktionschemie und der Bioinformatik sowie der Duplex-Sequenzierung (Basenabruf der vorwärts- und rückwärtskomplementären DNA-Stränge im Tandem) ist diese Fehlerquote jedoch auf 0,6 % gesunken. Mehrere Studien haben gezeigt, dass mit Nanopore DNA-Barcodes hergestellt werden können, die zu >99,99 % mit Sanger-Barcodes identisch sind, und das zu einem Bruchteil der Kosten.
Homopolymer: Ein Molekül, das aus einer einzigen sich wiederholenden Einheit besteht. In DNA-Sequenzen wäre dies eine der 4 Basen (d. h. A, C, G oder T), die mehrmals hintereinander wiederholt wird.
DNA-Barcode: Eine relativ kurze (<1kb) DNA-Sequenz, die genügend Variationen enthält, um zwischen Arten zu unterscheiden. Der Name Barcode leitet sich davon ab, dass er eine sehr ähnliche Funktion erfüllt wie normale Barcodes für Lagerbestände.
Read-Länge und Durchsatz
Die Nanopore-Sequenzierung ist eine der beiden einzigen Sequenzierungstechnologien, die in der Lage sind, präzise lange Reads zu erzeugen. Bei der Verwendung normaler Sequenzierkits sind die meisten Reads etwa 10-100 kb lang, während die Verwendung von Ultra-Long-Read-Sequenzierkits zu einer Zunahme der Reads von 100 bis 300 kb Länge führt, sofern die DNA von guter Qualität ist. In einigen Fällen wurden extrem lange Reads, so genannte „Wale“, mit einer Länge von mehreren Megabasen (Mb) gemeldet.
Die Datenmenge, die durch eine Nanopore-Sequenzierung erzeugt wird, hängt vom jeweiligen Modell ab. Ein Beispiel: Während ein MinION im Durchschnitt 10-20 Gb pro Fließzelle produziert, kann der größere PromethION bis zu 200 Gb pro Fließzelle produzieren.
Kilobase (kb) = 1000 Basen (Nukleotide) Megabase (Mb) = 1.000.000 Basen Gigabase (Gb) = 1.000.000.000 Basen
Wie können wir von der Nanopore-Sequenzierung für die Überwachung der biologischen Vielfalt profitieren
Die vielleicht attraktivsten Merkmale der Nanoporen-Sequenzierung für die Überwachung der biologischen Vielfalt sind die Tragbarkeit und die niedrigen Investitionskosten der Geräte. Der MinION, das kleinste Sequenziergerät, passt leicht in die Hosentasche und kann für etwa 2.000 $ erworben werden. Damit haben Sie die Möglichkeit, überall DNA zu sequenzieren, und das zu Anschaffungskosten, die um Größenordnungen unter denen anderer Technologien liegen.
Die Möglichkeit der Sequenzierung am Untersuchungsort oder in-situ hat mehrere Vorteile. Sie ermöglicht die Anwendung neuartiger genetischer Methoden zur Überwachung der biologischen Vielfalt in Ländern mit großer biologischer Vielfalt, in denen es häufig an der dafür erforderlichen Infrastruktur, Ausrüstung und Fachkenntnis fehlt. So kann die mobile Sequenzierung diese Methoden durch den Aufbau lokaler Kapazitäten demokratisieren. Darüber hinaus kann die Sequenzierung vor Ort die Zeit zwischen der Probenahme und der Datenproduktion verkürzen, da die Transportzeit für die Proben reduziert wird und die Kosten und der Papierkram, die oft für den Export der Proben erforderlich sind, verringert werden.
In Verbindung mit DNA-Probenahmeverfahren in der Umwelt bietet die tragbare Nanopore-Sequenzierung eine neue Möglichkeit zur Überwachung der biologischen Vielfalt. Die Daten, die auf das Vorhandensein einer oder mehrerer Arten hinweisen, können in der Nähe der Probenquelle erzeugt und analysiert werden. Wenn Sie mehr darüber erfahren möchten, wie wir die Nanopore-Sequenzierung für die eDNA-basierte In-situ-Überwachung der sambischen Tierwelt einsetzen, lesen Sie unseren zugehörigen Blog-Artikel.