De la secvențierea Sanger, la secvențierea de generația a treia (PacBio și Nanopore)
Secvențierea ADN a devenit o tehnică de biologie moleculară aplicată la scară largă încă din anii ’80, o dată cu invenția secvențierii Sanger în 1977, invenție care i-a adus lui Frederik Sanger premiul Nobel în anul 1980.
Secvențierea Sanger se mai folosește și azi în laboratoarele de biologie moleculară, pentru a valida rezultatele obținute cu altfel de tipuri de secvențiere. Dezavantajele secvențierii Sanger sunt faptul că secvențele de ADN obținute (numite citiri, în limba engleză reads) sunt de lungime mică ( aproximativ 1000 de nucleotide), iar procedura durează mult timp. Pagina de Wikipedia dedicată secvențierii Sanger explică în detaliu cum funcționează această tehnică.
Acum mai bine de zece ani s-a perfecționat secvențierea de nouă generație (Next Generation Sequencing, NGS), care a permis citirea la scară largă a mii se genomuri, procariote și eucariote. NGS generează milioane de fragmente scurte de ADN, între 45 și 150 de nucleotide, care acoperă de regulă genomurile aproape în întregine, cu deazvantajul că aceste foarte multe citiri trebuie puse cap la cap (asamblate) folosind fel de fel de algoritmi. În plus, prin secvențierea de nouă generație (acum considerată secvențiere de generația a doua) nucleotidele nu se pot citi direct și acestea trec printr-o faza de amplificare, care poate genera multe inexactități și erori. De asemenea, secvențierea de nouă generație face aproape imposibilă citirea fragmentelor de ADN bogate în nucleotide C și G sau asamblarea genomurilor cu multe repetiții.
Un alt dezavantaj al NGS îl contituie și greutatea cu care se poate face fazarea mutațiilor. În cazul unui genom diploid (precum cel al omului), secvențierea NGS generează o singură secvență pentru o genă, care combină mutațiile provenite din alelele maternă și paternă. De multe ori cercetătorii vor să știe cu exactitate secvența transcrisă de pe fiecare dintre alelele maternă și paternă, nu doar o combinație dintre cele două.
Prin secvențierea de generația a treia, numită și secvențierea cu citiri lungi (long read sequencing), se pot citi chiar și molecule întregi de ADN, cu mare acuratețe, dar la costuri ridicate.
Cele mai cunoscute tehnologii de secvențiere de generația a treia sunt cele de la compania PacBio
(single-molecule real-time (SMRT) sequencing) și de la compania Oxford Nanopore Technologies (ONT) (secvențierea nanopore). Prin aceste proceduri, pot fi secvențiate molecule de ADN de până la 100,000 de nucleotide, într-un timp de câteva ore. La ora actuală, fiecare dintre aceste două tehnologii au o rată de eroare ridicată (între 5% și 30% dintre nucleotidele raportate sunt greșite).
Single-Molecule Sequencing: Towards Clinical Applications
Adam Ameur, Wigard P. Kloosterman, Matthew S. Hestand
https://www.cell.com/trends/biotechnology/fulltext/S0167-7799(18)30204-X