一文讀懂基因測序技術的前世今生_上海長肯供
[導讀] 隨著人們對自身基因遺傳信息的了解和掌握,使得基因檢測技術不斷發(fā)展和完善,基因檢測技術也得到了迅猛發(fā)展,下面就和小編一起看看這些年測序技術的發(fā)展歷程。
測序技術的每一次變革,都是對基因組研究,疾病醫(yī)療研究,藥物研發(fā)等領域的巨大推動作用。從1977年代DNA測序技術(Sanger法),發(fā)展至今三十多年時間,測序技術已取得了相當大的發(fā)展,從代到第三代,測序讀長從長到短,再從短到長。雖然就當前形勢看來第二代短讀長測序技術在測序市場上仍然占有著很大的優(yōu)勢位置,但第三測序技術也已在這一兩年的時間中快速發(fā)展著。
根據(jù)原理的不同,人們將測序技術發(fā)展分為三個階段,代,sanger測序。第二代,高通量測序(NGS)。第三代,單分子/納米孔測序。由于三代測序技術各有優(yōu)缺點,應用的領域也不盡相同,代測序技術仍未被淘汰,目前的測序市場是三代測序技術并存的局面。
代:sanger測序
代測序技術,主要基于 Sanger雙脫氧終止法的測序原理,結合熒光標記和毛細管陣列電泳技術來實現(xiàn)測序的自動化,基本方法是鏈終止或降解法,人類基因組計劃就是基于一代測序技術。代的Sanger測序技術的優(yōu)點是,測序讀長長,能達到800-1K bp,且測序用時短,只需要幾十分鐘即可完成一次測序,測序準確度高準確性高達99.999%,目前仍是測序的金標準;缺點是通量低、成本高,影響了其真正大規(guī)模的應用。
因而代測序技術并不是理想的測序方法。經(jīng)過不斷的技術開發(fā)和改進,以Roche公司的454技術、illumina公司的Solexa,Hiseq技術和ABI公司的Solid技術為標記的第二代測序技術誕生了。第二代測序技術大大降低了測序成本的同時,還大幅提高了測序速度,并且保持了高準確性,以前完成一個人類基因組的測序需要3年時間,而使用二代測序技術則僅僅需要1周,但在序列讀長方面比起代測序技術則要短很多。
第二代:高通量測序(NGS)
高通量測序技術(又稱為下一代測序,Next Generation Sequencing,NGS)自2005年454公司推出臺基于焦磷酸測序二代測序儀開始,到2017年Illumina推出NovaSeqTM系列,高通量測序技術經(jīng)歷了十幾年的技術發(fā)展過程,NGS測序平臺也經(jīng)歷了一系列的收購和合并,終形成主要三家測序平臺,包括:Illumina的Solexa平臺、Life Technologies的 Ion Torrent平臺和華大基因的Complete Genomics平臺。
1.Illumina平臺
由于其技術成熟,平臺之間高度互補性與交叉性,使得其在短讀長測序上大占優(yōu)勢,是目前應用廣泛的NGS平臺。目前其占據(jù)了測序儀市場約70%的*。
2.Life Technologie平臺
Life公司Ion Torrent測序平臺采用的為半導體測序原理,其在非堿基多聚體(non-homopolymer)的測序上正確率與其它NGS平臺相差無幾,而對于連續(xù)堿基的檢測還不夠完善,在檢測同一堿基連續(xù)出現(xiàn)時的數(shù)量可能會有所誤差。相對于其他平臺,測序通量較小,平臺數(shù)量也較少。
3.Complete Genomics平臺
Complete Genomics平臺采用了高密度DNA納米芯片技術,在芯片上嵌入DNA納米球,然后用復合探針-錨定分子連接(cPAL)技術來讀取堿基序列。雖然這些技術非常準確,但該技術在應用上大的限制可能就是其過短的讀長。
高通量測序技術經(jīng)歷了十幾年的飛速發(fā)展,人類基因組測序成本已經(jīng)從人類基因組計劃的約30億美元降到了1000美元左右。目前二代測序設備在通量、準確度上都有了較大的提高,同時測序成本也隨之大幅度下降,成為商用測序的主流。
第三代:單分子/納米孔測序
測序技術在近兩年中又有新的里程碑,Helicos公司的Heliscope單分子測序儀、Pacific Biosciences公司的SMRT技術和Oxford Nanopore Technologies公司的納米孔單分子技術,被認為是第三代測序技術。與前兩代技術相比,他們大的特點是單分子測序,測序過程無需進行PCR擴增,其中,Heliscope技術和SMRT技術利用熒光信號進行測序,而納米孔單分子測序技術利用不同堿基產(chǎn)生的電信號進行測序。
由于第二代技術存在短讀長和耗時長的缺陷,人們希望第三代測序技術能解決這些缺陷,第三代測序技術通過現(xiàn)代光學、高分子、納米技術等手段來區(qū)分堿基信號差異的原理,以達到直接讀取序列信息的目的,三代測序設備在DNA 序列片段讀長上優(yōu)于二代設備,但在準確度上較二代設備差,目前尚未*成熟,市場應用面還不算廣,未來隨著技術的改善,三代測序設備將更為穩(wěn)定和成熟。
第三代測序優(yōu)勢:
1)第三代基因測序讀長較長,如Pacific Biosciences 公司的 PACBIO RS II 的平均讀長達到 10kb,可以減少生物信息學中的拼接成本,也節(jié)省了內存和計算時間。
2)直接對原始DNA樣本進行測序,從作用原理上避免了 PCR 擴增帶來的出錯。
3)拓展了測序技術的應用領域,二代測序技術大部分應用基于DNA,三代測序還有兩個應用是二代測序所不具備的:個是直接測RNA的序列,RNA的直接測序,將大大降低體外逆轉錄產(chǎn)生的系統(tǒng)誤差。第二個是直接測甲基化的DNA序列。實際上DNA聚合酶復制A、T、C、G的速度是不一樣的。正常的C或者甲基化的C為模板,DNA聚合酶停頓的時間不同,根據(jù)這個不同的時間,可以判斷模板的C是否甲基化。
4)三代測序在ctDNA,單細胞測序中具有很大的優(yōu)勢:ctDNA含量非常低,三代測序技術靈敏度高,能夠對于1ng以下做到監(jiān)測;在單細胞級別:二代測序要把DNA提取出來打碎測序,三代測序直接對原始DNA測序,細胞裂解原位測序,是三代測序的殺手應用。
第三代測序缺陷:
1)總體上單讀長的錯誤率依然偏高,成為限制其商業(yè)應用開展的重要原因;第三代基因測序技術目前的錯誤率在15%-40%,極大地高于二代測序技術NGS的錯誤率(低于1%)。不過好在三代的錯誤是*隨機發(fā)生的,可以靠覆蓋度來糾錯(但這要增加測序成本)。
2)三代測序技術依賴DNA聚合酶的活性。
3)成本較高,二代Illumina的測序成本是每100萬個堿基0.05-0.15美元,三代測序成本是每100萬個堿基0.33-1.00美元。
4)生信分析軟件也不夠豐富。
三代測序和二代測序相比較,第二代測序技術的優(yōu)點是成本較之一代大大下降,通量大大提升,但缺點是所引入PCR過程會在一定程度上增加測序的錯誤率,并且具有系統(tǒng)偏向性,同時讀長也比較短。第三代測序技術是為了解決第二代所存在的缺點而開發(fā)的,它的根本特點是單分子測序,不需要任何PCR的過程,這是為了能有效避免因PCR偏向性而導致的系統(tǒng)錯誤,三代讀長超長,準確低,費用高,但因讀長長,利于組裝和發(fā)現(xiàn)unique reads潛在優(yōu)勢明顯,但是劣勢也限制了三代測序的商業(yè)應用。
未來前景
目前,第二代的基因測序技術高通量測序(NGS)是市場商用主流。第三代的單分子/納米孔測序將是未來的大勢所趨,但是預計在將來5-10年內二、三代基因測序會共存,但二代測序仍將是測序市場商業(yè)應用主流。