第一代Sanger測序法,由Sanger等在1997年提出,基本原理是通過雙氧核糖核苷酸進行延伸反應(yīng),生成相互獨立的若干組帶放射性標記的寡核苷酸,再通過凝膠電泳使它們分開,最后通過放射顯影讀出待測DNA上的核酸序列。
第二代(Next-generation sequencing,NGS)高通量測序法,引入可逆終止末端,并對其熒光標記,從而實現(xiàn)邊合成邊測序。優(yōu)點是高通量,可定量,成本低廉,但是讀長較短,一般不超過500bp。
第三代測序技術(shù)即單分子測序技術(shù),包括單分子實時(Single Molecule Real-time,SMRT)測序技術(shù)和單分子納米孔(Nanopore)測序技術(shù),優(yōu)點為超長讀長且無需擴增。
雖然第三代測序已經(jīng)商用了,但目前主流測序技術(shù)還是NGS,以下從其測序過程對其簡單介紹。
一、文庫構(gòu)建
1、基因組文庫構(gòu)建
① 通過物理性(超聲波法、噴霧法或水動力剪切等)機械打碎和酶消化切割等手段將提取到的基因組DNA隨機打斷。
② 打斷的DNA片段末端可能帶有5’—凸出和3’—凸出,且其末端不一定存在磷酸基團或者羥基基團。因此,需要使用Taq聚合酶補齊不平的末端,同時使用Klenow 酶在兩個末端添加堿基A。此過程即為末端修復,修復后的即可鏈接測序接頭。
③ 測序接頭是已知的用于測序識別的序列,包括有與固定在流動槽中寡核苷酸序列互補的序列(P5/P7)和簇生成引物序列(Read SP)以及標簽序列(Index),添加完接頭序列的DNA片段集合即為所建基因組文庫。
④ 建庫過程中含有聚合酶、連接酶等以及其他各種雜質(zhì),需要對其進行磁珠純化,純化過程中同時進行片段選擇。純化后的片段兩端是不互補的Y形結(jié)構(gòu),不能直接進行測序,所以還要進一步用與接頭互補的引物來PCR擴增。擴增完,進一步磁珠純化,洗去雜質(zhì)。
2、轉(zhuǎn)錄組文庫構(gòu)建
轉(zhuǎn)錄組是指特定細胞或組織中全部轉(zhuǎn)錄產(chǎn)物,包括信使RNA(Messenger RNA,mRNA)、核糖體RNA(Ribosomal RNA,rRNA)、轉(zhuǎn)運RNA(Transfer,tRNA)以及其他非編碼RNA(noncoding RNA,nc RNA)。不同類型的RNA文庫制備方法各不相同,主要過程有:
① 目標RNA富集,方法包括靶向捕獲目標RNA和消除rRNA。前者通常使用Oligo-dT與Poly(A)雜交的特性設(shè)計探針,從而實現(xiàn)總RNA中捕獲到聚腺苷酸化RNA;后者方法較多,包括有Ribo-Zero-seq法、RNA消化酶法以及根據(jù)rRNA特性來消除rRNA的方法等。
② 通過化學方法或者酶消化的方法打斷富集到的RNA,或者將RNA反轉(zhuǎn)錄成cDNA,運用DNA片段化方法打斷cDNA。
③ 連接接頭。cDNA測序接頭連接方法與DNA建庫方法一致;小RNA長度20—35nt且5’端有磷酸基團、3’端有羥基基團,因此不需要特殊修飾即可與接頭連接。
NEBNext Ultra II RNA 試劑盒( New England Biolabs) 文庫制備流程
二、成簇Cluster Generation
利用有單鏈引物的流動槽將DNA分子片段固定在流動槽上擴增,形成單克隆DNA簇。
① 文庫片段(P5/P7)與芯片表面引物互補配對,被固定后進行DNA復制。復制完后解鏈,將文庫片段洗去,留在流動槽表面的即為文庫模板互補的DNA鏈。
② 留下的互補鏈與原先模板鏈連接的引物結(jié)合,形成單鏈橋,再在聚合酶的參與下生成互補鏈,最終形成雙鏈橋。
③ 雙鏈橋再次變性后形成單鏈,形成的單鏈又分別與自己配對的引物結(jié)合,重復這個循環(huán),形成散布在芯片上的DNA簇。
④ 進一步再切斷洗去反向鏈(與模板鏈一致),僅留下正向鏈,且封鎖3’端防止重新形成單鏈橋。
成簇Cluster Generation
三、測序Sequencing
向已經(jīng)處理過的流動槽中添加改造過的DNA聚合酶和帶有熒光標記的可逆終止dNTP(3’-OH鏈接疊氮基團,在延伸時被阻止連接下一個dNTP),統(tǒng)計每輪收集到的熒光信號結(jié)果,就可以得知每個模板DNA片段的序列。由于測序儀每次測序時的通量比較大,所以每次測得的序列可能不止一個樣本,為了做區(qū)分,在建文庫時在接頭序列加入不同Index(或Barcode)區(qū)分來源。
現(xiàn)在主流測序方法為雙末端(Paired-end)測序,因為可以增長測序長度且方便分析結(jié)構(gòu)變異。一般是洗掉前面復制好的合成片段,單鏈繼續(xù)在流動槽表面形成“橋式連接”。NaOH使雙鏈變性為單鏈,并洗去已經(jīng)測序完成的P7上DNA,留下P5’鏈。加入簇生成引物Read2,從相反方向進行另一端序列讀取。
四、測序數(shù)據(jù)
以上則為二代測序的整個過程,不同的平臺會存在一些差異,但總體過程類似。測序完成后,基于文庫構(gòu)建時添加的Index分類來自不同樣本的序列,這些序列再與參考基因組匹配后,得到完整序列。