基因測序是否準(zhǔn)確,這篇文章從原理講清楚了!
Sanger雙脫氧鏈終止法是根據(jù)核苷酸在某一固定的點開始,隨機(jī)在某一個特定的堿基處終止,并且在每個堿基后面進(jìn)行熒光標(biāo)記,產(chǎn)生以A、T、C、G結(jié)束的四組不同長度的一系列核苷酸,然后在尿素變性的PAGE膠上電泳進(jìn)行檢測,從而獲得可見DNA堿基序列的一種方法。
一代測序結(jié)果圖,橫軸是電泳時間,縱軸是熒光強度,橫軸也是堿基的先后次序。峰越高、越尖,與別的峰交錯越少,則這個堿基判讀準(zhǔn)確性越好。結(jié)果肉眼可見,直觀而準(zhǔn)確。
二代測序:第二代DNA測序技術(shù)又稱高通量測序技術(shù)(High-throughput sequencing, HTS),以低成本、較高的準(zhǔn)確度,一次可對幾百、幾千個樣本的幾十萬至幾百萬條DNA分子同時進(jìn)行快速測序分析。這一時期的代表技術(shù)有 Roche公司的454(已退市)、Illumina公司的Solexa(已升級到Novaseq,市場份額第一)和ABI公司的SOLID(由ThermoFisher公司收購,已升級到Ion Torrent S5),由于該時期的測序技術(shù)十分前沿,因而市場主要被這三家公司所壟斷。其測序技術(shù)復(fù)雜,生成測序文件數(shù)據(jù)量巨大,后續(xù)生物信息處理難度高,因此近5年才逐步進(jìn)入臨床,且多用于腫瘤精準(zhǔn)用藥的部分。
以illumina為例,我們簡單介紹一下其測序流程。
①將目的DNA分子打斷成100-200 bp的片段,隨機(jī)連接到固相基質(zhì)上,經(jīng)過Bst聚合酶延伸和甲酸胺變性的橋PCR循環(huán),生成大量的DNA簇(DNA cluster),每個DNA 簇中約有超過1000個相同序列的DNA片段。
②之后的反應(yīng)與Sanger法類似,加入用4種不同熒光標(biāo)記并結(jié)合了可逆終止劑的dNTP。固相基質(zhì)上每個孔有八道獨立檢測的位點,所以一次可以并行八個獨立文庫,可容納數(shù)百萬的模版克隆,可把多個樣品混合在一起檢測,每個固相基質(zhì)上一次可讀取10億個堿基。
③DNA簇與單鏈擴(kuò)增產(chǎn)物的通用序列雜交,由于終止劑的作用,DNA聚合酶每次循環(huán)只延伸一個dNTP。每次延伸所產(chǎn)生的光信號被標(biāo)準(zhǔn)的微陣列光學(xué)檢測系統(tǒng)分析測序,下一次循環(huán)中把終止劑和熒光標(biāo)記基團(tuán)裂解掉,然后繼續(xù)延伸dNTP,實現(xiàn)了邊合成邊測序技術(shù)。
④其主要的缺點是由于光信號衰減和移相的原因使得序列讀長較短,可以進(jìn)行每個DNA測序片段的閱讀長度較短,目前主流且成本最低的就是做雙端測序150bp(PE150)。我們測全外顯子組的策略也是PE150。
二代測序原理,通過簇生成,CCD捕獲結(jié)合到模板的dNTP發(fā)的熒光,確定其DNA序列。
二代測序完成后,由于數(shù)據(jù)量巨大,復(fù)雜和多樣,因此,結(jié)果是肉眼不可見的,需要專業(yè)的算法、流程將原始數(shù)據(jù)處理為可用的數(shù)據(jù)?杀扔鳛,測序只是去菜場買菜,算法則是把菜做成大餐的過程。這個過程需要超級計算機(jī),建立好的優(yōu)秀算法以及精通生物信息學(xué)分析的人員。
二代測序分析流程中,需要將原始測序數(shù)據(jù)進(jìn)行質(zhì)控后生成一系列的中間文件(左圖),通過繁瑣的生物信息學(xué)流程(中圖),最后拼接成我們想要的基因。目前全流程多用Python和Perl語言在服務(wù)器上實現(xiàn)(右圖)。
二代測序由于其原理的一些問題,導(dǎo)致必須同一個位點測多次,才能保證數(shù)據(jù)的可靠性。一般用于臨床的數(shù)據(jù),需要同一位點測序后出現(xiàn)200次以上。我們將這樣的方案叫做測序深度(>200 X)。二代測序的優(yōu)勢是巨大的,其數(shù)據(jù)量巨大,可短時間高效率對人類基因組測序,并發(fā)現(xiàn)大量未知位點。單個位點成本降低,是個性化醫(yī)療和精準(zhǔn)用藥的基礎(chǔ)。
最后,還有一種類似測序的工具,叫做基因芯片;蛐酒脑褪80年代中期提出的。基因芯片的測序原理是雜交測序方法。目前由國內(nèi)外幾家大廠家所壟斷。其優(yōu)點是信息量較大,比一代測序的識別位點極大提升,可批量化生產(chǎn)并有完全標(biāo)準(zhǔn)流水線工作。但其缺點也很明顯,成本仍較高,無技術(shù)門檻,只檢測已選擇好的位點,更新位點的時間和經(jīng)費成本較高。比如illunima公司的ASA芯片,就是在一塊芯片上集成了66萬個人類基因組位點,檢測信息量大約30m左右。
2001年,通過一代測序,耗資37億美元,耗時13年,獲得了人類基因組草圖。到了2007年,用二代測序完成第一個完整的人類基因組序列圖譜只花費了150萬美元,耗時3個月。到了2020年,人類基因組測序只需要不到1萬元人民幣即可完成測序工作,時間只需要3天。近年來,測序技術(shù)突飛猛進(jìn),隨著測序單價的不斷降低,我們必將見證人人都有“基因身份證”的那一天。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
技術(shù)文庫
最新活動更多
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報名參會>>> 全數(shù)會2025中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會
-
精彩回顧立即查看>> 【在線會議】研華嵌入式核心優(yōu)勢,以Edge AI驅(qū)動機(jī)器視覺升級
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國機(jī)器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 【在線會議】從直流到高頻,材料電特性參數(shù)的全面表征與測量
-
10 “意外”的藥明康德
- 1 2025高端醫(yī)療器械國產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯估了關(guān)稅將對中國醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報告:前十大出口市場在哪?
- 4 認(rèn)購火爆,映恩生物打響18A IPO重啟信號槍
- 5 中國創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國產(chǎn)替代與千億市場卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺!
- 8 第一醫(yī)藥扣非凈利潤僅687.40萬元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級公司
- 10 外骨骼機(jī)器人,誰是盈利最強企業(yè)?