欧美……一区二区三区,欧美日韩亚洲另类视频,亚洲国产欧美日韩中字,日本一区二区三区dvd视频在线

產(chǎn)品推薦:氣相|液相|光譜|質(zhì)譜|電化學|元素分析|水分測定儀|樣品前處理|試驗機|培養(yǎng)箱


化工儀器網(wǎng)>技術中心>工作原理>正文

歡迎聯(lián)系我

有什么可以幫您? 在線咨詢

四大因素,從源頭解析Dup

來源:翌圣生物科技(上海)股份有限公司   2019年10月15日 17:33  

四大因素,從源頭解析Duplication

導語:

測序技術面世至今發(fā)生了諸多的技術革新,經(jīng)歷了sanger測序為代表的第—代測序、高通量為代表的第二代測序和單分子實時測序為代表的第三代測序。迄今為止,高通量測序( next generation sequencing NGS)技術日趨成熟,正式進入臨床疾病診療階段,與我們生活息息相關。

 

Dup背景解讀

高通量測序檢驗流程可分為“實驗室操作”(又稱為“濕實驗”)和“生物信息學分析”(又稱“干實驗”)兩部分。對應的實驗操作部分,可點擊高通量建庫了解。生物信息學主要是測序完成之后的數(shù)據(jù)分析和解讀,包括數(shù)據(jù)的拆分、比對和匯總,其中數(shù)據(jù)的有效性,也就是報告中常見的duplication rate 這一名詞,是生信分析的一個重要指標,讓我們對測序得出的數(shù)據(jù)進行一個大致的了解

 

所謂Dup,即重復序列Duplicate reads(涉及相關概念可點擊此處,這些重復序列在總測序序列中占比簡稱為Dup rate。由于這些重復序列不能帶來額外信息,相反會影響變異檢測結(jié)果準確性,因此下游生信分析中這些重復序列是需要去除的去掉,這也就意味著Dup rate越高,數(shù)據(jù)利用率越低,測序成本浪費的也就越多。因此在NGS生信分析中首要了解的就是dup rate的占比

 

常見測序?qū)狣up可能值

測序類型

Dup rate

全外顯子測序(WES

10%左右

全基因組測序(WGS

10%左右

全基因組DNA甲基化測序WGBS

> 10%

轉(zhuǎn)錄組測序(RNA-seq

30%~40%左右

多重PCR測序和捕獲Panel測序

測序的區(qū)域以及測序量有關

 

 

影響Duplication Rate的因素

高通量測序技術的不斷革新,生物信息學的分析也不斷進步與發(fā)展,就dup來源,根據(jù)其定義與現(xiàn)實的案列分析,客觀來講主要有以下幾個方面:

1.樣本本身所導致的dup值

2.建庫過程中產(chǎn)生的dup值(片段化,接頭連接,PCR擴增)

3. Cluster生成對dup的影響(主要指上機之后)

4. 光學分辨引起的dup

通常來講,我們認為的dup都是些無效數(shù)據(jù),且基本上都是從建庫過程中產(chǎn)生的,但實際案列告訴我們,有些時候dup也是“好”的有用數(shù)據(jù),上機過程導致的dup值可能要要比我們建庫過程中產(chǎn)生的dup值要大的多。

 

影響因素解讀:

1樣本本身所導致的dup值

不同物種的基因含量不同,基因多樣性不同,對應的基因表達情況也千差萬別。在*相同操作的前提下,不同的樣本對應的dup值也有所差別。比如

1cfDNA和ctDNA:游離DNA斷裂不是隨機的而是有偏向性的,自然cfDNA的分子多樣性可能會比人工cfDNA要差一些,且片段長度一般分布在165bp左右,較為集中的size分布比物理打斷的size分布更不容易丟失片段,這樣可能導致相比較常規(guī)的基因組樣本cfDNA和ctDNA引起Duplication Rate會高一些。

2基因組DNA :以人類基因組為列,本身含有大量的基因組信息,不同細胞相同編號染色體在基因組片段化過程中是有可能產(chǎn)生一些起始位置和終止位置相同的分子片段的。此時對應的dup值就是樣本本身的dup值。在后期分析中可以作為保留數(shù)據(jù)進行分析。

3)甲基化DNA:經(jīng)過亞硫酸氫鹽反轉(zhuǎn)的DNA,堿基類型都少了一種,分子多樣性不但下降,更是引入了尿嘧啶,外加一些建庫方式有著明顯的GC偏好性,導致后期對應的dup值會明顯的變高。

4RNA:一般我們所做的測序都是全外顯子組,只占全基因組的2%不到,少了內(nèi)含子以及非基因區(qū)域的參與,同時對應有高表達的基因和不表達的基因,分子多樣性肯定就弱了很多。后期對應的dup值是目前測序中占比量較高的樣本。

 

2.建庫過程中產(chǎn)生的dup值

1)片段化對Duplication Rate的影響

無論是超聲波打斷、高壓氣體噴斷,還是酶切切斷,都要注意隨機性和均一性,同時需要保證片段化之后獲得適當?shù)拈L度,片段長度越小,導致擴增越容易,加劇了PCR bias,后引起PCR產(chǎn)物復雜度降低,dup rate升高。

2)鏈接效率對Duplication Rate的影響

對末端修復連接的效率的考量應該根據(jù)樣本類型來考慮,比如ctDNA,單細胞樣本,對應的連接效率就要很高,不然低頻的目標片段就會消失。某種程度上,連接效率越高,分子多樣性越好,dup rate也就越低。

3)PCR擴增對Duplication Rate的影響

首先我們了解一下PCR bias:

PCR擴增帶有一定的偏好性和錯配率,會影響終形成文庫的覆蓋度和測序準確性。

PCR本身對于不同GC含量的樣本的擴增效率是不同的,中等GC含量擴增效率///高,高GC含量擴增慢,也就是說PCR循環(huán)越多,擴增困難和擴增容易的片段之間相差就會越大,對應的分子多樣性就會越低,dup就會增大。

另外PCR本身在擴增的過程中可能會產(chǎn)生一些堿基的錯配,錯誤的擴增可能會到出現(xiàn)與現(xiàn)有相同基因的結(jié)果,導致dup值升高。

另外我們解釋一下,為什么我們PCR擴增要控制在較小的循環(huán)數(shù)內(nèi)。

我們知道PCR過程中,每一次循環(huán),對應生成的產(chǎn)物都是一樣的,PCR放大成百上千倍,為什么NGS的Dup rate只有十位數(shù)甚至是個位數(shù)呢?(對應的數(shù)學解釋可參考對應的參考文獻1)

舉例如下:

有編號1~1,000,000,000的1億個小球不同的DNA///片段),通過某種方法復制了一下(PCR擴增),然后每個編號的小球都變成了10個?,F(xiàn)在,你要從里邊挑選出1萬個小球出來(測序數(shù)據(jù)量),挑選兩個一樣的概率會有多大呢?也就是說雖然PCR將待測分子放大了成百上千倍,但是相對于數(shù)量遠遠多于納米孔/點數(shù)的Unique分子來說,能在茫茫人海中被1個孔隨機選中已是萬萬幸,更何況是再次隨機選中同一個Unique分子簇中的Copy形成Dup呢?

因此對于PCR過程中的dup值,我們可以人為的增加投入樣本的量(增加樣本DNA的多樣性),同時降低PCR的循環(huán)數(shù),選擇均一性和保真性較好的擴增酶,就可以將這一過程中產(chǎn)生的dup,控制在合理的范圍內(nèi)。

3. Cluster生成對dup的影響

Cluster在flowcell上的生成也是一個PCR過程。這個PCR比較容易被人遺忘。如果cluster變少,影響dup rate。原因是比例少的分子可能不能產(chǎn)生cluster,唯—性分子數(shù)減少,進而影響dup rate。適當?shù)腸luster生成密度,不僅能夠獲得///佳的數(shù)據(jù)產(chǎn)量,也能夠獲得較低的dup rate。目前的平臺中,我們都希望cluster是單克隆(monoclonal)的,多克隆(Polyclonal)的cluster會出現(xiàn)空間距離過近而導致圖像識別時相互overlap的cluster被測序識別程序過濾掉,造成的直接影響就是cluster密度過高,數(shù)據(jù)產(chǎn)量降低,整張芯片的cluster多樣性降低,造成dup rate升高。

 

4. 光學分辨引起的dup

目前的測序平臺主要包括兩種擴增方式illumina和life的線性分子擴增,和ICG的滾環(huán)擴增,形成的DNA Nanoball都是靠流體來保證芯片表面利用率的,芯片利用率是數(shù)據(jù)高產(chǎn)出的基礎,相反待測分子與芯片的結(jié)合的同時,可能導致反應不充分的信號點因為信號強度顯著弱于反應充分的“鄰居”,從而被映射成兩個孔表達出一樣的信號,也就是一種光學上的Dup。

 

總結(jié):

綜合考慮分析,影響dup的主要因素就是DNA的多樣性,其中樣本本身所產(chǎn)生或者增加的dup值,這種情況占比量較小,我們一般可以忽略;PCR產(chǎn)生的dup值,我們在選擇均一性和保真性較好的擴增酶的同時,人為的降到底拷貝數(shù)也是可行的(一般控制在6-10 cycle);至于Cluster和光學分辨引起的dup,主要是和測序平臺相關,不同測序平臺還是有一定的差異的,主要原因是cluster與光學分辨過程中導致的DNA多樣性的改變和信號收集的誤差,目前來說可能是產(chǎn)生dup的主要來源。

【1】Eric Vallabh Minikel. How PCR duplicates arise in next-generation sequencing[Z].2012,12.

【2】illumina. Effects of Patterned and Nonpatterned Flow Cells [Z]. 

【3】 Sayols S, Scherzinger D, Klein H. dupRadar: a Bioconductor package for the assessment of PCR artifacts in RNA-Seq data. BMC Bioinformatics. 2016 Oct 21;17(1):428

【4】Natarajan KN, Miao Z, Jiang M,et al. Comparative analysis of sequencing technologies for single-cell transcriptomics. Genome Biology. 2019 Apr 9;20(1):70.

免責聲明

  • 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-化工儀器網(wǎng)合法擁有版權或有權使用的作品,未經(jīng)本網(wǎng)授權不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關法律責任。
  • 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權等法律責任。
  • 如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。
企業(yè)未開通此功能
詳詢客服 : 0571-87858618
蜜臀av日日欢夜夜爽一区-av在线免费永久播放| 国产黄片在现免费观看-色老板最新在线播放一区二区三区| 男人的天堂久久精品激情-最新亚洲精品a国产播放| 三上悠亚免费观看在线-青青草原在线视频观看精品| 亚洲国产中文欧美一区二区三区-国产精品一区二区视频成人| 亚洲av成人一区国产精品网-国产偷_久久一级精品a免费| 亚洲国产欧美日韩不卡-熟妇激情一区二区三区| 国产日韩电影一区二区三区-美女露双奶头无遮挡物| 久久精品国产96精品-日韩人成理论午夜福利| 日韩亚洲一区二区三区av-欧美综合在线观看一区二区三区| 精品少妇一区二区18-一区二区三区日韩在线播放| 四虎成人在线免费视频-亚洲熟女中文字幕天堂| 亚洲欧美日韩二区三区-国产在线欧美一区日韩二区| 欧美亚洲另类久久久精品-国产精品一区二区亚洲推荐| 国产欧美日韩精品一区在线-久久精品视频免费获取地址| 亚洲国产精品一区二区av-日本一级黄色一区二区| 日本高清二区视频久二区-大香蕉在线视频大香蕉在线视频| av网址在线直接观看-黄色av全部在线观看| 人妻少妇无乱码中文字幕-人成免费视频一区二区| 国语自产偷拍精品视频偷拍-国产伊人这里只有精品视频| 中文不卡一区二区三区-老司机在线老司机在线一区| 亚洲综合av一区二区三区-高潮又爽又黄无遮挡激情视频| 黄片黄片在线免费观看-激情综合网激情五月俺也去| 久久精品国产96精品-日韩人成理论午夜福利| 国产免费高清av在线播放-成年人在线播放中文字幕| 人妻丝袜中文字幕在线视频-亚洲成av人片一区二区三区| 乱入一二三免费在线观看-久久精品亚洲精品国产色婷婷| 国产精品二区高清在线-91精品91久久久久久| 五月婷婷免费观看视频-男人操女人下面视频在线免费看| 午夜福利卫生纸福利院-一区二区三区久久亚洲| 国产日韩电影一区二区三区-美女露双奶头无遮挡物| 色噜噜噜噜一区二区三区-欧美最猛黑人做爰视频| 久久免费观看归女高潮特黄-黄色av一本二本在线观看| 亚洲午夜久久久精品影院-性感美女在线观看网站国产| 一区二区三区女同性恋-熟妇高潮一区二区高清网络视频| 国产日韩电影一区二区三区-美女露双奶头无遮挡物| 中文字幕亚洲中文字幕-丰满老妇伦子交尾在线播放| 中文字幕日韩精品不卡在线一区-国产tv日韩在线观看视频| 91亚洲美女视频在线-熟妇人妻精品一区二区三区蜜臀| 欧美日韩国产在线资源-超碰成人国产一区二区三区| 性激烈欧美三级在线播放-久久中文字幕人妻少妇|