外显子组测序成败的关键——质量

外显子组仅占全基因组序列的1%左右,却包括大多数与疾病相关的变异。与全基因组测序相比,外显子组测序不仅经济高效,数据阐释也更简单。与全基因组关联分析相比,外显子组测序可鉴定低频和罕见变异,结果分析更准确。因此,近年来外显子组测序已广泛应用于孟德尔遗传病致病基因的挖掘和癌症等复杂疾病易感基因的研究,而外显子组测序成败的关键因素质量也越来越受到研究者的关注。

 

1、  测序质量的重要性

高通量测序的数据质量是信息分析和实验验证的基础,其准确性将直接影响实验结果的可靠性、项目的完成时间及科研成果的及时发布。外显子组研究的目的是在全外显子组范围内进行疾病相关变异的检测,低质量的测序数据将引起假阳性和假阴性变异。假阳性的检测结果将导致候选的变异位点数量过多,大幅增加后期验证及功能研究实验的工作量。假阴性的检测结果将导致有价值的相关变异信息的遗漏,无法达到实验目的。

 

2、  测序质量的评估标准

目前国际上尚无约束测序质量的严格标准,但随着外显子组测序的广泛应用,在质量方面已有一些约定俗成的认可原则。作为国内最高测序质量的提供者,千年基因将为您解析质量评估的标准。

 

首先,碱基质量值是衡量测序质量的重要指标,质量值(Q)越高代表碱基被测错的概率(P)越小,其计算公式为Q=-10lgP。例如,Q20Q30分别代表碱基被测错的概率为1%1‰。Illumina官方一般以Q30作为评价标准,以目前最常用的HiSeq 2000平台2×100PE测序为例,Illumina官方保证大于80%碱基准确度达Q30,而千年基因在合同中严格保证大于85%碱基准确度达Q30

 

在后期信息分析时数据的选择方面,变异检测时单条read检测出的变异信息很可能由测序错误导致,可靠性较低,因此通常选取覆盖深度大于10×的reads进行分析。目前已发表的外显子组文章中约80%-90%的外显子区域覆盖度达到10×以上,千年基因90%以上的外显子区域覆盖度达到10×以上,保证最高的测序均一性。

 

Duplicate reads比率也是影响外显子组项目质量的重要因素。文库制备和外显子组捕获过程会因PCR扩增不可避免地引入完全一致的DNA片段,即测序结果中的duplicate readsduplicate reads的比率将影响测序深度的统计和变异的可靠性分析,该比率的高低主要取决于实验试剂的质量和实验操作的标准化程度。千年基因使用原厂测序试剂并严格规范实验流程,以基于Agilent捕获平台的外显子组测序为例,这一比例可控制在5%以内。

 

3、  千年基因的测序质量为何最高

  • 上市公司严格的管理制度;
  • 17年基因组学服务经验;
  • Illumina Genome Network亚太区唯一的一家成员,Illumina平台最高测序质量的代表;
  • ISO9001 & ISO13485 & CLIA 国际质量标准认证的大型基因组学实验室,标准化的实验操作流程;
  • 近年来平均每月完成近万份外显子组样本的测序及分析。 

关于Illumina Genome Network

Illumina Genome NetworkIllumina在全球的最高认证,承诺提供最高质量的数据和快速的周转时间,是研究人员选择测序服务的最佳保证。目前全球仅有千年基因的总部MacrogenBroad研究所、加拿大迈克•史密斯基因组科学中心(BCGSC)和国际基因组源中心(NCGR)四个机构通过认证。

添加时间:

2013年06月28日

上一个:

全基因组测序项目发表文章档次的影响因素

下一个:

外显子组测序在遗传病研究中的应用
本网站由阿里云提供云计算及安全服务 Powered by CloudDream