洪荒之力来袭,三代测序开学促销

作为国内三代测序的领导者,千年基因在项目经验和数据质量方面均遥遥领先,读长最长可达50Kb,reads N50高达27Kb,数据产出最高可达2Gb/SMRT Cell(详见下表)。为了让更多科研人员体验三代测序的优势,千年基因将尽洪荒之力推出三代测序开学促销,测序价格降至冰点,活动时间为8月20日-10月31日。

 

千年基因三代测序结果举例:

Cell Name

Filter

Polymerase Read

Bases

Polymerase

Reads

Polymerase

Read N50

Polymerase Read

Length

Polymerase Read

Quality

Sample 1

Pre-Filter

2,022,693,740

150,292

26,530

13,458

0.643

Post-Filter

1,889,692,200

107,954

26,888

17,504

0.832

Sample 2

Pre-Filter

2,047,333,189

150,292

27,609

13,622

0.649

Post-Filter

1,927,197,394

109,739

27,923

17,561

0.837

 

三代测序在科研领域的应用举例:

                                                                       

1. 三代测序在基因组de novo方向的应用

    三代测序的长读长能够更好地跨越基因组高重复序列、转座子区域、大的拷贝数变异区域及结构变异区,可以很好地解决复杂基因组组装难题。对于没有参考基因组的物种,应用三代测序从头进行测序,更完整的基因组可获得更准确的注释信息,从而更有利于发现重要的生物学机制。

案例解析:复活草基因组测序(Nature, 2015.

1)    研究方法

PacBio平台测序72×数据。

2)    研究结果

组装得到基因组大小244 Mb,Contig N50达到2.4 Mb,共650条Contig。去除叶绿体、线粒体以及污染序列,共625条Contigs。另外,已公布的植物基因组平均contig N50为50 Kb,只有拟南芥(TAIR10)、水稻(V7)以及短柄草(V 2.1)基因组Contig N50比本研究得到的复活草N50更长。组装结果中包括了端粒和着丝粒序列、长末端重复序列、反转录转座子、串联重复基因以及其它难于组装的基因组元件。复活草基因组中重复序列所占比例高达43%,其中共鉴定出3,247个完整的长末端重复(LTRs),属于358个家族,只有~2%重复序列未被注释到分类结果中。预测出28,446个蛋白编码基因 ,帮助研究人员确定了复活草极端耐旱背后的生物学机制。

 

2. 三代测序组装得到的复活草重复区域

3)    参考文献

       Robert VanBuren et al. (2016) Single-molecule sequencing of the desiccationtolerant grass Oropetium thomaeum. Nature.

 

2.    三代测序在基因组重新组装方面的应用

对于已有参考基因组的物种,应用三代测序重新进行测序,可组装获得更完整的基因组,从而发现更全面的基因组结构信息、功能信息、变异信息等。

案例解析:大猩猩基因组测序(Science, 2016.

1)    研究方法

72× PacBio 数据构建 Contig,结合 BAC-end 和 Fosmid-end 数据构建Scaffold,使用FALCON软件和已有的Quiver算法进行de novo 组装和纠错。

2)    研究结果

组装得到基因组大小3.1 Gb,Contig N50达到9.6 Mb,Scaffold N50达到23.14Mb。与之前公布的大猩猩基因组(gor Gor3,2012年发表于Nature)组装结果相比,此次组装结果的完整性有显著提升。其中,Contigs数量从原来的433,861减少为16,073,减少了96%;Contig N50从原来的11.6 Kb提升为9.6 Mb,提升了819倍。将本研究组装的序列与已公布的gorGor3版本参考序列进行比对,可以将94%的gap填补好,序列长度增加164Mb,这些增加的序列有助于改善基因组注释,使得又新发现了数千个外显子和调控元件。

1. 大猩猩基因组组装结果统计 

 

1. 大猩猩两次基因组组装结果比较 

3)    参考文献

       David Gordon et al. (2016) Long-read sequence assembly of the gorilla genome. Science.

 

3.    三代测序在全长转录本研究方面的应用

在转录组研究中,通过三代测序可直接获得全长转录组的序列信息,无需进行拼接,可以获得全面的可变剪切、融合基因以及Isoform信息。

案例解析:玉米全长转录组研究(Nature Communications, 2016.

1)    研究方法

        Illumina HiSeq 2000平台测mRNA,量化gene/isoform的表达;

         PacBio RS II平台,P6-C4试剂,Barcoded SMRTBell文库6个构建(<1, 1–2, 2–3, 3–5, 4–6 and 45 Kb),47 SMRT cells,产生3,716,604 reads。

2)    研究结果

         利用单分子测序得来自6个组织的到111151个转录本(约70%注释玉米RefGen_v3基因组);

         大部分(57%)转录本为novel,有的是组织特异(tissue-specific),已知基因的同种型(isoforms of known gene),还有3%与novel gene loci匹配;

         90%的剪接点(splice junction)由来自匹配组织的short reads组成;

         鉴别了大量的新的lncRNA(novel long non-coding RNAs)和融合转录本(fusion transcripts)。

3)    参考文献

       Bo Wang et al. (2016) Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing. Nature Communications.

 

更多文献解析及技术资料请参考千年基因主页:

http://www.macrogencn.com/_d277188748.htm


添加时间:

2016年08月26日

上一个:

下一个:

担心数据质量不可靠?千年基因推出外显子组测序数据质量评估服务
本网站由阿里云提供云计算及安全服务 Powered by CloudDream