恶性疟原虫(Plasmodium falciparum)导致每年有数百万人因疟疾而死亡。为了对抗这一疾病,研究人员期待新的药物和疫苗,能针对寄生虫基因组的弱点而发挥作用。然而,疟原虫基因组的研究也正经历前所未有的挑战。

这是因为它富含AT碱基对,难以用PCR方法来来扩增,而这正是新一代测序的基石。因此,研究人员一直在想方设法获得恶性疟原虫的准确图谱。PCR的问题不仅仅困扰着疟原虫的研究。金黄色葡萄球菌和梭状芽孢杆菌的研究人员也深受PCR之苦。

当然,办法总比问题多。研究人员一直在开发替代的扩增方法,希望不依赖于PCR。据Illumina市场部经理Daniel Peiffer介绍,这些样品制备方法产生的测序文库有助于基因组的最全面、无偏向查看。

到目前为止,测序公司Illumina和Ion Torrent已开始推广和检测他们的PCR-free样品制备方法。这些技术有望消除PCR的常见问题,如偏向和重复,但这些PCR-free的样品制备方法也有其自身的限制。

与偏向说拜拜

在加入Oxford Nanopore之前,Daniel Turner曾在Wellcome Trust Sanger研究院工作了几年。他试图了解PCR的限制,特别是在扩增富含AT和GC的序列时。他开发了一些新方法来克服PCR偏向,以获得更好的恶性疟原虫基因组。

在文库制备过程中,我们通过标准的PCR来扩增随机的基因组片段。对于这些模板而言,有的二级结构复杂,有的则热稳定性不好,这些因素都会影响PCR扩增效率。因此,并非所有基因组序列都能在PCR扩增文库中同等体现。若某个基因组富含AT或GC,则序列覆盖中的偏向会在PCR扩增过程中加剧。

恶性疟原虫的基因组就是个很好的例子。编码区域的75%以上由AT组成,而在基因间和非编码区域中,AT甚至达到100%。金黄色葡萄球菌的AT含量也超过了67%。Turner谈道:“我遇到最高的是Carsonella ruddii,AT含量超过83%。”

当研究人员对这些AT含量超高物种进行测序时,他们不得不开展额外的测序,来看看哪些区域代表性不足。对于高的AT含量,问题来自热力学稳定性低,以及序列的重复性。这些问题会导致聚合酶无法复制,或引入错误。

高GC含量也同样让人愁眉不展。极端嗜热菌(Thermus thermophilus)的GC含量高达70%,而天蓝色链球菌(Streptomyces coelicolor)更高达72%。高的GC含量,带来了高的热稳定性。

然而,在PCR扩增的过程中,高GC的模板难以完全变性,即使变性,当退火步骤温度降低时,这些链也可能形成很强的分子内氢键,从而使聚合酶难以发挥作用。

Turner还谈道,高AT和高GC的基因组往往是重复的,这会带来错误。在极端情况下,一些区域根本无法体现。“这些都是重复的序列,不能提供任何有用的信息,意味着通量被浪费了。”

调整与扩增

2012年,Turner及其同事在《Biomed Central Genomics》杂志上发表了一篇文章,检验了PCR和非PCR扩增技术,以确定恶性疟原虫基因组测序的最佳方法。1 早期的研究表明,在Illumina文库制备过程中,用其他扩增步骤来取代PCR的PCR-free方法可改善读取分布,并产生更均一的基因组覆盖。2

PCR-free的簇扩增与PCR有点相似,但也存在几个主要的差异,从而防止在扩增过程中引入偏向。最大的差异在于科学家构建接头的方式。簇扩增的接头包含一些额外的序列,能帮助与连接在流动槽表面的单链DNA或RNA分子杂交。在这种方法中,科学家利用流动槽本身来选择完全连接的模板分子,簇扩增只扩增与接头序列完全连接的模板链。这样,簇扩增步骤开展了PCR所做的富集,又降低了扩增偏向。

然而,簇扩增并不是避开PCR的唯一方法。目前还有一些等温扩增方法。它利用遗传重组的酶将引物与双链DNA配对,接着进行链置换扩增。这种方法无需DNA的加热变性,能扩增几个拷贝的目标。3

由于这些PCR-free样品制备方法的前景,测序公司也计划推出这类产品。在2013年的AGBT会议上,Ion Torrent的CEO Jonathan Rothberg展示了该公司的Avalanche系统,一个革命性的30分钟无需emulsion的模板制备系统。该系统预计在2014年上市。

同时,研究人员也开始订购Illumina的TruSeq DNA PCR-free样品制备试剂盒。该产品采用一种基于磁珠的流程,计划在一天内完成,并与Illumina测序平台不断增加的读长兼容。

了解Illumina PCR-free的样品制备方案

仍不完美

尽管PCR-free的方法改善了序列读取分布,并产生了更均一的基因组覆盖,但它需要大量起始DNA材料,这往往很难获得,尤其是在处理临床分离株时。例如,临床分离株通常没有足够的恶性疟原虫DNA,让PCR-free的方法高效开展。

Turner和他的同事发现,对有限量的恶性疟原虫DNA进行测序的更好方法是,精心选择PCR所用的聚合酶,并使用PCR添加剂四甲基氯化铵(TMAC)。TMAC能够均一化不同文库片段的熔解温度。研究人员发现它抑制大部分聚合酶,但适用于Platinum pfx和Kapa酶。将这种方法所制备文库的基因组覆盖度与标准PCR和PCR-free方法相比,他们发现可降低扩增偏向,并保留寄生虫极端碱基组成的复杂度。1

当然,PCR-free的方法还存在其他问题。例如,当研究人员对克隆扩增的模板开展测序反应时,测序反应不是非常高效。一些链并非在每个循环都延伸,因而与其他不同相,限制了系统的读长。

为了应对这一问题,Illumina受够了测序公司Moleculo,它开发出新技术来改善长读取的准确性。与Illumina的HiSeq 2500测序仪共同使用,这种技术能够产生8-10 kb长片段的局部组装,这更好地解决了重复序列。

在2013年的植物和动物基因组大会上,美国农业部的分子生物学家Geoff Waldbieser展示如何利用这种新技术,来产生蓝鲶鱼的更连续基因组组装。4 蓝鲶鱼(Ictalurus furcatus)的基因组中有很多重复序列。

随着第三代单分子测序系统的上市,最终,也许不需要任何扩增方法,就能进行测序。这一进步有望带来恶性疟原虫及其他病原体的更准确读取,从而帮助科学家们开发出更好的药物和疫苗。(编译 薄荷)

参考文献

1. Oyola, S., T. Otto, Y. Gu, G. Maslen, M. Manske, S. Campino, D. Turner, B. MacInnis, D. Kwiatkowski, H. Swerdlow, and M. Quail. 2012. Optimizing Illumina next-generation sequencing library preparation for extremely AT-biased genomes. BMC Genomics 13(1):1+.

2. Kozarewa, I., Z. Ning, M. A. Quail, M. J. Sanders, M. Berriman, and D. J. Turner. 2009. Amplification-free illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes. Nature methods 6(4):291-295.

3. Piepenburg, O., Williams, C., Stemple, D., Armes NA. (2006). DNA detection using recombination proteins. PLoS Biol. 4(7): e204.

4. Waldbieser, G. et al. 2013. Production of long (1.5kb – 15.0kb), accurate, DNA sequencing reads using an illumina HiSeq2000 to support de novo assembly of the blue catfish genome. Plant & Animal Genome XXI. Poster.

(苏州铁艺楼梯)