2015,31(2)李东萍等:16S rRNA测序技术在肠道微生物中的应用研究进展
75应用,UniFrac距离[28]解决了这个问题。UniFrac距离利用测序序列信息建立的物种系统发育树,考虑了物种的相似度:如果一个群落中的某物种变成另一个群落中进化关系相近的物种,则视为较小的变化,所反映出的两个群落的距离较小;如果一个群落中某物种变成另一个群落中进化关系较远的物种,则视为较大的变化,两个群落距离较大。非加权UniFrac(unweighted UniFrac)只考虑了物种有无的变化,加权UniFrac(weighted UniFrac)同时考虑了物种有无和物种丰度的变化。UniFrac距离可以在UniFrac网站进行在线计算,也可以通过QIIME分析流进行计算,二者也都可以直接依据UniFrac距离给出PCA或PCoA图。Zhang等[29]通过对加权UniFrac距离进行PCA分析,发现高脂饲料可以使小鼠肠道微生物的群落结构发生明显变化。
聚类分析是另一种直观表示样品间相互关系的方法。该方法利用样品间距离的数据,建立样品的系统发生树,以反映各个样品的聚类情况。QIIME分析流中采用不加权配对组算术方法(Unweighted pair group method with arithmetic mean,UPGMA)法进行聚类,并且折刀分析法(Jackknifing analysis)验证该系统发生树的稳健性。一般来说,系统发生树所反映的样品间聚类或距离的信息少于PCA或PCoA图,因此聚类分析在肠道微生物16S rRNA测序的生物信息学分析中并不常用。
检验[32],Mann-Whitney检验[31]等也都可被用在比较不同组样品肠道微生物分类单位之间差异中。
冗余分析(Redundancy analysis,RDA)是类似于PCA和PCoA的一种分析方法。与PCA和PCoA只将样品间相互关系表示在二维坐标轴所不同的是,RDA可以将样本的物种相对丰度信息和环境因子综合起来进行分析,因此可以用来分析微生物物种和环境因子之间的关系,以寻找与环境因子有关的关键微生物分类单位。Zhang等[11]通过RDA分析,找到了268个与中药成分黄连素处理有关的肠道微生物OTU。
Random Forests法则采用了不同的策略解决寻找关键微生物分类单位的问题。Random Forests构建不同处理或病理状态的分类模型,通过考察移除每一个物种单位后分类模型错误率的增加来判定该物。Lozupone等[10],种在区分不同状态中的重要性[33]
通过Random Forests法找到了区分HIV感染者与健康者肠道微生物群落的关键分类单位发现,拟杆菌科、理研菌科等的降低和单毒丝菌科、普雷沃氏菌科等的升高。
近年来,一些专门用于16S rRNA测序数据分类单位相对丰度比较和Biomarker寻找的软件被开发出来,Metastats[34]和LEfSe[35]是其中的佼佼者。这些软件将统计学方法与已有的生物学信息结合,从而使结果更具有生物学意义。例如,Zhang等[29]利用LEfSe软件分析了长期摄入热量限制对小鼠肠道微生物的影响,发现了乳杆菌属增多等与摄入热量限制有密切关系的肠道微生物变化。
3.4 微生物分类单位分析
如果微生物群落结构表现出整体的差异,则下一步需要找出群落中具体的分类单位来解释这些差异。找到不同组样品之间有显著差异的分类单位有助于人们发现所研究问题与肠道微生物之间的直接关联,其中的一些起关键作用的分类单位也可以作为肠道微生物层面上的生物标志物(Biomarker)。
传统的统计学假设检验可以帮助人们找到各个组之间有显著差异的分类单位。例如,Zhang等[20]通过对葡萄糖正常耐受者和前期糖尿病患者肠道微生物中各分类单位的相对丰度进行Kruskal-Wallis H 检验发现,疣微菌门和疣微菌纲在前期糖尿病患者肠道内显著减少,推测疣微菌纲可以作为葡萄糖耐,卡方受不良的生物标志物。Student’s t检验[30,31]
3.5 关键分类单位的功能分析
通过上述方法寻找到的关键分类单位在不同组中有显著差异,但它们是否具有特定的生物学功能还需要进一步分析和实验验证。
分类单位相对丰度与宿主生理指标的相关性分析可以为分析关键分类单位的功能提供很好的方向。若某一关键分类单位的相对丰度与宿主某一生理指标呈现高度相关性,则该分类单位很可能通过影响该生理指标所反映的宿主代谢过程而影响宿主健康。Zhang等[11]在分析黄连素、肠道微生物和宿主健康三者间关系时就应用了这种分析方法,并将其命名
76
生物技术通报 Biotechnology Bulletin
2015,Vol.31,No.2为MiWAS策略。依据已有数据推测出关键分类单位可能的功能后,开展相应的实验验证往往可以使结果更加具有说服力。
elderly[J]. Proc Natl Acad Sci USA, 2011, 108(suppl.1):4586-4591.
[6]Turnbaugh PJ, Hamady M, Yatsunenko T, et al. A core gut
microbiome in obese and lean twins[J]. Nature, 2009, 457(7228):480-484.
[7]Larsen N, Vogensen FK, van-den-Berg FW, et al. Gut microbiota
in human adults with type 2 diabetes differs from non-diabetic adults[J]. PLoS One, 2010, 5(2):e9085.
[8]Karlsson FH, Fak F, Nookaew I, et al. Symptomatic atherosclerosis
is associated with an altered gut metagenome[J]. Nature Communications, 2012, 3:1245-1252.
[9]Guo MZ, Huang KL, Chen SY, et al. Combination of metagenomics
and culture based methods to study the interaction between ochratoxin a and gut microbiota[J]. Toxicological Sciences, in press, 2014, doi:10.1093/toxsci /kfu128.
[10]Lozupone CA, Li M , Campbell TB, et al. Alterations in the gut
microbiota associated with HIV-1 infection[J]. Cell Host & Microbe, 2013, 14(3):329-339.
[11]Zhang X, Zhao Y, Zhang M, et al. Structural changes of gut
microbiota during berberine-mediated prevention of obesity and insulin resistance in high-fat diet -fed rats[J]. PloS One, 2012, 7(8):e42529.
[12]Claesson MJ, Wang Q, O’Sullivan O, et al. Comparison of two
next-generatio n sequencing technologies for resolving highly
4 展望
人类对微生物的研究已有很长的历史,积累的关于微生物的知识极为丰富,近年来高通量测序技术的应用使人们对微生物的认识更加深入。但遗憾的是目前缺少对这些已有知识的总结,尚未形成可以应用在高通量分析中的微生物功能数据库。类似于KEGG数据库在转录组分析中的重要作用,微生物功能数据库也将极大地推动16S rRNA测序数据分析的发展,有利于人们分析肠道微生物协同变化的物种的共同功能,从而加深人们对试验结果的认识。
另一方面,目前还很难进行16S rRNA测序试验的后续试验工作,这很大程度上与无法可靠的从粪便中分离出目标菌株有关。可以大胆猜想这样一种技术:分析出有显著变化的菌株后,从测序数据中找到该菌株的16S序列,利用这段序列为测序引物,从粪便样品混合菌基因组中,开展针对目标菌株序列的全基因组测序,或者锁定和缩小目标菌株范围,通过特异性抗体免疫亲和磁珠从粪便样品特异性的富集目标菌株,然后扩大培养后探究其性质。
参 考 文 献
[1]许文涛, 郭星, 罗云波, 等. 微生物菌群多样性分析方法的研究
进展[J]. 食品科学, 2009, 30(7):258-265.
[2]Sogin ML, Morrison HG, Huber JA, et al. Microbial diversity in the
deep sea and the underexplored “rare biosphere”[J]. Proceedings of the National Academy of Sciences, 2006, 103(32):12115-12120.
[3]Yatsunenko T, Rey FE, Manary MJ, et al. Human gut microbiome
viewed across age and geography[J]. Nature, 2012, 486(7402):222-227.
[4]Domin guez-Bello MJ, Costello EK, Contreras M, et al. Delivery mode
shapes the acquisition and structure of the initial microbiota across multiple body habitats in newborns[J]. Proc Natl Acad Sci USA, 2010, 107(26):11971-11975.
[5]Claesson MJ, Cusack S, O’Sullivan O, et al. Composition,
variability, and temporal stability of the intestinal microbiota of the
complex microbiota composition using tandem variable 16S rRNA gene regions[J]. Nucleic Acids Research, 2010, 38(22):e200-e200.
[13] Bartram AK, Lynch MDJ, Stearns JC, et al. Generation of multimi-llion-sequence 16S rRNA gene libraries from complex microbial communities by assembling paired-end Illumina reads[J]. Applied and Environmental Microbiology, 2011, 77(11):3846-3852.
[14]Zhou HW, Li DF, Tam NFY, et al. BIPES, a cost-effective high-throughput method for assessing microbial diversity[J]. The ISME Journal, 2011, 5(4):741-749.
[15]Kozich JJ, Westcott SL, Baxter NT, et al. Development of a dual-index sequencing strategy and curation pipeline for analyzing amplicon sequence data on the MiSeq Illumina sequencing platform[J]. Applied and Environmental Microbiology, 2013, 79(17):5112-5120.
2015,31(2)李东萍等:16S rRNA测序技术在肠道微生物中的应用研究进展
486(7402):207-214.
77[16]Lundin D, Severin I, Logue JB, et al. Which sequencing depth is
sufficient to describe patterns in bacterial α-and β-diversity?[J]. Environmental Microbiology Reports, 2012, 4(3):367-372.
[17]叶丹丹, 樊萌萌, 关琼, 等. 宏基因组研究的生物信息学平台
现状[J]. 动物学研究, 2012, 33(6):574-585.
[18]Wang X, Cai Y, Sun Y, et al. Secondary structure information does
not improve OTU assignment for partial 16s rRNA sequences[J]. The ISME Journal, 2012, 6(7):1277-1280.
[19]Li W, Godzik A. Cd-hit:a fast program for clustering and
comparing large sets of protein or nucleotide sequences[J]. Bioinformatics, 2006, 22(13):1658-1659.
[20]Zhang X, Shen D, Fang Z, et al. Human gut microbiota changes
reveal the progression of glucose intolerance[J]. PloS One, 2013, 8(8):e71108.
[21]Schloss PD, Westcott SL, Ryabin T, et al. Introducing mothur:
open-source, platform-independent, community-supported software for describing and comparing microbial communities[J]. Applied and Environmental Microbiology, 2009, 75(23):7537-7541.
[22]Caporaso JG, Kuczynski J, Stombaugh J, et al. QIIME allows
analysis of high-throughput community sequencing data[J]. Nature Methods, 2010, 7(5):335-336.
[23]Schloss PD, Handelsman J. Introducing DOTUR, a computer
program for defining operational taxonomic units and estimating species richness[J]. Applied and Environmental Microbiology, 2005, 71(3):1501-1506.
[24]Rajili?-Stojanovi? M. Function of the microbiota[J]. Best
Practice & Research Clinical Gastroenterology, 2013, 27(1):5-16.
[25] Hammer ?, Harper DAT, Ryan PD. Past:paleontological
statistics software package for education and data analysis[J]. Paleontología Electrónica, 2001, 4:1-9.
[26]Human Microbiome Project Consortium. Structure, function and
diversity of the healthy human microbiome[J]. Nature, 2012,
[27]Looft T, Johnson TA, Allen HK, et al. In-feed antibiotic effects on
the swine intestinal microbiome[J]. Proceedings of the National Academy of Sciences, 2012, 109(5):1691-1696.
[28]Lozupone C, Lladser ME, Knights D, et al. UniFrac:an effective
distance metric for microbial community comparison[J]. The ISME Journal, 2011, 5(2):169-172.
[29]Zhang C, Li S, Yang L, et al. Structural modulation of gut microbiota
in life-long calorie-restricted mice[J]. Nature Communications, 2013, 4:1-10.
[30]Dey N, Soergel DAW, Repo S, et al. Association of gut microbiota
with post-operative clinical course in Crohn’s disease[J]. BMC Gastroenterology, 2013, 13(1):131-141.
[31]Wang T, Cai G, Qiu Y, et al. Structural segregation of gut microbiota
between colorectal cancer patients and healthy volunteers[J]. The ISME Journal, 2012, 6(2):320-329.
[32]Upadrasta A, O’Sullivan L, O’Sullivan O, et al. The effect of
dietary supplementation with spent cider yeast on the swine distal gut microbiome[J]. PloS One, 2013, 8(10):e75714.
[33]Knights D, Kuczynski J, Koren O, et al. Supervised classification of
microbiota mitigates mislabeling errors[J]. The ISME Journal, 2011, 5(4):570-573.
[34]White JR, Nagarajan N, Pop M. Statistical methods for detecting
differentially abundant features in clinical metagenomic samples[J]. PLoS Computational Biology, 2009, 5(4):e1000352.
[35]Se gata N, Izard J, Waldron L, et al. Metagenomic biomarker
discovery and explanation[J]. Genome Biol, 2011, 12(6):R60-77.
(责任编辑 狄艳红)

