东喜新文测序算法影响了微生物SAR研究结果

物种-面积关系(Species-Area Relationships,SARs)作为生物地理学中一个经典的模式,描述了物种丰富度与空间尺度之间的正相关关系。在微生物里开展的相关结果常常存在不一致性,而其来源需要探讨。东喜玛拉雅研究院的最新研究发现,甚至仅是针对高通量测序数据分析算法都会使得测的SAR关系发生改变,算法与模型之间的组合也会导致不同的结果。

高通量测序技术已经成为研究微生物多样性的重要技术,需要使用算法,如UPARSEDADA2UNOISE3Deblur来得到分类单元;这些算法在去噪和序列聚类策略上的差异可能导致数据结构发生变化,从而影响SARs模型的拟合及解释力。为了系统评估算法与模型选择对SARs分析的影响,本研究选取了相同的数据级,运用上述4种算法进行数据处理,并利用包含幂律、对数、指数等在内的20种模型进行拟合比较,旨在探讨算法与模型间的最佳匹配方案。不同的算法处理策略直接导致了α多样性的测量差异,并进一步影响了SARs斜率的估计。如DADA2算法由于对低丰度物种表现出更高的敏感性,生成的SARs斜率更为陡峭。此外,本研究还表明,没有一种单一模型能够适用于所有基于不同算法产生的数据集的最佳拟合。综合考虑DADA2算法和幂律模型在本研究中的表现,作者推荐该组合作为优先选择方案,以期提高数据处理与模型选择的一致性和可靠性。

左图不同算法下对SAR斜率估计的差异,右图为不同算法与模型组合的显著性分析

此工作不仅有助于解决因数据处理方法与模型选择不当引起的结果不可比性问题,而且为建立微生物生态学研究中的标准化分析流程提供了重要的理论依据和技术支持,为更精确地理解和预测微生物多样性的分布模式奠定了基础。

相关论文于2025311日刊登在Microorganisms期刊上,大理大学东喜玛拉雅研究院本科生祁福良为论文第一作者,肖文研究员和李娜助理研究员为通讯作者。

撰稿 | 程依婷

审校 | 谭坤

 排版 | 张紫健

 

 

 

 

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注