物种-面积关系(Species-Area Relationships,SARs)作为生物地理学中一个经典的模式,描述了物种丰富度与空间尺度之间的正相关关系。在微生物里开展的相关结果常常存在不一致性,而其来源需要探讨。东喜玛拉雅研究院的最新研究发现,甚至仅是针对高通量测序数据分析算法都会使得测的SAR关系发生改变,算法与模型之间的组合也会导致不同的结果。
高通量测序技术已经成为研究微生物多样性的重要技术,需要使用算法,如UPARSE、DADA2、UNOISE3和Deblur来得到分类单元;这些算法在去噪和序列聚类策略上的差异可能导致数据结构发生变化,从而影响SARs模型的拟合及解释力。为了系统评估算法与模型选择对SARs分析的影响,本研究选取了相同的数据级,运用上述4种算法进行数据处理,并利用包含幂律、对数、指数等在内的20种模型进行拟合比较,旨在探讨算法与模型间的最佳匹配方案。不同的算法处理策略直接导致了α多样性的测量差异,并进一步影响了SARs斜率的估计。如DADA2算法由于对低丰度物种表现出更高的敏感性,生成的SARs斜率更为陡峭。此外,本研究还表明,没有一种单一模型能够适用于所有基于不同算法产生的数据集的最佳拟合。综合考虑DADA2算法和幂律模型在本研究中的表现,作者推荐该组合作为优先选择方案,以期提高数据处理与模型选择的一致性和可靠性。