通过模拟揭示识别性双型所需的最小样本量
对化石物种性选择的研究最重要的一点就是识别性双型,然而关于如何识别性双型、需要多少的化石样本才能识别性双型却始终是一个困难的问题。因而该研究基于计算模拟实验探讨不同分布参数对单变量性状中识别双型所需的最小样本量的影响,并构建了一个可预测该样本量的模型。
多型(polymorphism)是指在单一物种内,不同个体在某一性状上表现出不同形态的现象,它在物种分化、遗传变异、性选择过程和适应性演化中发挥着关键作用。然而,由于化石记录保存不完整、样本量有限以及缺乏性别先验信息等因素,检测化石类群的多型面临巨大挑战。双型(dimorphism)作为最简单、最常见的多型形式,定义为在同一物种内,某性状仅表现出两种不同形态。本研究聚焦双型而非更广义的多型,以简化分析流程。在单一性状中检测双型有助于理解群体动力学,尤其是栖息于多样化环境的物种。
研究人员采用计算模拟实验来估算在单变量形态性状中检测双峰分布所需的最小样本量,并将所测性状(如骨骼测量值或体重)的多样性描述为由特定参数描述(均值、标准差、偏度及相对群体数量比例)的概率密度分布。随后,在不同样本量下对模拟的分布进行采样并检验其双峰性,并且进行重复采样以保证结果的稳健性,研究识别出以上四个关键参数对双型识别所需最小样本量具有显著影响。
基于模拟结果,研究人员构建并优化了一个人工神经网络模型,并使用现生鸟类和爬行动物数据集对其进行了验证。研究结果表明,体重、性别比与种内体重变异等种群参数能够显著影响双峰分布的所需要的最小样本量。最后,研究团队基于现生鸟类的统计参数,推算出一个适用于评估化石鸟类性双型所需最小样本量的经验性参考阈值,为古生物学中性双型的可靠识别提供了方法参考。
本研究通过系统的模拟与建模方法,为古生物学中形态性双型的识别提供了第一个可预测的最小样本量评估框架,不仅填补了相关方法学空白,还为化石采样与测量策略的制定提供了指导。尽管本研究在模型假设和参数分布方面存在简化,且将双型识别限定为双峰分布检验,但所提出的方法与经验阈值仍能为未来多变量分析和更复杂分布模型的研究奠定基础。
该研究由南京大学地球科学与工程学院独立完成。南京大学博士研究生周一擘为论文第一作者,泮燕红教授为通讯作者,合作者为侯旭东高级工程师。该研究得到了国家自然科学基金、中央高校基本科研专项资金联合资助的支持。