占翔与合作者的论文获 Journal of American Statistical Association在线发表
北京大学北京国际数学研究中心、公共卫生学院联合聘任副教授占翔在统计方法学研究中取得重要成果,研究结果近期以“A Flexible Zero-Inflated Poisson-Gamma Model with Application to Microbiome Sequence Count Data”为题,被国际顶尖统计学期刊Journal of American Statistical Association(JASA)在线发表。
针对基于高通量测序的微生物丰度数据中所包含的测量误差、零膨胀和过度离散(over-dispersion)等数据特征,占翔及其合作者们利用重复观测的微生物丰度样本数据(例如纵向数据),提出了零膨胀的泊松-伽马模型(Zero-Inflated Poisson-Gamma Model, 以下简称ZIPG),拟合数据特征,尽可能减小观测到的样本丰度数据与未能被观测到的总体丰度数据之间所存在的偏差对统计推断的影响。作者首先通过泊松和伽马的分层建模(hierarchical model)来捕捉潜在的测量误差与过度离散的数据特征;然后将分层模型的重要参数与临床数据相关联,并在ZIPG模型框架内提出了对关联参数进行估计的统计方法、以及推导了基于关联参数估计量的统计推断方法(包括置信区间估计与假设检验)。
数值模拟结果表明相比于其它现有的方法,新的ZIPG方法估计参数更为准确,在同等置信水平下有更窄的置信区间;在假设检验方面,ZIPG有更小的犯第一类错误的概率以及更高的检验功效。作者将所提出的方法运用到饮酒者的肠道微生物菌群数据和孕妇的阴道微生物菌群数据的分析中:所提出的新方法能够更好的预测菌群细菌的丰度分布,并分别检测出和嗜酒、怀孕状态相关联的新的微生物菌种标志物,为相关下游的生物医学功能研究提供了新的线索。
占翔老师近照
占翔于2015年获得美国宾夕法尼亚州立大学统计学博士学位。博士毕业后在美国福瑞德哈金森癌症研究中心从事生物统计方向博士后研究,并于2017年7月回到宾夕法尼亚州立大学任职生物统计与生物信息学助理教授。2021年9月入职北京大学。他与清华大学王天颖助理教授为论文的共同通讯作者。
论文链接:
https://www.tandfonline.com/doi/full/10.1080/01621459.2022.2151447