您当前的位置: > 详细浏览

GWAS中极端不平衡数据统计分析方法

请选择邀稿期刊:

The statistical analysis methods for extremely unbalanced data in GWAS

摘要: 极端不平衡数据定义为自变量或因变量指标的取值呈现严重比例失衡的数据,例如病例-对照极度不平衡、疾病发病率极低、生存数据大量删失以及遗传位点为低频或罕见变异等。在此情境下,logistic回归模型、Cox比例风险模型等参数假设检验的经典统计量偏离正态分布,难以控制一类错误。近年来,随着超大型人群队列全基因组关联研究资源的日益共享与深度挖掘,高效准确处理独立或非独立样本极端不平衡数据的统计需求日益突出。为此,本文系统地进行了方法学概述。首先,综述常见经典统计量理论推导的原理;其次,阐述极端不平衡数据对统计量分布的影响;然后,介绍遗传统计学中常用的两种统计量校正方法:Firth校正和鞍点近似方法;最后,简介极端不平衡基因组学数据常用软件。本文为极端不平衡数据的统计分析提供理论参考和应用推荐。

版本历史

[V2] 2024-05-06 15:30:19 ChinaXiv:202404.00373V2 下载全文
[V1] 2024-04-25 20:02:52 ChinaXiv:202404.00373v1 查看此版本 下载全文
点击下载全文
预览
同行评议状态
待评议
许可声明
metrics指标
  •  点击量59
  •  下载量15
评论
分享
申请专家评阅