首页 | 本学科首页   官方微博 | 高级检索  
   检索      

牛SNP芯片分型检出率和分型错误率对基因型填充准确率的影响
引用本文:李智,何俊,蒋隽,Richard G.Tait Jr.,Stewart Bauck,过伟,吴晓林.牛SNP芯片分型检出率和分型错误率对基因型填充准确率的影响[J].遗传,2019(7).
作者姓名:李智  何俊  蒋隽  Richard G.Tait Jr.  Stewart Bauck  过伟  吴晓林
作者单位:湖南农业大学动物科技学院;美国怀俄明大学动物科学系;美国纽勤公司生物信息与生物统计部;美国威斯康星大学动物科学系
摘    要:SNP芯片已被广泛应用于动植物的遗传研究和生产实践,其基因分型的准确性至关重要。但在实际应用中,常有一定数量的基因型因缺失而需要去估计(填充)。此外,由于各种原因,又常常需要在不同芯片的基因型之间相互填充彼此没有的SNP基因型,或从低密度SNP填充到高密度SNP基因型。因此,基因型填充准确率直接影响后续数据分析的准确性和可靠性。为深入了解基因型填充准确率的影响因素,本研究利用20 116头美国荷斯坦牛的50K SNP芯片基因分型数据,在SNP分型检出率与错误率存在相关和没有相关两种情形下,分别评估了上述两个因素对下游基因型填充准确率的影响。当两者不相关时,模拟的SNP分型检出率从100%降低到50%,SNP分型错误率由0%提升到50%。当两者存在相关时,基因分型的检出率和错误率之间的关系是基于一个实际数据中这两个变量之间的线性回归方程来确定,即模拟的SNP分型检出率从100%降低到50%,SNP分型错误率从0%升高到13.35%。最后,采用5折交叉验证的方法评估基因型填充的准确率。结果表明,当原始数据的SNP分型检出率与错误率彼此独立发生时,基因型填充的错误率受原始SNP分型检出率影响不大(P0.05),却随着原始SNP分型错误率的升高而显著提高(P0.01)。当原始数据的SNP分型检出率与错误率存在负相关时,基因型填充的错误率随着原始SNP分型检出率的降低而显著提高(P0.01)。在这两种情形下,建议SNP分型检出率应在90%以上,基因型填充准确率才能不低于98%。该结果可为提升实际的SNP分型和下游数据分析的质控提供参考依据。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号