多位点关联分析新方法及其mrMLM v3.0软件包

活动

主讲者

章元明教授, 楚天学者特聘教授,华中农业大学植物科技学院

章元明,华中农大植科院工作,加州大学Riverside分校博士后,二级教授,楚天学者特聘教授,教育部新世纪人才,国家基金会评专家,英国遗传学会会员和加拿大作物学会荣誉会员,《生物统计与田间试验》国家精品课程负责人。主要从事统计基因组学和基因分子进化研究工作,主要进展有:1)建立关联分析混合线性模型框架并发展其多位点方法;2)研究基因组变异与复杂性状形成的分子进化机制;3)提出了QTL定位的全基因组复合区间作图(GCIM)、惩罚最大似然和Bayesian压缩估计方法;4)发展了偏分离群体连锁图矫正方法;5)系统拓展了主基因+多基因混合遗传分析方法。主持与参加科研项目20余项,在Mol Biol Evol、Physics of Life Reviews、BMC Biology、Briefings in Bioinformatics、Proc R Soc B、PLoS Computational Biology、Genetics和Heredity等发表SCI论文66篇,研制mrMLM、SEA和DistortedMap软件包3套。获教育部自然科学二等奖1项。担任Heredity、Scientific Reports、BMC Genetics和Canadian Journal of Plant Science编委,Frontiers in Plant Science的Topic Editor。合著《植物数量性状遗传体系》,著《数量性状分离分析与R软件》,主编《生物统计学》教材等3部。已培养各类研究生54名。在第三届国际数量遗传学大会上作特邀大会报告。


语言

中文


摘要

全基因组关联分析已在复杂性状遗传剖析中广泛应用。但是,常用的方法是基于群体结构与多基因背景控制和SNP固定效应的单标记关联全基因组扫描。这涉及多重检验问题。为在全基因组水平上控制第I类错误率,一般采用Bonferroni矫正。由于这种矫正十分保守,致使检测位点的总贡献率远小于性状遗传率。这表示丢失了复杂性状的一些重要基因/位点。为了克服这一缺陷,本课题组基于多位点遗传模型、SNP随机效应、混合线性模型及其新变换和关联分析快速计算算法,提出了mrMLM、FASTmrMLM、FASTmrEMMA、ISIS EM-BLASSO、pLARmEB和pKWmEB六种新的多位点全基因组关联分析方法。这些方法均为两步。在第1步中,利用不同的算法,在控制背景的情况下扫描全基因组的每一标记或每一条染色体上的所有标记,其目的是找出与复杂性状所有潜在关联的标记;在第2步中,将筛选的所有潜在标记全部放入同一遗传模型中,利用经验Bayes和似然比检验,最终鉴定出与复杂性状显著关联的QTNs。计算机模拟研究表明:1)新方法的QTN检测功效显著高于GEMMA、EMMAX和FarmCPU等国际流行方法;2)新方法的QTN参数估计值精度也显著高于上述各方法;3)虽然新方法采用了较为宽松的LOD=3显著标准(等价于概率为2e-4,常常远低于Bonferroni矫正的0.05/m),但是其假阳性率低于0.05%,与常用单标记关联全基因组扫描Bonferroni矫正方法的假阳性率相当,说明有效控制了假阳性率;4)由于增加了大数据处理和CPU并行运算,运行时间大大缩短,并研制了相应的软件包mrMLM v3.0。为了进一步验证新方法的有效性,分析了一组拟南芥实际数据。结果表明:新方法比现有的方法检测到更多的显著关联标记,特别是关联区域,在这些标记附近或区域内存在更多的被生物学实验证实的基因。此外,还讨论了这些方法的使用问题,并将mrMLM应用于BC群体,其QTL检测功效分别比CIM高20%,特别是小效应和连锁QTL,这称为全基因组复合区间作图GCIM方法。这有利于eQTL检测。