
基因组时代的动物遗传评估技术.ppt
35页基因组时代的动物遗传评估技术张张 勤勤 刘剑锋刘剑锋中国农业大学中国农业大学2009.8.252009.8.25哈尔滨哈尔滨遗传评估遗传评估•评估和比较动物个体在遗传上的优劣评估和比较动物个体在遗传上的优劣•为选择优秀种用个体提供依据为选择优秀种用个体提供依据•动物育种的中心工作动物育种的中心工作表现型=基因型+环境表现型=基因型+环境常规遗传评估技术常规遗传评估技术基因基因(黑箱)(黑箱)表型表型环境环境环境环境选择选择选择选择遗传评估遗传评估亲属的表型亲属的表型BLUPBLUP特点:利用表型进行遗传评估特点:利用表型进行遗传评估常规遗传评估技术常规遗传评估技术•BLUP方法是常规遗传评估技术的核心方法是常规遗传评估技术的核心y y:表型信息:表型信息A A:系谱信息:系谱信息常规遗传评估技术常规遗传评估技术•对很多重要经济性状十分有效对很多重要经济性状十分有效美国荷斯坦奶牛产奶量表型及遗传进展美国荷斯坦奶牛产奶量表型及遗传进展加拿大猪100kg体重日龄遗传进展常规遗传评估技术常规遗传评估技术•局限性局限性–当性状表型难以获取或遗传力低时,遗传评估当性状表型难以获取或遗传力低时,遗传评估可靠性不高可靠性不高–不能进行早期遗传评估不能进行早期遗传评估标记辅助选择(MAS)基因基因(黑箱)(黑箱)表型数据表型数据表型数据表型数据基因信息基因信息基因信息基因信息遗传评估遗传评估遗传评估遗传评估分子遗传学分子遗传学分子遗传学分子遗传学主效基因主效基因/QTL选择选择选择选择特点:利用表型和部分基因的信息进行遗传评估特点:利用表型和部分基因的信息进行遗传评估标记辅助选择(标记辅助选择(MASMAS))y y:表型信息:表型信息A A:系谱信息:系谱信息M M:: 标记信息标记信息遗传评估技术遗传评估技术 -- MA-BLUPMA-BLUP::标记辅助选择(标记辅助选择(MASMAS))•应用现状应用现状–实际应用不多实际应用不多–应用效果不显著应用效果不显著–主要原因:主要原因:•已被证实具有显著效应的基因或标记有限已被证实具有显著效应的基因或标记有限–(发现并证实一个有效的基因需要很长的时间和(发现并证实一个有效的基因需要很长的时间和很高的成本)很高的成本)•这些基因或标记仅能解释有限的遗传变异这些基因或标记仅能解释有限的遗传变异–((10 QTL 10 QTL ~~50% 50% 遗传变异)遗传变异)基因组选择基因组选择•利用覆盖全基因组的高密度标记(利用覆盖全基因组的高密度标记(SNPSNP)进)进行个体遗传评估行个体遗传评估–可以捕获所有的遗传变异可以捕获所有的遗传变异–无需表型信息即可进行遗传评估无需表型信息即可进行遗传评估–利用利用SNPSNP芯片技术进行标记测定芯片技术进行标记测定基因基因(黑箱)(黑箱)标记信息标记信息标记信息标记信息遗传评估遗传评估遗传评估遗传评估 全基因组全基因组SNPSNP芯片芯片YearNo. SNPChipsHuman20083,000,0001000kPoultry20052,800,00060KBovine2007~2,000,00054kPig2008~2,000,00060kSheep2007-50k用于遗传评估的数据用于遗传评估的数据10001112200200121110111121111011110011211000201220022201111202101200211122110021112001111001011011010220011002201101120020110102022212112210201001110001122022122211202112012020100202202000021100011202011221112111022011110000212202000221012020002211220111012100111211102112110020102100022000220100020110000220221102211210112111012222001211212220020002002020201222110022222220022121111210021111200110111011200202220001112011010211121211102022100211201211001111102111211021112200010110111020220022111010201112111101120210210212110110221220012110112110120220110022200210021100011100211021101110002220020221212110002220102002222121221121112002011020200122222211221202121121011001211011020022000200100200011110110012110212121112010101212022101010111110211021122111111212111210110120011111021111011111220121012121101022202021211222120222002121210121210201100111222121101基因组选择基因组选择•基本步骤1. 利用一个参考群体估计每个SNP的效应–参考群体:每个个体都有性状表型记录和所有SNP基因型2. 利用SNP效应估计值计算候选群体的个体基因组育种值–候选群体:每个个体都有所有SNP基因型基因组选择基因组选择估计所有估计所有SNP的遗传的遗传效应效应SNP基因型基因型性状表型性状表型SNP基因型基因型估计基因组估计基因组育种值育种值SNP基因型基因型候候选选群群体体估计基因组估计基因组育种值育种值参参考考群群体体在参考群中估计标记效应在参考群中估计标记效应g gi i 设计矩阵设计矩阵 染色体片断遗传效应染色体片断遗传效应估计标记效应估计标记效应在候选群体中计算个体在候选群体中计算个体gEBVgEBV全部基因组染色体片断全部基因组染色体片断设计矩阵设计矩阵 染色体片断效应染色体片断效应4×计算基因组育种值计算基因组育种值( (gEBVgEBV) )基因组育种值基因组育种值1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 - 1 - 1 = +38- 40SNPeffect- 00+ 20+ 40- 20Chr 1Chr 2Chr 3......Chr nKnown SNPsNumber of SNPsSNP allele effect标记效应的估计方法Ø最小二乘法最小二乘法Ø岭回归和岭回归和BLUPBLUPØ贝叶斯方法贝叶斯方法BayesABayesA, B, C , B, C 和压缩和压缩Ø其他方法其他方法半参数、非参数半参数、非参数机器学习、主成份分析机器学习、主成份分析最小二乘法对标记效应分布无任何假设对标记效应分布无任何假设1: 1: 对每个标记作单点回归分析对每个标记作单点回归分析2: 2: 选择效应值最大的选择效应值最大的m m个点放入模型中,同时对其个点放入模型中,同时对其进行估计进行估计不足:不足:1. 1. 难以确定模型选择的阈值难以确定模型选择的阈值 2. 2. 容易高估标记效应容易高估标记效应最佳线性无偏预测和岭回归假定全部标记有相同的假定全部标记有相同的方差方差BLUP:岭回归岭回归: 人为选定人为选定sym.贝叶斯方法-A允许不同标记有不同的方差且服从一定分布允许不同标记有不同的方差且服从一定分布数据模型数据模型方差模型方差模型使用使用Gibbs sampling!Gibbs sampling!u , gi , V Ve , Vgi图片来自图片来自Hayes,2001允许标记方差为允许标记方差为0 0概率概率为 q概率概率为 1-qBayesian shrinkage标记效应越大标记效应越大, , 压缩越弱压缩越弱 标记效应越小,压缩越强标记效应越小,压缩越强贝叶斯方法-B,压缩准确性:估计育种值和真实育种值间的相关数据来自 Meuwissen al et., 2001不同方法的准确性SNP Add.PolygenicSNP Dom.a: additive SNP d: dominance SNPu: polygenic e: residuey y:表型信息:表型信息X: X: 遗传标记信息遗传标记信息A A:系谱信息:系谱信息模型的扩展基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)•后裔测验后裔测验 ( (数据来自加拿大数据来自加拿大) )–每年参加后测的公牛数量每年参加后测的公牛数量: : 500500头头–每头后测公牛的育种成本每头后测公牛的育种成本: : 5 5万美元万美元–后测的总成本后测的总成本: : 25002500万美元万美元–中选公牛数目中选公牛数目: : 2020头头–每头中选公牛的育种成本每头中选公牛的育种成本: : 125125万美元万美元–年遗传进展年遗传进展: : 0.2150.215遗传标准差遗传标准差–单位遗传标准差遗传进展的育种成本单位遗传标准差遗传进展的育种成本: : 1.161.16亿美元亿美元•基因组选择基因组选择–每个个体基因组标记信息测定成本:每个个体基因组标记信息测定成本:500500美元美元–基因组单倍型效应估计基因组单倍型效应估计•孙女试验设计孙女试验设计: 50: 50个公牛家系个公牛家系, , 每头公牛每头公牛5050个儿子个儿子, ,每个儿子每个儿子100100个女儿个女儿•效应估计成本:效应估计成本:125125万美元万美元–公牛母亲选择公牛母亲选择•进行进行 20002000头母牛的预选择头母牛的预选择•全部个体进行基因组标记信息测定,根据全部个体进行基因组标记信息测定,根据GEBVGEBV选择选择10001000母牛母牛•评估成本评估成本: :100100万美元万美元基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)•基因组选择(续)基因组选择(续)–公牛选择公牛选择•从从10001000头公牛母亲中获得头公牛母亲中获得500500头预选公牛头预选公牛•对所有公牛进行基因组标记测定,根据对所有公牛进行基因组标记测定,根据GEBVGEBV选择选择2020头公牛头公牛•评估成本评估成本: 25万美元万美元–2020头公牛的购买成本头公牛的购买成本: :1010万美元万美元–每头公牛连续每头公牛连续3 3年的维持费用年的维持费用: : 3 3万美元万美元–每年的总育种成本每年的总育种成本: :195195万美元万美元–每年的遗传进展每年的遗传进展: : 0.4670.467遗传标准差遗传标准差–单位遗传标准差遗传进展的育种成本单位遗传标准差遗传进展的育种成本:417417万美元万美元基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)基因组选择的另一策略基因组选择的另一策略•利用参考群体估计SNP效应•选择效应显著的SNP•利用选择SNP的信息构建的参考群体和候选群体个体间的加性遗传相关矩阵(具有性状特异性)•用BLUP方法估计候选群体(无表型信息)的个体育种值原理:原理:参考群体参考群体及候选群及候选群体的个体体的个体育种值育种值利用利用SNP的信息构建的加的信息构建的加性遗传相关矩阵性遗传相关矩阵基因型系谱基因型系谱121101011110 111211120200101121101111122221121111 101101111102 0111110120111211200110100 = homozygous for first allele (alphabetically)1 = heterozygous2 = homozygous for second allele (alphabetically)G的构建准准确确性性标记效应估计方法标记效应估计方法两种基因组选择策略的比较两种基因组选择策略的比较基因组选择在奶牛中的应用基因组选择在奶牛中的应用开始应用基开始应用基因组选择的因组选择的年份年份国家国家应用范围应用范围2009Canada, Germany, USA, New Zealand, Israel, France, Ireland, Spain((8 8个国家个国家))For the selection of: young unproven bulls,active proven bulls,Bull dams2010Austria, Australia, Poland((3 3个国个国家家))未来/尚未决定UK, Netherlands, Norway, Denmark, Italian, Japan, Belgium, Czech Republic, Estonia, Finland, Hungary, Latvia, Slovak Republic, Slovenia, South Africa, Sweden, Switzerland, China ((17个国家个国家))Questions•如何估计和分析基因间的互作效应如何估计和分析基因间的互作效应? ?•基因组基因组SNPSNP标记测定数目的确定标记测定数目的确定? ?•SNPSNP效应的估计周期效应的估计周期? ?•长期选择优化的方案问题长期选择优化的方案问题? ?•多性状选择问题多性状选择问题? ? •畜禽育种中基因定位的必要性畜禽育种中基因定位的必要性? ?Thanks for your attentions!。
