
第四章连锁交换值的计算.ppt
46页第四章第四章 连锁交换值的计算连锁交换值的计算第一节第一节 连锁现象的统计测定连锁现象的统计测定.亲本及其配子遗传构成亲本及其配子遗传构成•相引相相引相AB/ab 配子:亲本型:配子:亲本型:AB, ab 交换型:交换型:Ab, aB•相斥相相斥相Ab/aB 配子:亲本型:配子:亲本型:Ab, aB 交换型:交换型:AB, ab各基因型个体数各基因型个体数双显性:双显性: a=AB;;单显性单显性::b=Ab; c=aB; 隐隐 性性:: d=ab .如何判断连锁关系如何判断连锁关系步骤:步骤: 先分析每个基因是否符合正常分离先分析每个基因是否符合正常分离 然后多对基因再联合分析然后多对基因再联合分析.测测A∶ ∶a与与1∶ ∶1之间的偏差;之间的偏差; 测测B∶ ∶b与与1∶ ∶1之间的偏差之间的偏差 测测新新组组合合;;老老组组合合与与1∶ ∶1之之间间的的偏偏差差,,即即测测两两对对基基因的独立性因的独立性。
一、对测交后代进行x2测验 a=AB; b=Ab; c=aB; d=ab理论上测交后代,理论上测交后代,A:a=1:1 即即 a+b=c+d; B:b=1:1 即即 a+c=b+d 如不连锁重组类型与亲本类型如不连锁重组类型与亲本类型1::1即:即:a++d=b+c.例例::对对AaBb进进行行测测交交,,产产生生612个个后后代代,,其其中中AB=220,,Ab=84,,aB=102,,ab=206,,A、、B基因之间是否存在连锁?基因之间是否存在连锁?把各项数字代入公式:把各项数字代入公式:根据自由度(根据自由度(d.f.),),可以查出获得上述可以查出获得上述 2值的概率值的概率:: 2值 d.f.PAa0.03 10.9-0.7Bb1.67 10.25-0.1总值 95.82 3<0.005Aa-Bb94.121<0.005.二、对F2进行2测验 .表4-1 测验两类性状分离的不同理论比率2值公式2公式1∶12∶13∶115∶19∶7分离比率分离比率r∶1.例一、让例一、让AaBb自交得到自交得到AB == 142,,Ab = 49,,aB = 43,,ab = 15,,n = 249,试问,试问AB之间是否连锁?之间是否连锁?•把各项数值代入公式,则:把各项数值代入公式,则:• d. f. = 1 P = 0.70~0.50 •d. f. = 1 P = 0.90~0.80•d. f. = 1 P = 0.98 总总 2 = 0.3869 + 0.0656 + 0.0004 = 0.4529 d. f.= 3 P= 0.99~ 0.95•可见可见Aa和和Bb各自的分离都符合各自的分离都符合3∶ ∶1分离比率,分离比率,Aa与与Bb重组类别也符合重组类别也符合9∶ ∶3∶ ∶3∶ ∶1之之比,说明这两对基因间不存在连锁关系。
比,说明这两对基因间不存在连锁关系例二,让例二,让AaRr自交,后代出现自交,后代出现AR = 152,,Ar = 99,,aR = 43,,ar = 9,求,求AR之间是否存在连锁关系?之间是否存在连锁关系?•依依9∶ ∶3∶ ∶3∶ ∶1假设,算得各个假设,算得各个 2值和总值和总 2值如下:值如下:• A2=9.99 d. f. = 1 P<0.01• R2=18.31 d. f. = 1 P<0.01• L2=13.66 d. f. = 1 P<0.01• 总总 2 =41.96 d. f. = 3 P< 0.01•从总从总 2来看,这个结果不符合来看,这个结果不符合9∶ ∶3∶ ∶3∶ ∶1的分离的分离比率,但从各比率,但从各 2的分解值来看,出现这种偏差的分解值来看,出现这种偏差主要在于基因对的遗传行为不正常,因而扰乱主要在于基因对的遗传行为不正常,因而扰乱了整个分离群体的比例了整个分离群体的比例例三、例三、PpSs自交,后代表现型为自交,后代表现型为PS = 235,,Ps = 91,,pS = 109,,ps = 9,求,求PS间是否存在连锁关系。
间是否存在连锁关系•算得各算得各 2值及值及P值为:值为:• P2=0.590 d. f. = 1 P= 0.50~0.30• S2=1.453 d. f. = 1 P=0.30~0.20• L2=20.184 d. f. = 1 P<0.01• •总总 2=22.227 d. f. = 3 P <0.01•从总从总 2来看,这两对基因的传递规律不符合独立遗传,来看,这两对基因的传递规律不符合独立遗传,值也表明这两对基因不独立,但值也表明这两对基因不独立,但Pp与与Ss的分离符合的分离符合3∶ ∶1,说明这两对基因各自的分离行为正常,但它们之间,说明这两对基因各自的分离行为正常,但它们之间存在着连锁关系存在着连锁关系三、利用联列表进行测验. Aa小计比率AB=aaB=ca+cbAb=bab=db+d小计a+bc+dn 比率 期望个体数期望个体数a(AB)=npq=n×PA×PB, 即为总个体数乘以即为总个体数乘以A和和B出现概率之积出现概率之积, 带入此式后即可得出每个类型期望值。
带入此式后即可得出每个类型期望值B.例Aa小计小计比率比率Ba=142c=43a+c=185 =0.7429bb=49d=15b+d=64 =0.2570小计小计a+b=191c+d=58n=249比率比率=0.7670=0.2329.各类个体数的理论期望值各类个体数的理论期望值E为为a(AB)=191×0.7429=141.8939b(Ab)=191×0.2570=40.0870c(aB)=58×0.7429=43.0882d(ab)=58×0.2570=14.9060表现型类别表现型类别观察数观察数(O)期望值期望值(E)(O-E)(O-E)2AB(a)142141.89390.10610.00880.000062Ab(b)4949.0870-0.9130.83360.01698aB(c)4343.0882-0.91180.83140.01929ab(d)1514.90600.0940.00880.00059总数总数2492490.03692自由度自由度d.f. =(横行数(横行数-1)(纵行数)(纵行数-1))=((2-1)()(2-1))=1查查 2值表,值表,0.9>P>0.75,说明符合独立遗传,,说明符合独立遗传,Aa和和Bb并不连锁。
并不连锁五、卡方测验的正确应用五、卡方测验的正确应用1、卡方值与样本容量、卡方值与样本容量 实际观察值与期望值保持不变时,样本实际观察值与期望值保持不变时,样本容量大,则卡方变小容量大,则卡方变小 所以,百分数不能用于卡方测验所以,百分数不能用于卡方测验2、连续矫正、连续矫正.表4-2 卡平方值,偏差和样本容量原始样本原始样本((A))偏差不变偏差不变((B))偏差增至偏差增至n倍倍((C))偏差随偏差随 增加增加样本容量样本容量n200800800800实际观察量实际观察量120420480440按按1∶ ∶1期望值期望值100400400400偏差偏差20208040χχ2值值82328此表说明,百分数不能用于卡方测验此表说明,百分数不能用于卡方测验.这里所讲的一些原理也可以用来指导样本容量的设计:这里所讲的一些原理也可以用来指导样本容量的设计:例如,某大麦遗传学家在例如,某大麦遗传学家在200株大麦幼苗中发现有株大麦幼苗中发现有94株是浅绿苗株是浅绿苗而从理论上推算,幼苗应按一半绿苗一半浅绿苗分离实际观而从理论上推算,幼苗应按一半绿苗一半浅绿苗分离。
实际观察值与理论值的偏差为察值与理论值的偏差为6(或相当于期望值的(或相当于期望值的6%))•这一偏差的这一偏差的χ2值仅为值仅为0.72,说明上述分离完全适合,说明上述分离完全适合1∶ ∶1的比例然而,的比例然而,该遗传学家怀疑淡绿基因可能与低生活力有关,故决定作另一种实该遗传学家怀疑淡绿基因可能与低生活力有关,故决定作另一种实验他提的问题是:如果要在更大的样本中仍然保持验他提的问题是:如果要在更大的样本中仍然保持6%的偏差,的偏差,需要检查多少株才能使需要检查多少株才能使χ2值增加达值增加达10倍?答案可以从表中找到,即倍?答案可以从表中找到,即实际观察值与期望值之间的偏差如果保持在实际观察值与期望值之间的偏差如果保持在6%的水平上,将样本的水平上,将样本容量扩大到原来的容量扩大到原来的10倍,就会使卡平方值达到要求的倍,就会使卡平方值达到要求的7.2在这样大在这样大的样本中若能否定的样本中若能否定1∶ ∶1的分离比例,则就足以证明浅绿苗的活力较的分离比例,则就足以证明浅绿苗的活力较差在另一方面,如果大样本的卡平方值证明对差在另一方面,如果大样本的卡平方值证明对1∶ ∶1的分离偏差并的分离偏差并不大,则可消除对淡绿苗活力较差的怀疑。
不大,则可消除对淡绿苗活力较差的怀疑第二节第二节 连锁强度(交换值)的计算连锁强度(交换值)的计算 一、测交法相引相相引相:P值的标准差S.E.p =相斥相相斥相:.利用测交法计算交换值的优点是:利用测交法计算交换值的优点是:1.需要的群体较小;.需要的群体较小;2.能分别求出不同性别的交换值;.能分别求出不同性别的交换值;3.用相引和相斥相的平均资料可以平衡成活率差异造成的影响;.用相引和相斥相的平均资料可以平衡成活率差异造成的影响;4.在三点或多点测验中求出的基因序列比较可靠.在三点或多点测验中求出的基因序列比较可靠小麦、水稻等自花受粉作物由于人工授粉比较麻烦,测交法难于小麦、水稻等自花受粉作物由于人工授粉比较麻烦,测交法难于应用有时,双隐性个体或不能成活,或生活力很弱,在开花授粉应用有时,双隐性个体或不能成活,或生活力很弱,在开花授粉前死亡在这种情况下,就不得不利用前死亡在这种情况下,就不得不利用F2资料求算连锁强度资料求算连锁强度当雌雄配子交换值相等且无选择受精时,在当雌雄配子交换值相等且无选择受精时,在相引相相引相,各类配子自由结合的结果,,各类配子自由结合的结果,F2 4类合子理论次数(频次)为:类合子理论次数(频次)为:b(Ab)=aB(c) =a(AB) = 3(1-P)2/4 + 4P(1-P)/4 + 2P2/4 ==d(ab) =二、理论配子和合子频率的计算二、理论配子和合子频率的计算.相斥相的理论合子次数为:相斥相的理论合子次数为:.表表4-2 不同连锁方式不同连锁方式F1的理论配子次数和的理论配子次数和F2的理论合子次数的理论合子次数配子(及合子)类别代号理论配子次数理论合子次数相引相相斥相相引相相斥相ABaAbbaBcabd总数1111.三、利用F2资料计算交换值(一)根据(一)根据F2双隐性个体出现的频率双隐性个体出现的频率 双隐性个体的出现是由于双隐性个体的出现是由于ab与与ab配子相结合的结果,在相斥相出现次数为配子相结合的结果,在相斥相出现次数为 ,即,即aabb= ,故,故 。
在相引相,双隐性个体出现次数在相引相,双隐性个体出现次数 ,, ,由于,由于此此法法计计算算交交换换值值只只根根据据F2 4种种类类型型中中出出现现概概率率最最少少的的一一种种类类型型,,因因而而常常常常有有较较大的取样误差大的取样误差(二)利用(二)利用F2 4种类型的全部资料种类型的全部资料 1.相加法把a+d与b+c进行比较而计算交换值P值例如,在相引相:.在相斥相:在相斥相: .现现举举一一实实例例进进行行演演算算::玉玉米米中中有有一一个个 株株,,自自交交结结果果如如下下((d为为矮矮生生株株,,pr为红色糊粉层):为红色糊粉层):F2表表 现现型型代号代号株数株数频率频率 ++a4230.492 +prb2120.247 d+c2150.250 Dprd100.012 总数总数 8601.000a + b = 0.504 b + c = 0.497交换值交换值 ,即,即8.4交换单位。
交换单位极极大大似似然然率率((maximum likelihood))是是连连锁锁估估计计中中最最常常用用的的方方法法这这一一方方法法对对重重 组组 率率 估估 计计 需需 要要 从从 资资 料料 (( 数数 据据 )) 中中 获获 得得 尽尽 可可 能能 多多 的的 信信 息息 最最 大大 化化((maximization))则则通通过过求求算算p的的导导数数令令其其为为零零来来进进行行,,即即求求算算的的为为p值值的的最最大大可可能能值值,,试试误误差差达达到到最最小小为为方方便便起起见见,,往往往往把把似似然然的的表表达达转转化化为为对对数数形形式式,,使使函函数数为为最最大大时时,,对对数数值值也也达达最最大大如如果果令令m1,,m2,,m3……mt分分别别表表示示分分离离类类型型1,,2……t的的期期望望比比值值,,并并令令a1,,a2,,…… at为为各各相相应应类类型型的的实实际际个个体体数数期期望望比比值值m可可以以用用p表表示示例例如如在在测测交交时时,,由由相相引引组组连连锁锁的的双双杂杂合合子子产产生生的的4种种后后代代类类型型的的比比值可表示为:值可表示为:m1=m4= 1/2(1-P),,m2=m3=1/2P。
获获得得实实测测家家系系的的似似然然值值可可由由(m1+m2+……+mt)n展展开开式式中中的的一一项项求求出出其其中中n为为家系的总个体数,相应各项为:家系的总个体数,相应各项为:似然率的对数形式为:L = C + a1logm1+a2logm2+……+atlogmt2、极大似然法、极大似然法.通过求导数并令其为零即可得到估计方程:为了解出P,可直接将a1,a2……at的实际观察值和各类型的期望值m1,m2……mt代入该式一般说来,连锁强度的估计可利用测交或F2代资料来进行1..利利用用测测交交资资料料计计算算重重组组率率 若把相引组连锁的双杂合子AB/ab与双隐性个体ab/ab杂交,那么,,把这些m表达式代入估计方程得: .这这样样估估计计的的p值值就就是是该该测测交交中中的的重重组组率率与与此此相相似似,,在在相相斥斥组组连连锁锁情情况况下下,,双双杂杂合合子子中中两基因的重组率两基因的重组率p可用下式估计:可用下式估计:.2、对相引组、对相引组F2代资料而言,仍以代资料而言,仍以a, b, c, d代表代表4类个体数类个体数则有:则有:ABAbaBab观察值abcd理论频率.•如令K=(1-P)2,则:•L = alog(1/2+1/4K)+blog(1/4-1/4K)+clog(1/4-1/4K)+dlog(1/4K)•求导:•通分得:•a(1-K)K-b(2+K)K-c(2+K)K+d(2+K)(1-K)=0•即nK2-(a-2b-2c-d)K-2d=0,n为F2个体数•令Z = a – 2b – 2c – d,•则根据一元二次方程求根公式得:•交换值:•交换值:相斥相连锁得情况下K=P2. 导数实际上是在X0点切线的斜率. = 作代换 即得即得 这就是对数函数的导数公式这就是对数函数的导数公式, ,特殊地特殊地, ,当当 时时, ,由上式得自然对数函数的导数公由上式得自然对数函数的导数公式式: : .如前面例子:相斥相数字计算P值:•n = 860, Z = 423 – 2 212 – 2 215 – 10 = -441.测交例:测交例:在在番番茄茄上上,,基基因因Br代代表表正正常常节节间间,,它它们们相相对对于于短短节节间间基基因因br为为显显性性。
基基因因S为为可可育育基基因因,,对对半半不不育育基基因因 s 表表现现为为显显性性用用双双隐隐性性个个体体((br s/br s))对对双双杂杂合合体体((Brs/br S))作作测测交交测交后代的频数为:测交后代的频数为:Br S ------131-------n/2PBr s -------360-------n/2(1-P)br S -------390--------n/2(1-P)br s -------119-------n/2P总数总数------1000-------n这样,其对数形式的似然函数表达为:这样,其对数形式的似然函数表达为:L=131log(p) + 360log(1-p) + 390log(1-p)+119log(p)p=250/1000=0.2500或或25%p值的精确度常用其标准误值的精确度常用其标准误Sp来衡量测交中,估计来衡量测交中,估计Sp的一般公式为的一般公式为在上例中在上例中于是该测交所测得的重组率及其误差可表达为:于是该测交所测得的重组率及其误差可表达为:p=0.2500±0.01369.四、以四、以F2数据及测交数据估计重组率的数据及测交数据估计重组率的相对效率比较相对效率比较•当一定数量的植株(当一定数量的植株(n)被测定以后,就可以通过比较)被测定以后,就可以通过比较两种交配组合的方差来估计用测交和两种交配组合的方差来估计用测交和F2资料估计重组资料估计重组率率p的相对效率。
比如,在某一测交中算得的重组率的相对效率比如,在某一测交中算得的重组率p=0.20,测定植株数为,测定植株数为400,方差应为,方差应为0.0004在一个与之相似组合中,以与之相似组合中,以F2资料算得在相斥组连锁情况下,资料算得在相斥组连锁情况下,重组率重组率p=0.20,,n=400,方差约为,方差约为0.0023(在相斥组连(在相斥组连锁情况下锁情况下:.•以一定数量的植株数所提供的信息量来衡量的两种组以一定数量的植株数所提供的信息量来衡量的两种组合的相对效率,是与它们方差值的比数成反比的在合的相对效率,是与它们方差值的比数成反比的在上例中,上例中,p值为值为0.2,,n=400,,F2资料相对于测交资料的资料相对于测交资料的效率为:效率为:0.0004/0.0023,或等于,或等于1/6也就是要获得同也就是要获得同样的方差值,采用样的方差值,采用F2资料所需的观测植株数应为采用资料所需的观测植株数应为采用测交后代的测交后代的6倍之多或者说,为了测出倍之多或者说,为了测出20%的重组率,的重组率,测交中所需的样本量可以减为测交中所需的样本量可以减为F2资料的资料的1/6就可以保持就可以保持相同的精度,用方差比值来度量相对效率对于不同相同的精度,用方差比值来度量相对效率对于不同p值值可能有所不同,但总的来说测交要比可能有所不同,但总的来说测交要比F2更有效(除非更有效(除非p的值很小而且的值很小而且F1处于相引组的连锁)因此在条件可能处于相引组的连锁)因此在条件可能时应尽量采用测交法。
时应尽量采用测交法补充、似然函数估计补充、似然函数估计•在连锁分析中,亲本基因型或基因的连锁相有时并不清楚,因而在连锁分析中,亲本基因型或基因的连锁相有时并不清楚,因而无法简单地通过计算重组体出现的频率来进行连锁分析那么如无法简单地通过计算重组体出现的频率来进行连锁分析那么如何判断其连锁关系?在此情况下可以采用似然比方法来检验连锁何判断其连锁关系?在此情况下可以采用似然比方法来检验连锁是否存在,即比较假设两个座位间可能存在连锁(是否存在,即比较假设两个座位间可能存在连锁(r<<0.5)的概)的概率与可能不连锁(率与可能不连锁(r=0.5)的概率其概率之比可以用似然比统计)的概率其概率之比可以用似然比统计量来表示,即量来表示,即L(r)/L(0.5),其中,其中L( )为似然函数为似然函数•为了计算方便,常将为了计算方便,常将L(r)/L(0.5)取以取以10为底的对数,称为为底的对数,称为LOD值为了确定两对基因之间存在连锁,一般要求为了确定两对基因之间存在连锁,一般要求LOD>>3, 即似然比大即似然比大于于1000∶ ∶1,即连锁的可能性要超过不连锁的可能性,即连锁的可能性要超过不连锁的可能性1000倍,与此倍,与此值相对应的值相对应的χ2 测验的显著水平为测验的显著水平为0.0002;而要否定连锁的存在,;而要否定连锁的存在,则要求似然比小于则要求似然比小于100∶ ∶1,即,即 LOD<<2。
•如假定如假定G与与J之间存在如下可能关系:之间存在如下可能关系:. 0.9 log9/5= + 0.23 0.5 log9/5= + 0.130.1 log1/5= –0.07 0.5 log1/5=–0.35LOD值: +0.16 –0.22上述结果的意义是上述结果的意义是, 如要证明两基因连锁,则如要证明两基因连锁,则LOD值达到值达到3时时 的个体数为的个体数为: 3/0.16=18.75即即19株;株;反之,如要否定二者不连锁则需要的个体数为反之,如要否定二者不连锁则需要的个体数为: 3/0.22==13.63即即14株2.利用.利用F2资料估计重组率资料估计重组率 在F2家系中,以p表示的不同类型配子的期望值与测交情况是相同的,但因为雄配子与雌配子的重组率可能相同,也可能不相同,所以以p1和p2分别表示雄配子和雌配子中的重组率则可能更为合理为此,相引组连锁时的配子期望值应分别为: ABAbaBab雄配子雄配子1/2(1-p1)1/2(p1)1/2(p1)1/2(1-p1)雌配子雌配子1/2(1-p2)1/2(p2)1/2(p2)1/2(1-p2)相斥组连锁时各种配子类型的期望值与相引组的写法相似。
根据期望的配子比例就可能预期4种表型上不同的合子的比例因为双隐性合子只能由双隐性的雄配子和双隐性的雌配子结合产生该类型的比例应为 自交时,由于a类个体的总发生率为1/4,所以单隐性类型aB的出现率将为1/4[1-(1 - p1)(1 – p2)]同样,由于b类个体的总发生率为1/4,故Ab类型个体的出现率为1/4[1-(1 - p1)(1 – p2)]双显性类型的出现率必然为1/4[2+(1 - p1)(1 – p2)]例例1:相引相:相引相在大麦上,已知二棱(V)对六棱(v)为显性,绿苗(Lg)对浅绿苗(lg)为显性在基因型VVVLgLg与vvlglg的杂种F2中,4种表型的数量及期望数分别为:类 型:VLgVlgvLgvlg总和实测数:281596058458期望数:n/4(2+p)n/4(1-p)n/4(1-p)n/4(p)n其中p=(1-p1)(1-p2)以 对 数 表 达 的 似 然 率 函 数 为 : L = 281log(1/2+1/4p)+59log(1/4-1/4p)+60log(1/4-1/4p)+58log(1/4p)因此 458p2+15p-116=0 p=0.4871如果能证明p1=p2,那么 p=p2=p1=1- =0.3021或30.21%在相引组连锁中p的标准误由下式计算:其中q=1-p。
在上例中,Sp=0.0265或2.65%,所以其重组率及标准误可表达为:p = (30.21±2.65)%.例例2:相斥相:相斥相如如果果F2资资料料来来自自相相斥斥组组的的F1自自交交,,其其重重组组率率也也可可用用相相似似的的方方法法估估计计例例如如,,番番茄茄的的基基因因O((圆圆果果))对对基基因因o((长长果果))为为显显性性基基因因S((单单花花序序))对对s((复复合合花花序序))为为显显性性由由Os/oS F1值值株株自自交交产产生生的的F2植植株株中中4种类型的实际株数为:种类型的实际株数为: 圆 果单花序长 果单花序圆 果复合花序长 果复合花序总和实际观察数12666634458期望配子比例1/2p11/2(1-p1)1/2(1-p1)1/2(p1) 1/2p21/2(1-p2)1/2(1-p2)1/2(p2) 期望表型比例n/4(2+p)n/4(1-p)n/4(1-p)n/4pn其中:p = p1 × p2.取对数表达的似然率函数式为:取对数表达的似然率函数式为:L = 126log(1/2+1/4p) + 66log(1/4-1/4p) +63log(1/4-1/4p)+4log(1/4p) 故故 259p2 + 136p - 8=0从中解得从中解得p=0.05339如果假设如果假设p1=p2,则,则 或或23.11%。
相斥组连锁计算相斥组连锁计算p的标准误的公式为:的标准误的公式为:在在上上例例中中,,Sp = 0.0582或或5.82%,,于于是是重重组组率率及及其其标标准准误误可可表表示示为为::p = (23.1±5.82)%.3.乘积法.乘积法 这里先要根据F2 4类表现型的个体数,求取相应乘积的比值在相斥相,根据ad/bc的比值,在相引相,根据bc/ad的比值,就可以计算出P值例如,在相斥相:乘积值:查Fisher表可得P值.相引相的比率公式:相引相的比率公式: P值的标准差公式与极大似然法的公式相同即:.S.E.P也不需要计算,备表中已经列出折算数值,只须以 除之,即可求得现在仍以 的自交后代结果为例,计算P值:查表4-3,P=0.20+,再查相应的标准差折算数为0.6422,以 除之得:即d与pr之间的交换值为202.1交换单位,此数与极大似然法算得的结果完全一致。
