右截尾数据线性回归EM算法

资源ID：90647914 资源大小：138.54KB 全文页数：6页
资源格式： DOC 下载积分：20金贝

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要20金贝

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

1、金锄头文库是“C2C”交易模式，即卖家上传的文档直接由买家下载，本站只是中间服务平台，本站所有文档下载所得的收益全部归上传人（卖家）所有，作为网络服务商，若您的权利被侵害请及时联系右侧客服；
2、如你看到网页展示的文档有jinchutou.com水印，是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有jinchutou.com水印标识，下载后原文更清晰；
3、所有的PPT和DOC文档都被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；下载前须认真查看，确认无误后再购买；
4、文档大部份都是可以预览的，金锄头文库作为内容存储提供商，无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证，请慎重购买；
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据；
6、如果您还有什么不清楚的或需要我们协助，可以点击右侧栏的客服。

下载须知 | 常见问题汇总

1、会员注册 2、如何支付与充值 3、个人资料信息修改 4、我的收藏和“收藏文件夹” 5、我的读者群和加入读者群 6、我的书签 7、金锄头文库批量上传工具（绿色版）V1.0 8、下载文档（资源）相关问题整理 9、解决下载文档时，自动弹出迅雷的问题 10、下载时为什么支付不成功？

右截尾数据线性回归EM算法

例17.1的相关SAS计算程序。EM算法计算得出：data a;sita=0.5; /* 为要估计的参考sita赋初值0.5 */x3=18; /* 已知条件 */x4=20;x5=34;do time=1 to 10;p=sita/(2+sita); /* p按上面公式计算 */ex2=125*p; /* x2的条件期望。x2的条件分布为二项分布，n=125, p由上面计算 */sita1=(ex2+x5)/(ex2+x3+x4+x5); /* M-步得到的迭代公式 */if abs(sita1-sita)<=0.00001 then stop; output;sita=sita1;end;run;得到的迭代结果：obs sita11 0.608252 0.624323 0.626494 0.626785 0.62682将sita=0.62682代入得到y1-y5的估计值：data a;sita=0.62682;y1=(1/2+sita/4)*197;y2=1/4*(1-sita)*197;y3=1/4*(1-sita)*197;y4=sita/4*197;format _numeric_ 5.;put y1= y2= y3= y4= ;run;y1=129 y2=18 y3=18 y4=31。估计结果和实际值很按近。不用EM算法，直接估计时会分别得到4个sita的估计值：data;sita=4 *(125/197-1/2) ;put sita=;sita =1-4*18/197 ;put sita =;sita =1-4*20/197 ;put sita =;sita =4*34/197 ;put sita =;run;得到sita估计值：sita=0.538071066sita=0.6345177665sita=0.5939086294sita=0.6903553299计算用EM算法和直接估计得到的结果：data a;do sita=0.6268, 0.538071066, 0.6345177665, 0.5939086294, 0.6903553299;y1=(1/2+sita/4)*197;y2=1/4*(1-sita)*197;y3=1/4*(1-sita)*197;y4=sita/4*197;format _numeric_ 5.;put y1= y2= y3= y4=;output;end;run;结果显示：y1=129 y2=18 y3=18 y4=31, EM算法的结果。y1=125 y2=23 y3=23 y4=27y1=130 y2=18 y3=18 y4=31y1=128 y2=20 y3=20 y4=29y1=132 y2=15 y3=15 y4=3417.2.2右截尾数据简单线性回归计算程序创建SAS数据集：data a1;input v1 t1;cards;170 1764170 2772170 3444170 3542170 3780170 4860170 5196190 408190 408190 1344190 1344190 1440220 408220 408220 504220 504220 504150 8064150 8064150 8064150 8064150 8064150 8064150 8064150 8064150 8064150 8064170 5448170 5448170 5448190 1680190 1680190 1680190 1680190 1680220 528220 528220 528220 528220 528;run;按要求作数据变换，注意这里的条件n>17可以用其它的标识：data a;set a1;v=1000/(v1+273.2);t=log10(t1);n=_n_; /*用于和后有参数估计的数据集合并*/vsq=v*2; /*用于求参数beta0, beta1和sigma估计 */by_v=1; /*为了以后和sw合并*/if n>17 then c=t; drop v1 t1;/*直接回归求得参数的初值，并将这些初值赋予宏变量beta01,beta11,sigma1*/proc reg data=a outest=est noprint;model t=v;data est; set est; call symput('beta01', intercept); /*创建一个值来自DATA步的宏变量beta01*/call symput('beta11', v); /*创建一个值来自DATA步的宏变量beta11*/call symput('sigma1', _rmse_);data w;set a ;beta01=&beta01;beta11=&beta11;sigma1=&sigma1;/*宏A求出迭代公式中的各项和，并得到迭代公式值，为下一步迭代提供值*/%macro A;data w;set w;if n>17 then do c=t;ez=beta01+beta11*v+sigma1*(2*3.1415926)*(-0.5)*exp(-0.5*(c-beta01-beta11*v)/sigma1)*2)/(1-probnorm(c-beta01-beta11*v)/sigma1);/*=*/ezv=v*ez; t1=0; vt=0;hq=(2*3.1415926)*(-0.5)*exp(-0.5*(c-beta01-beta11*v)/sigma1)*2)/(1-probnorm(c-beta01-beta11*v)/sigma1)*(c-beta01-beta11*v)/sigma1);/*hq=*/tmu=0;end;else do t1=t; vt=v*t; ezv=0; ez=0; hq=0;tmu=(t-beta01-beta11*v)*2;end;proc means data=w noprint;var v ez ezv vt t1 hq vsq tmu sigma1;output out=sw sum=sumv sumez sumezv sumvt sumt1 sumhq sumvsq sumtmu sumsigma1 ;data sw;set sw;sigma1= sumsigma1/_freq_;beta0=(sumvsq)*(sumt1+sumez)-(sumv)*(sumvt+sumezv)/(40*(sumvsq)-(sumv)*2);beta1=-(sumv)*(sumt1+sumez)-40*(sumvt+sumezv)/( (40*(sumvsq)-(sumv)*2);sigma=(sumtmu/40+sigma1*2*(23+sumhq)/40)*0.5;by_v=1;keep beta0 beta1 sigma by_v;%mend A;/*将每次迭代的结果放在一个数据集result中，先放入直接回归得到参数估计的初值*/data result(keep=beta0 beta1 sigma); beta0=&beta01; /*第一个观测为初值*/beta1=&beta11; sigma=&sigma1;options nodate nonotes nosource;/*宏B是迭代程序*/%macro b;%do i=1 %to 30;%A; /*调用宏A*/data w;merge a sw;by by_v;rename beta0=beta01 beta1=beta11 sigma=sigma1;data result; /*将每次迭代的结果放在一个数据集*/set result sw;%end;%mend b;%b;run;options nocenter;proc print data=result;迭代结果作图：data result;set result;n=_n_;proc gplot data=result;symbol1 v=star i=join c=blue;symbol2 v=star i=join c=black;symbol3 v=star i=join c=red;plot beta0*n=1 beta1*n=2 sigma*n=3;run;直接回归结果：data a;set a1;v=1000/(v1+273.2);t=log10(t1);proc reg data=a;model t=v/dw;run;直接回归的参数估计值： -4.93051 3.74704 两种估计方法得到的误差：data a;set a;r1=t-4.93051+3.74704*v;r2=t-6.019+4.311*v;run;

注意事项

本文（右截尾数据线性回归EM算法）为本站会员（jiups****uk12）主动上传，金锄头文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】，按提示上传提交保证函及证明材料，经审查核实后我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。