好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

全国大学生数学建模竞赛B题.ppt

23页
  • 卖家[上传人]:公****
  • 文档编号:587933579
  • 上传时间:2024-09-06
  • 文档格式:PPT
  • 文档大小:170.01KB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 艾滋病疗法的评价艾滋病疗法的评价及疗效的预测及疗效的预测全国大学生数学建模竞赛全国大学生数学建模竞赛2006年年B题题 艾滋病是当前人艾滋病是当前人类社会最社会最严重的瘟疫之一,从重的瘟疫之一,从1981年年发现以来的以来的20多年多年间,它已,它已经吞噬了近吞噬了近3000万人的生命万人的生命 艾滋病的医学全名艾滋病的医学全名为“获得性免疫缺得性免疫缺损综合症合症”,英文,英文简称称AIDS,它是由艾滋病毒(医学全名,它是由艾滋病毒(医学全名为“人体免疫缺人体免疫缺损病毒病毒”, 英英文文简称称HIV)引起的这种病毒破坏人的免疫系种病毒破坏人的免疫系统,使人体,使人体丧失抵抗各种疾病的能力,从而失抵抗各种疾病的能力,从而严重危害人的生命人重危害人的生命人类免疫系免疫系统的的CD4细胞在抵御胞在抵御HIV的入侵中起着重要作用,当的入侵中起着重要作用,当CD4被被HIV感染而裂解感染而裂解时,其数量会急,其数量会急剧减少,减少,HIV将迅速增加,将迅速增加,导致致AIDS发作 艾滋病治艾滋病治疗的目的,是尽量减少人体内的目的,是尽量减少人体内HIV的数量,同的数量,同时产生更多的生更多的CD4,至少要有效地降低,至少要有效地降低CD4减少的速度,以提减少的速度,以提高人体免疫能力。

      高人体免疫能力 迄今为止人类还没有找到能根治迄今为止人类还没有找到能根治AIDS的疗法,目前的一的疗法,目前的一些些AIDS疗法不仅对人体有副作用,而且成本也很高许多国家疗法不仅对人体有副作用,而且成本也很高许多国家和医疗组织都在积极试验、寻找更好的和医疗组织都在积极试验、寻找更好的AIDS疗法 现在得到了美国艾滋病医疗试验机构现在得到了美国艾滋病医疗试验机构ACTG公布的两组数公布的两组数据 ACTG320(见附件(见附件1)是同时服用)是同时服用zid., lam., ind. 3种药种药物的物的300多名病人每隔几周测试的多名病人每隔几周测试的CD4和和HIV的浓度的浓度(每毫升血(每毫升血液里的数量)液里的数量)193A(见附件(见附件2)是将)是将1300多名病人随机地分多名病人随机地分为为4组,每组按下述组,每组按下述4种疗法中的一种服药,大约每隔种疗法中的一种服药,大约每隔8周测试周测试的的CD4浓度浓度(这组数据缺(这组数据缺HIV浓度,它的测试成本很高)浓度,它的测试成本很高)4种种疗法的日用药分别为:疗法的日用药分别为:600mg zid.或或400mg did.,这两种药按,这两种药按月轮换使用;月轮换使用;600 mg zid.加加2.25 mg zal.;;600 mg zid.加加400 mg did.;;600 mg zid.加加400 mg did.,再加,再加400 mg nev.。

      请你完成以下问题:请你完成以下问题: ((1)利用附件)利用附件1的数据,的数据,预测继续治疗的效果,或者确定预测继续治疗的效果,或者确定最佳治疗终止时间最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)认为继续服药效果不好,则可选择提前终止治疗) ((2)利用附件)利用附件2的数据,的数据,评价评价4种疗法的优劣种疗法的优劣(仅以(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间佳治疗终止时间 (3) 艾滋病药品的主要供给商对不发达国家提供的药品价艾滋病药品的主要供给商对不发达国家提供的药品价格如下:格如下:600mg zid. 1.60美元,美元,400mg did. 0.85美元,美元,2.25 mg zal. 1.85美元,美元,400 mg nev. 1.20美元如果病人需要考虑美元如果病人需要考虑4种疗法的费用,对(种疗法的费用,对(2)中的评价和预测(或者提前终止)有)中的评价和预测(或者提前终止)有什么改变。

      什么改变 附件附件1 ACTG320数据数据同时服用同时服用3种药物的种药物的300多名病人每隔几周测试的多名病人每隔几周测试的CD4和和HIV的浓度第第1列是病人编号,第列是病人编号,第2列是测试列是测试CD4的时刻(周),第的时刻(周),第3列是测得列是测得的的CD4(乘以(乘以0.2个个/ml),第),第4列是测试列是测试HIV的时刻(周),第的时刻(周),第5列列是测得的是测得的HIV(单位不详)单位不详)PtIDCD4Date CD4Count RNADate VLoad23424 01780 5.523424 42284 3.923424 81268 4.723424 25171 25 423424 40 99 40 523425 0 140 5.323425 4 624 2.423425 91109 3.723425 23122 23 2.623425 40320 附件附件2 193A数据数据1300多名病人按照多名病人按照4种疗法服药大约每隔种疗法服药大约每隔8周测试的周测试的CD4浓度。

      浓度第第1列是病人编号,第列是病人编号,第2列是列是4种疗法的代码:种疗法的代码:第第3列是病人年龄,第列是病人年龄,第4列是测试列是测试CD4的时刻(周),第的时刻(周),第5列是测列是测得的得的CD4,取值,取值log(CD4+1).ID 疗法疗法 年龄年龄 时间时间 Log(CD4 count+1) 1236.427103.1355 1236.42717.57143.0445 1236.427115.57142.7726 1236.427123.57142.8332 1236.427132.57143.2189 1236.427140 3.0445 2447.84670 3.0681 2447.84678 3.8918 2447.846716 3.9703 2447.846723 3.6109 2447.846730.71433.3322 2447.846739 3.0910 CD4大致有先增后减的趋势,大致有先增后减的趋势,HIV有先减后增有先减后增的趋势,启示应建立时间的二次函数模型的趋势,启示应建立时间的二次函数模型问题(问题(1)) 利用附件利用附件1的数据,预测继续治疗的效果的数据,预测继续治疗的效果, 或者确定最佳治疗终止时间。

      或者确定最佳治疗终止时间分析数据分析数据如随机取如随机取20个病人,画出他们个病人,画出他们CD4和和HIV浓度随时间变化的图形(折线),浓度随时间变化的图形(折线),若先用一次模型,应与二次模型做统计分析比较若先用一次模型,应与二次模型做统计分析比较CD4HIV 1)) 总体回体回归模型模型 用全部数据用全部数据拟合一个模型,如合一个模型,如 yij=b0+b1tij+b2tij2,,tij,,yij分分别为第第i病人第病人第j次次测量的量的时间和和CD4(或(或HIV),估),估计b0, b1, b2建立模型建立模型有以下形式的回有以下形式的回归模型(一次模型(一次与二次模型比与二次模型比较,二次,二次较优):):对对HIV,,b2>0, b1<0, t=-b1/2b2 达到最小达到最小对对CD4,,b2<0, b1>0, t=-b1/2b2 达到最大达到最大平均地应在平均地应在25~30(周)结束治疗周)结束治疗 可对可对CD4统计统计b2i<0, b1i>0(存在正最大点)及(存在正最大点)及b2i>0(不存在最大点)的频率,分别作为及时结(不存在最大点)的频率,分别作为及时结束治疗与继续治疗的概率;也可用它们的均值和束治疗与继续治疗的概率;也可用它们的均值和均方差在确定分布下计算这些概率。

      均方差在确定分布下计算这些概率 2) 个人回归模型个人回归模型用每个病人的数据拟合一个模型,如用每个病人的数据拟合一个模型,如yij=b0i+b1itij+b2itij2,,计算计算b0i ,b1i ,b2i的均值和均方差,用均值可得的均值和均方差,用均值可得CD4的最大的最大点和点和HIV的最小点的最小点 将模型将模型 yij=b0i+b1itij+b2itij2 的系数分解的系数分解:bki=bk+ ik((k=0,1,2),设),设 ik服从零均值服从零均值正态分布,利用极大似然估计可以得到正态分布,利用极大似然估计可以得到bk的估计值及的估计值及 ik的方差3) 纵向数据回归模型纵向数据回归模型bk的估计值用于计算的估计值用于计算CD4的最大点和的最大点和HIV的最小的最小点,它与点,它与 ik的方差一起可以在正态分布假定下的方差一起可以在正态分布假定下计算及时结束治疗与继续治疗的概率计算及时结束治疗与继续治疗的概率 如果考虑病人初始状态(如果考虑病人初始状态(t=0时的时的CD4和和HIV)的不同对模型的影响,可以将模型)的不同对模型的影响,可以将模型中的中的yij定义为第定义为第i病人第病人第j次测量的次测量的CD4(或(或HIV)与初始值之差或之比。

      与初始值之差或之比或者先按照病人初始状态分类(如轻度、中或者先按照病人初始状态分类(如轻度、中度、重度),然后对于每一类建立回归模型度、重度),然后对于每一类建立回归模型建立模型建立模型 问题(问题(2)) 利用附件利用附件2的数据,评价的数据,评价4种疗法的种疗法的优劣,并对较优的疗法预测继续治疗的效果,优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间或者确定最佳治疗终止时间对于每种于每种疗法随机取法随机取20个病人,画出他个病人,画出他们CD4随随时间变化的化的图形(折形(折线),可以看出),可以看出疗法法1~3的的CD4基基本上水平,略有下降,而本上水平,略有下降,而疗法法4有先增后减的有先增后减的趋势启示启示应建立建立时间的一次与二次函数模型,的一次与二次函数模型,经统计分分析比析比较,确定哪种,确定哪种较优 分析数据分析数据 可以引入可以引入4(或(或3)个)个0-1变量表示变量表示4种疗法建立种疗法建立统一模型,或者对每种疗法各建立一个模型统一模型,或者对每种疗法各建立一个模型(一般来说前者较优)一般来说前者较优)1)回归模型)回归模型以总体回归模型为例,只需增加年龄变量,分别以总体回归模型为例,只需增加年龄变量,分别用一次与二次时间函数模型进行比较,可知疗法用一次与二次时间函数模型进行比较,可知疗法1~3用一次模型较优,且一次项系数为负,即用一次模型较优,且一次项系数为负,即CD4在减少,从数值看疗法在减少,从数值看疗法3优于疗法优于疗法2和和1;疗;疗法法4用二次模型较优,即用二次模型较优,即CD4先增后减,先增后减,建立模型建立模型 做疗法有无显著性差异的两两比较:做疗法有无显著性差异的两两比较: 用用1个个0-1变量构造两种疗法的统一模型,可变量构造两种疗法的统一模型,可以用以用t检验作回归系数是否为零的假设检验。

      检验作回归系数是否为零的假设检验结果是疗法结果是疗法1与与2无显著性差异,而疗法无显著性差异,而疗法1与与3,,2与与3,,3与与4均有显著性差异均有显著性差异2)假设检验)假设检验疗法是必选的因素,如果还考虑年龄和初始疗法是必选的因素,如果还考虑年龄和初始状态,用双因素分析则比较复杂,可以先按状态,用双因素分析则比较复杂,可以先按这些因素分类,再做疗法的单因素分析这些因素分类,再做疗法的单因素分析 3)方差分析)方差分析 论文中出现问题的评析论文中出现问题的评析 1.只做数据拟合,不做统计检验.只做数据拟合,不做统计检验用回归分析方法做统计检验:用回归分析方法做统计检验: 得到的模型有无显著意义,它的置信度多大,用得到的模型有无显著意义,它的置信度多大,用它作预测时准确程度如何它作预测时准确程度如何最小二乘最小二乘拟合:拟合:已知一组数据已知一组数据(xk,yk), k=1,2,…,n 和一个形式已定、和一个形式已定、参数参数 待定的模型(曲线)待定的模型(曲线)y=f(x,  ), 确定确定参数参数 使使数据与模型在误差平方和最小的意义下拟合得最好数据与模型在误差平方和最小的意义下拟合得最好。

      有现成的计算公式和软件有现成的计算公式和软件确定参数确定参数  x0123456789y1.041.221.381.591.801.992.212.392.652.83z0.280.612.192.562.491.173.171.292.113.27y=a1x+b1=0.2013x+1.0040z=a2x+b2=0.2025x+1.0025两个模型的结果一样,但是可靠性和准确性一样吗?两个模型的结果一样,但是可靠性和准确性一样吗?需要做需要做统计检验统计检验!!简 例简 例最小二乘最小二乘拟合拟合yxzx 决定系决定系数数R2F值p值剩余方剩余方差差 2a的置信区的置信区间b的置信区的置信区间y=a1x+b10.99855294<0.00010.0006[0.1950, 0.2077][0.9699, 1.0381]z=a2x+b20.35284.3610.07020.7761[-0.0211, 0.4262][-0.1915, 2.1966]• R2=0.3528~在在z的变化中只有的变化中只有35%是由是由x决定的决定的 • p值大于值大于0.05~在常用的置信度在常用的置信度 =5%下该模型没有显著意义下该模型没有显著意义 • a2的置信区间包含零点的置信区间包含零点~a=0落在置信水平为落在置信水平为95%的区间内的区间内 若若x=5.5预测区间预测区间 y::[2.0621,,2.1606] ,,z::[0.3899,,3.8432],,预测值预测值 y=2.1113, z=2.1165回归分析结果回归分析结果z的预测没有什么价值!的预测没有什么价值! 2.对原始数据先取平均,再用平均值做拟合.对原始数据先取平均,再用平均值做拟合 数据中大多数病人的测试时间是数据中大多数病人的测试时间是0,4,8,…(周),(周),个别病人是个别病人是5,7, …(周),为了得到(周),为了得到CD4(或或HIV)的变化趋势,先在每个时间点上对的变化趋势,先在每个时间点上对CD4取平均,取平均,再用平均值做拟合.再用平均值做拟合.这样做有什么问题呢?这样做有什么问题呢? 注意:有的时间点上有上百个病人的注意:有的时间点上有上百个病人的CD4,,而有的时间点上只有几个病人的而有的时间点上只有几个病人的CD4。

      数据数据(x,y)::x=0, y=0:0.05:2;   x=1,y=1:0.05:3; x=2,y=0,2, 在图上共在图上共84个点 简 例简 例对数据对数据(x,y)拟合一条直线,拟合一条直线,得得y=0.7647x+1.0784 先在先在x=0,1,2对对y取平均得到取平均得到3个个点点, 再拟合直线,得再拟合直线,得y=1.3333 取平均后的取平均后的3个点在做拟合时的个点在做拟合时的权重相同权重相同; 但是但是x=0,1的点都是的点都是41个数据的平均值个数据的平均值, 而而x=3的点的点只是只是2个数据的平均值个数据的平均值 3.拟合过度.拟合过度用用4次、次、5次甚至更高次数的多项式作拟合次甚至更高次数的多项式作拟合 • 数据的起伏是由与时间本身无关的其它随机因数据的起伏是由与时间本身无关的其它随机因素引起的,不应该用增加时间的高次项来拟合素引起的,不应该用增加时间的高次项来拟合 • 注意拟合与插值在应用场合的差别注意拟合与插值在应用场合的差别 一般地说,多项式拟合不要超过一般地说,多项式拟合不要超过3次,对于次,对于本题如果用统计检验做显著性分析,可以本题如果用统计检验做显著性分析,可以发现多数情况是以时间的发现多数情况是以时间的2次多项式为好次多项式为好 • 适用本题的显然是拟合而非插值适用本题的显然是拟合而非插值 4.只按照图形做直观的定性判断,不做定量分析.只按照图形做直观的定性判断,不做定量分析 为了比较为了比较4种疗法的优劣,对每种疗法的种疗法的优劣,对每种疗法的CD4(或取平均)做散点图(或取平均)做散点图, 或折线(散点连线)或折线(散点连线)图图, 直观地比较疗法的优劣直观地比较疗法的优劣 • 没有普遍的指导意义,对于其它问题或数没有普遍的指导意义,对于其它问题或数据,这样做不一定能得到结果据,这样做不一定能得到结果 • 一种疗法的一种疗法的CD4散点图散点图(或折线图或折线图)在另一种在另一种疗法的上面疗法的上面, 从统计意义上并不能表明其显著性从统计意义上并不能表明其显著性 作为数学建模题目应该给出作为数学建模题目应该给出定量的处理方法定量的处理方法! 5.双指标处理不当.双指标处理不当 对于对于CD4和和HIV两个指标的处理,常用的方法是用两个指标的处理,常用的方法是用某种函数形式将二者结合在一起某种函数形式将二者结合在一起. 由于由于CD4越大越好,越大越好,HIV越小越好,一些同学取二越小越好,一些同学取二者之差或二者之商为综合指标者之差或二者之商为综合指标 .这样简单处理的问题在于,这两个指标量纲不同这样简单处理的问题在于,这两个指标量纲不同,数量级差别较大数量级差别较大. 恰当的办法是,先分别将其归一化(如将数值恰当的办法是,先分别将其归一化(如将数值变换到变换到0-1之间),然后取加权平均之间),然后取加权平均 . 微分方程微分方程层次分析层次分析6. 对其它建模方法的评价对其它建模方法的评价灰色系统预测灰色系统预测模糊评价模糊评价时间序列时间序列神经网络神经网络 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.