医学统计学课件-直线回归
36页1、直线相关与回归,钟崇洲 ,英国人类学家 F.Galton首次在自然遗传一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。其后,他和英国统计学家 Karl Pearson对上千个家庭的身高、臂长、(伸开大拇指与中指两端的最大长度)做了测量,发现:,历史背景:,儿子身高(Y,英寸)与父亲身高(X)存在线性关系:,回归与相关 regression and correlation,变量间关系问题:年龄身高、肺活量体重、药物剂量与动物死亡率等。,第一节 直线回归 第二节 直线相关 第三节 Spearman等级相关,两个关系: 依存关系:应变量(dependent variable)Y随自变量(independent variable)X变化而变化。 回归分析 互依关系: 应变量Y与自变量 X间的彼此关系 相关分析,实 例,散点图,第一节 直线回归,回归关系:例如血压和年龄的关系,称为直线回归(linear regression)。,目的: 建立直线回归方程( linear regression equation),一、 直线回归方程,一般表达式:,a:截距(intercep
2、t),直线与Y轴交点的纵坐标。,b:斜率(slope),回归系数(regression coefficient)。 意义:X每改变一个单位,Y平均改变b个单位。 b0,Y随X的增大而增大(减少而减少) 斜上; b0,Y随X的增大而减小(减少而增加) 斜下; b=0,Y与X无直线关系 水平。 b越大,表示Y随X变化越快,直线越陡峭。,二、回归方程参数的计算,最小二乘法原则(least square method):使各散点到直线的纵向距离的平方和最小。即使 最小。,散点图,回归参数计算的实例,三、回归系数的假设检验,b0原因: 由于抽样误差引起,总体回归系数=0 存在回归关系,总体回归系数 0,公式 ,n2,Sb为回归系数的标准误,SY.X为Y的剩余标准差扣除X的影响后Y的变异程度。,(一) t 检验;,任一点P(X,Y)的纵坐标被回归直线与均数截成3段:,图 应变量Y的平方和划分示意图,SS总SS回归SS残差,(二) 方差分析,SS残差越小,SS回归越大,表明回归模型的预测效果越好。,四、直线回归方程的区间估计,五、回归方程的应用,1. 预测(forecast) (给定X值,估计Y)
3、2. 控制 (给定Y值范围,求X值范围),第二节 直线相关,回归 - 变量间的依存关系,相关 - 变量间的互依关系,直线相关(linear correlation):简单相关(simple correlation),用于双变量正态分布资料。,图74 相关系数示意图,散点呈椭圆形分布, X、Y 同时增减-正相关(positive correlation); X、Y 此增彼减-负相关(negative correlation) 。,散点在一条直线上, X、Y 变化趋势相同-完全正相关; 反向变化-完全负相关。,图75 相关系数示意图,X、Y 变化互不影响-零相关(zero correlation),一、 相关系数概念,相关系数(correlation coefficient),又称积差相关系数(coefficient of product moment correlation),或 Pearson 相关系数(软件中常用此名称) 说明相关的密切程度和方向的指标。 r 样本相关系数,r无单位,-1 r 1。r 值为正 正相关, 为负 负相关; (与回归系数b的符号相同) |r|=1 - 完全相
《医学统计学课件-直线回归》由会员tia****nde分享,可在线阅读,更多相关《医学统计学课件-直线回归》请在金锄头文库上搜索。
2024-04-11 25页
2024-04-11 37页
2024-04-11 28页
2024-04-11 31页
2024-04-11 36页
2024-04-11 29页
2024-04-11 22页
2024-04-11 27页
2024-04-11 34页
2024-04-11 32页