
卡方、相关、回归、调设复习.ppt
58页后后 四四 章章 的的 小小 结结第九章 第九章 X2检验检验 χχ2 2检验检验(Chi-square test)(Chi-square test)是以是以χ2 分布为分布为理论依据的、计数资料统计推断的一种重要理论依据的、计数资料统计推断的一种重要方法一:一:χχ2 2检验的定义检验的定义用途非常广泛,主要用于:用途非常广泛,主要用于: 1 1、频数分布拟合优度检验、频数分布拟合优度检验 2 2、两个率的比较、两个率的比较 3、两个技术的差异性检验 3、两个技术的差异性检验 4、多个率或多组分布间比较 4、多个率或多组分布间比较 5、两变量的相关性研究 5、两变量的相关性研究二:二:χ2检验的用途检验的用途........三三: : 频数分布的拟合优度频数分布的拟合优度χχ2 2检验检验 根据样本的频率分布,检验其总体分布是否根据样本的频率分布,检验其总体分布是否 服从某给定的理论分布服从某给定的理论分布.1、目的:、目的:其中:其中:四:四: 两个率比较的两个率比较的X X2 2检验检验(四格表资料四格表资料) 城乡医院空气消毒合格率的比较城乡医院空气消毒合格率的比较组别组别市级医院市级医院城乡医院城乡医院合计合计合格数合格数 52()()22(33.24)74不合格数不合格数13(22.24)31(19.76)44合计合计6553118表表7.9 两种培养基的培养结果两种培养基的培养结果有血培养基有血培养基++--合计合计无血培养基无血培养基++ --合计合计38(a)41(b)11(c) 79(d)49 1207990169五:配对四格表资料的五:配对四格表资料的X2检验检验六六: R×C表资料的表资料的 X2 检验检验可用基本公式,也可用以下行可用基本公式,也可用以下行×列表专用公式:列表专用公式:(行-(行-1))×(列-(列-1))表表9-3 三种治疗手指挛缩畸形手术方法的疗效比较三种治疗手指挛缩畸形手术方法的疗效比较手术方法手术方法 AB C 合计合计 优良优良181423不明显不明显139224合计合计14171647优良率(优良率(%))药物甲药乙药治愈 有效 无效 死亡23 26 12 2 24 25 14 3用两种药治疗某病的疗效比较用两种药治疗某病的疗效比较如下的资料若想做疗效的比较如下的资料若想做疗效的比较,应选什么方法应选什么方法?若做卡方检验若做卡方检验,可以得到什么结果可以得到什么结果?秩和检验秩和检验两种药物疗效构成比的比较两种药物疗效构成比的比较!七七: R×C表资料关联性的表资料关联性的 X2 检验检验分类变量的关联性分析(书上分类变量的关联性分析(书上202页)02页)R×C表资料必须是双向无序变量表资料必须是双向无序变量PearsonPearson列联系数列联系数表表7.10 婴儿腹泻与喂养方式的关系婴儿腹泻与喂养方式的关系喂养方式喂养方式人工人工母乳母乳合计合计腹泻腹泻有有 无无合计合计301017 2547 35404282第十一章 相关分析第十一章 相关分析一:变量间的关系一:变量间的关系1、确定性关系:函数关系1、确定性关系:函数关系2、非确定性关系:2、非确定性关系: 变量间的关系表现为随机性的变量间的关系表现为随机性的一种趋势,如:一种趋势,如:“年龄年龄”与与“血压血压”“体重体重”与与“肺活量肺活量”相关与相关与回归来分析回归来分析二、线性相关分析的过程二、线性相关分析的过程 1 1、画散点图、画散点图2 2、P、Pearsonearson积差相关系数积差相关系数(11)、总体相关系数 的可信区间:、总体相关系数 的可信区间: 首先利用 计算 。
首先利用 计算 其次利用 计算 的可信区间 其次利用 计算 的可信区间 最后利用 将 的可信区间转换为 的可信区间 最后利用 将 的可信区间转换为 的可信区间3 3、积差相关系数的统计推断、积差相关系数的统计推断 相关系数的假设检验可用相关系数的假设检验可用t t 检验检验,也可直接查,也可直接查““相关系数界相关系数界 值表值表””2)、总体相关系数是否 的假设检验:)、总体相关系数是否 的假设检验: ((2 2)). . 进行相关分析要有实际意义进行相关分析要有实际意义1 1)). . 相关关系不一定是因果关系相关关系不一定是因果关系3 3)). . 对于性质不明确的两组数据,可先做散点图,然对于性质不明确的两组数据,可先做散点图,然 后再进行相关分析 后再进行相关分析4 4)、两变量间无线性相关关系不一定无其它相关关系两变量间无线性相关关系不一定无其它相关关系5 5)、两变量必须都服从正态分布两变量必须都服从正态分布 4 4、、 应用直线相关时的注意事项应用直线相关时的注意事项 三三 SpearmanSpearman等级相关等级相关((秩相关)的过程秩相关)的过程1、适用资料:1、适用资料:⑴ ⑴ 不服从双变量正态分布不服从双变量正态分布 ⑵ ⑵ 总体分布类型未知总体分布类型未知 ⑶ ⑶ 原始数据用等级表示原始数据用等级表示 2、2、SpearmanSpearman等级相关等级相关((秩相关)系数秩相关)系数3 3、、SpearmanSpearman等级相关系数的假设检验等级相关系数的假设检验一:适用资料一:适用资料四: 分类变量的关联性分析分类变量的关联性分析二:方法二:方法双向无序双向无序R X C表表二:方法二:方法一:适用资料一:适用资料第十二章 回归分析第十二章 回归分析一:一:直线回归分析的直线回归分析的概念概念 直线回归又称为简单回归,是探讨两个连续性变量直线回归又称为简单回归,是探讨两个连续性变量X X与与Y Y之间依存关系的另一种统计分析方法。
之间依存关系的另一种统计分析方法 一般用最小二乘法找出一条直线,使各点到一般用最小二乘法找出一条直线,使各点到直线的纵向距离之平方和为最小统计上称这个直直线的纵向距离之平方和为最小统计上称这个直线方程为线方程为直线回归方程直线回归方程,这条直线为,这条直线为回归直线回归直线 二:直线回归方程二:直线回归方程 直线回归方程的一般表达式为直线回归方程的一般表达式为: :三:回归直线的描绘三:回归直线的描绘 根据求得的回归方程,可以在自变量根据求得的回归方程,可以在自变量X X的实测范围内任的实测范围内任取两个值,代入方程中,求得相应的两个取两个值,代入方程中,求得相应的两个Y Y值,以这两对数值,以这两对数据找出对应的两个坐标点,将两点连接为一条直线,就是据找出对应的两个坐标点,将两点连接为一条直线,就是该方程的回归直线该方程的回归直线n1.方差分析 F=MS回/MS残n检验 四:回归系数的假设检验四:回归系数的假设检验nH0:β=0 H1:β≠0n选择合适的假设检验方法,计算统计量n计算概率值Pn做出推论:统计学结论和专业结论采用采用t t 检验检验五:直线回归的应用条件五:直线回归的应用条件1、线性、线性(linear)2、独立、独立(independent)3、正态、正态(normal distribution)4、等方差、等方差(equle variance)Line1 1、、描述两变量之间的依存关系。
描述两变量之间的依存关系2 2、统计进行预测、统计进行预测 六、直线回归的应用六、直线回归的应用((1 1))Y Y的总体均数的点估计的总体均数的点估计((2 2))Y Y的总体均数的区间估计的总体均数的区间估计=2.15+0.061X =2.15+0.061X ((3 3)个体)个体Y Y值的预测区间值的预测区间3 3、利用回归方程进行统计控制、利用回归方程进行统计控制 统计控制是统计预测的反问题,即知道统计控制是统计预测的反问题,即知道Y Y的范围,需制定的范围,需制定X X的范围时用的范围时用七:七: 直线相关与回归分析的关系直线相关与回归分析的关系( (一一) ) 区别区别1.1.在应用上在应用上: : 仅要说明两变量间的相互关系时用仅要说明两变量间的相互关系时用相关分析相关分析;;要说明两变量间的依存变化的数量关系时用要说明两变量间的依存变化的数量关系时用回归分析回归分析2 2、对变量的要求上、对变量的要求上: : 回归分析要求回归分析要求因变量(因变量(Y Y)是正态分布的随机)是正态分布的随机变量,自变量(变量,自变量(X X)可以是精确测量或严格控制)可以是精确测量或严格控制的变量的变量,,也也可以是正态分布的随机变量可以是正态分布的随机变量; ; 相关分析要求相关分析要求两个变量都是正态分布的随机两个变量都是正态分布的随机变量。
变量( (二二) ) 联系联系1.1.对符合相关与回归条件的资料对符合相关与回归条件的资料,,其其相关系数与相关系数与回归系数的正负符号相同回归系数的正负符号相同2.2.相关系数与回归系数的假设检验是等价的相关系数与回归系数的假设检验是等价的3.3.3. 3. 相关与回归可以相互解释相关与回归可以相互解释第十五章 调查设计第十五章 调查设计一一: : 调查研究的定义、特点调查研究的定义、特点二二: : 调查研究的分类调查研究的分类三:调查设计三:调查设计四:调查表的制定四:调查表的制定五:五: 样本含量的计算样本含量的计算调查设计调查设计(一)、调查设计的目的:(一)、调查设计的目的: 与实验研究的目的相同:以尽可能少的人力、物力、财力与实验研究的目的相同:以尽可能少的人力、物力、财力 等获得叫科学的结果等获得叫科学的结果(二)、调查设计的要点:(二)、调查设计的要点:目的目的项目项目指标指标(三)、调查计划:(三)、调查计划:1 1、确定调查目的和指标。
确定调查目的和指标2 2、确定调查对象和观察单位、确定调查对象和观察单位3 3、确定调查方法和资料搜集方式、确定调查方法和资料搜集方式4 4、拟订调查项目和调查表、拟订调查项目和调查表调调 查查 表表 的的 制制 定定一:调查表的构成一:调查表的构成1、调查表标题、调查表标题2、调查表说明、调查表说明3、被访者基本情况、被访者基本情况4、调查主要内容、调查主要内容6、作业证明的记载、作业证明的记载5、编码、编码二:二: 调查表制定的步骤调查表制定的步骤1 1、设立研究、设立研究工作组工作组2 2、提出调查项目,形成项目池、提出调查项目,形成项目池3 3、项目筛选、项目筛选4 4、确定每个项目的提问形式和类型、确定每个项目的提问形式和类型5 5、确定每个项目的回答选项、确定每个项目的回答选项6 6、预调查、初步考评及修改完善、预调查、初步考评及修改完善三、调查表制定中应注意的问题三、调查表制定中应注意的问题1 1、调查表说明要简单明了、调查表说明要简单明了2 2、避免用不确切的词、避免用不确切的词副词和形容词副词和形容词3 3、避免提断定性问题、避免提断定性问题4 4、避免引导性提问、避免引导性提问5 5、避免敏感问题、避免敏感问题6 6、避免提笼统、抽象、不准确的问题、避免提笼统、抽象、不准确的问题7 7、避免避免一问多答的问题、避免避免一问多答的问题8 8、注意提问的顺序、注意提问的顺序样本含量的计算样本含量的计算 样本含量的估计方法有样本含量的估计方法有经验法经验法、、查表法查表法和和公式法公式法。
单纯随机抽样时样本含量的计算公式单纯随机抽样时样本含量的计算公式一、估计总体均数时(置信度一、估计总体均数时(置信度95%):):二、估计总体率时(置信度二、估计总体率时(置信度95%):):1、、P在时:在时:2、、P小于或大于时:小于或大于时:。












