1、第一章 绪 论,王伟业,学习的目标和方法,正确理解基本概念 掌握经典的统计学方法 通过实践练习巩固理论知识,会查书是好学生! 会点菜、会吃菜、不需炒菜!,目的与要求,熟练掌握:统计学中的几个基本概念;变量的分类。 掌握:统计工作的基本步骤。 熟悉:统计学的意义。,一、统计学(statistics)的意义,Webster国际大辞典(第三版) “a science dealing with the collection , analysis , interpretation and presentation of numerical data” .,Last JM 流行病学辞典 “the science and art of dealing with variation in data through collection , classification and analysis in such a way as to obtain reliable results” .,二、统计学中的几个基本概念,(一)同质和变异 (homogeneity and variation),1.同质:共性
2、,大同小异。观察单位间 被研究指标的影响因素相同。 观察单位(个体):统计研究中最基本的单位。 影响因素:主要的、可控制的因素。 举例:研究2012年九江市7岁健康男孩的身高情况,(一)同质和变异 (homogeneity and variation),1.同质:共性,大同小异。观察单位间 被研究指标的影响因素相同。 2.变异:同质基础上的个体差异。,(二)总体与样本 (population and sample),1.总体:根据研究目的确定的同质观察单位 的全体(集合)。 分类: 有限总体:特定时间和空间,有限个观察单位 无限总体:无时间和空间限制,观察单位无限 2.样本:从总体中随机抽取的一部分有代表 性的个体。,例:研究2012年九江市7岁健康男孩的身高情况,总体 - 所有的九江市7岁健康男孩 样本 - 随机抽出500名九江市7岁健康男孩 样本含量(n)=500,(三)随机(random),1.随机:机会均等,总体中每一个个体被抽中的概率 相同。保证样本代表性。 2.包括: 抽样随机 分组随机 实验顺序随机 3.随机化方法: 抽签法、掷骰子法、随机数字表法,随机随便,(四)变量与
3、变量值 (variable and value of variable ),1.变量:观察单位的某种特征或属性。 2.变量值:变量的测定值,也称资料(data)。,3.变量类型(资料类型),(1)定量变量:变量值是定量的,有度量单位 定量资料(计量资料) 连续型变量:可以取任何数值 离散型变量:只能取整数,(2)定性变量(分类变量):变量值是定 性的,表现为互不相容的类别或属性。 定性资料 二项分类 无序分类变量 计数资料 多项分类 有序分类变量 等级资料,总结:统计资料类型,定量资料(计量资料) 计数资料 定性资料 等级资料,4.变量的转化顺序,高级 低级 连续型定量变量 有序分类 多项分类 二项分类,例:一组2040岁成年人的血压,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,定量数据,等级数据,定性数据,以12kPa为界分为正常(0)与异常(1)两组,统计每组例数,观察单位observations 个体individuals,变量variables,Quantitative data 定量资料,Qualitative data 定性资料,(五)参
4、数与统计量 (parameter and statistic),1. 参数:描述总体特征的统计指标,是一个固定常数, 用希腊字母表示。,推断(inference),2. 统计量:描述样本的统计指标,是一个在参数附近 波动的随机变量,用拉丁字母表示。,(六)误差(Error),1系统误差( systematic error ) 由于仪器设备、标准试剂、判定标准等不准确,使测定结果呈倾向性偏大或偏小。 特点: 人为原因,可以避免 结果有倾向性 2随机测量误差(random error of measurement) 由于偶然因素造成使同一受试对象多次测定结果不完全一致。 特点: 不可避免 ,但应控制在允许范围内 结果无倾向性,3抽样误差(sampling error) 由于随机抽样引起的样本统计量与总体参数之间的差异,以及各样本统计量之间的差异。 特点: 不可避免 有规律,可以估计大小,(七)频率与概率 (frequency and probability),1.频率(f):n次试验中,随机事件A出现 m次,则随机事件A出现的频率f=m/n。 2.概率(P):当n逐渐增大时,随机事 件A出
5、现的频率f随着重复次数的增加, 越来越接近一个常数。描述随机事件 发生可能性大小。 当n足够大时,可以用f估计P, P(A)=m/n,Certain,Impossible,0.5,0,1,必然事件 P = 1 随机事件 0 P 1 不可能事件 P = 0,P 0.05或 P 0.01称为小概率事件。 统计学意义:发生的可能性很小,认为在一次抽样中不大可能发生。,(八)小概率事件,三、医学统计工作的基本步骤,设 计,资料搜集,整理,分析,专业设计 统计设计,资料来源 质量控制,审核 合理分组,统计描述 统计推断,(一)设计 (design),统计设计包括资料搜集、整理和分析资料的计划: 1. 明确调查目的、确定研究指标 2. 确定研究对象 3. 选择调查方法 4. 决定调查方式 5. 设计调查项目和调查表 6. 估计样本含量,(二)搜集资料(data collection),搜集资料要遵循准确、完整、及时三个原则 搜集资料的方式有直接观察、采访、填表和通信四种 资料来源: 统计报告表 经常性工作记录 专题调查或实验,(三)整理资料 (sorting of data),目的:将原始资料系统化、条理化 整理前:检查核对 分组方式: 1.质量分组 按属性和类别分组 (性别、职业、病种) 2.数量分组 按数值大小分组 (如年龄分组常用0,1, 5,10,20,80),(四)分析资料(data analysis),统计描述:用统计指标、统计图表对资料的数量特征、分布规律进行描述。 统计推断:如何抽样,如何由样本信息推断总体特征,包括参数估计和假设检验。,
《医学统计学绪论课件》由会员F****n分享,可在线阅读,更多相关《医学统计学绪论课件》请在金锄头文库上搜索。