
概率论与数理统计7.1数理统计中的基本概念.pptx
27页概率论与数理统计7.1数理统计中的基本概念汇报人:AA2024-01-19数理统计概述总体与样本统计量与抽样分布参数估计假设检验方差分析与回归分析目录01数理统计概述数理统计是应用概率论的结果来研究怎样合理的收集、整理和分析带有随机影响的数据,以对所考察的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议数理统计是数学的一个分支数理统计学是统计学分支学科之一,它以概率论为基础运用统计学的方法对数据进行分析、研究导出其概念规律性(即统计规律),它主要研究随机现象中局部(字样)与整体(母体)之间数理统计是统计学的重要分支数理统计的定义数理统计以随机现象为研究对象数理统计以随机现象为研究对象,研究如何有效地收集、整理和分析受随机因素影响的数据,并对其进行处理,从而作出推断或预测,为决策和行动提供依据数理统计研究随机现象的规律性数理统计通过对随机现象的观测或试验取得数据,然后通过数据分析揭示出随机现象的内在规律性,即统计规律性这种规律性是建立在大量观测或试验基础上的,具有客观性和普遍性数理统计的研究对象VS描述性统计方法是对数据进行整理和描述的方法,包括数据的收集、整理、显示和描述性统计分析等步骤。
通过描述性统计方法,可以对数据的分布特征、集中趋势和离散程度等进行初步了解推断性统计方法推断性统计方法是在描述性统计的基础上,利用概率论的原理和方法对数据进行深入分析的方法推断性统计方法包括参数估计和假设检验两种基本方法参数估计是通过样本数据对总体参数进行估计的方法,而假设检验则是通过样本数据对总体分布或总体参数进行假设检验的方法描述性统计方法数理统计的研究方法02总体与样本总体是研究对象的全体个体所构成的集合,具有共同性质和特征总体定义总体中所包含的个体数目称为总体容量,通常用大写英文字母N表示总体容量描述总体中各个体某一数量指标的分布规律,是数理统计研究的基础总体分布总体的概念样本定义从总体中随机抽取的一部分个体所构成的集合称为样本样本容量样本中所包含的个体数目称为样本容量,通常用小写英文字母n表示样本数据样本中各个体的数量指标值称为样本数据,是进行统计分析的依据样本的概念03020103推断关系通过对样本进行分析和研究,可以对总体进行推断和预测,这种关系称为推断关系01抽样关系样本是从总体中随机抽取的一部分个体,因此样本与总体之间存在抽样关系02代表性如果样本能够较好地反映总体的特征和规律,则称该样本具有代表性。
总体与样本的关系03统计量与抽样分布统计量的概念统计量定义统计量是基于样本数据计算出来的数值,用于描述样本特征或推断总体特征统计量与参数的区别统计量是描述样本特征的,而参数是描述总体特征的;统计量可以通过计算得到,而参数通常是未知的样本中所有数据的平均值,用于估计总体均值样本均值样本中各数据与样本均值之差的平方的平均值,用于估计总体方差样本方差样本方差的平方根,用于衡量数据的离散程度样本标准差样本中具有某种特征的个体数与样本总数的比值,用于估计总体比例样本比例常见的统计量在多次随机抽样中,由样本统计量所形成的分布称为抽样分布抽样分布定义通过抽样分布可以了解样本统计量的波动情况,进而对总体参数进行推断抽样分布的意义根据样本量大小和总体分布的不同,抽样分布可以是正态分布、t分布、卡方分布或F分布等抽样分布的类型010203抽样分布的概念04参数估计点估计是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示,所以称为点估计点估计的方法主要有矩估计法和最大似然估计法矩估计法是通过样本矩来估计总体矩的方法,简单易行且不需要事先知道总体分布的具体形式最大似然估计法则是通过最大化样本数据的似然函数来得到总体参数的估计值,具有优良的大样本性质。
定义方法点估计定义区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到方法区间估计的方法主要有置信区间法和预测区间法置信区间法是通过构造一个包含总体参数的置信区间来进行区间估计,其置信水平通常取95%或99%预测区间法则是通过构造一个包含未来观测值的预测区间来进行区间估计,其预测水平通常也取95%或99%区间估计无偏性无偏性是指估计量的期望值等于被估计的总体参数,即估计量在多次重复抽样下的平均值等于总体参数的真实值有效性有效性是指对于同一总体参数的两个无偏估计量,有更小方差的估计量更有效一致性一致性是指随着样本量的增加,估计量的值逐渐接近总体参数的真实值参数估计的评价标准05假设检验小概率原理小概率事件在一次试验中几乎不可能发生,若发生则拒绝原假设反证法思想先假设原假设成立,若由此导致不合理现象出现,则拒绝原假设决策准则根据样本信息,按一定规则做出决策,判断原假设是否成立假设检验的基本思想假设检验的步骤确定拒绝域根据显著性水平和检验统计量的分布,确定拒绝原假设的区域选择适当的检验统计量根据样本信息和原假设,选择适当的检验统计量提出原假设和备择假设原假设通常是待检验的命题的反面,备择假设则是待检验的命题本身。
计算检验统计量的值根据样本数据计算检验统计量的值做出决策将计算得到的检验统计量值与拒绝域进行比较,若落入拒绝域则拒绝原假设,否则接受原假设原假设为真时拒绝原假设的错误,也称为“弃真”错误犯第一类错误的概率记为,也称为显著性水平第一类错误第二类错误两类错误的关系原假设为假时接受原假设的错误,也称为“取伪”错误犯第二类错误的概率记为在样本量固定的情况下,和此消彼长,相互制约要同时减小和,需要增加样本量假设检验中的两类错误06方差分析与回归分析方差分析的基本概念将总变异分解为因素引起的变异和随机误差引起的变异两部分,通过比较不同来源的变异对总变异的贡献大小,确定可控因素对研究结果影响力的大小方差分析的基本思想方差分析是一种通过比较不同组别数据的方差来探究因素对结果影响的统计方法方差分析定义适用于多个总体均值是否相等的假设检验问题,例如比较不同品种、不同工艺对产品性能的影响等方差分析的应用场景回归分析定义回归分析是一种探究自变量与因变量之间关系的统计方法,通过构建回归模型来描述这种关系回归分析的应用场景适用于预测、控制、优化等问题,例如根据历史数据预测未来趋势,通过调整自变量来控制因变量等回归分析的基本思想采用最小二乘法等数学方法构建回归模型,使得模型预测值与实际观测值之间的误差平方和最小,从而得到自变量与因变量之间的最佳拟合关系。
010203回归分析的基本概念方差分析与回归分析的联系与区别方差分析和回归分析都是数理统计中常用的方法,都可以用于探究变量之间的关系在某些情况下,方差分析和回归分析可以相互补充,例如通过方差分析确定因素对结果的影响是否显著后,可以进一步通过回归分析建立预测模型联系方差分析主要用于比较不同组别数据的差异显著性,而回归分析则主要用于探究自变量与因变量之间的定量关系并构建预测模型;方差分析强调对总体均值的假设检验,而回归分析则更注重模型的拟合优度和预测能力评估区别感谢观看THANKS。
