您所在位置：网站首页 > 机械/制造/汽车 > 电气技术应用统计学(简单计量)考试实用版(完美排版)

应用统计学(简单计量)考试实用版(完美排版)

3页

卖家[上传人]：s9****2

文档编号：478354815

上传时间：2023-05-22

文档格式：DOCX

文档大小：54.81KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金贝

/ 3 举报版权申诉马上下载

文本预览

下载提示

常见问题

1、+1Q位置n+3L位置Q 位置3n+；1u位置4琳对比:置=现;皿 h ；数学性质优良4分布偏斜程度较大时应用。 3.众数。不受极端值影响；具有不唯一性；数据分布偏斜程度较大且有明显峰值时应用。四分位差(上四分位数与下四分位数之差)：反映了中间 50%数据的离散程度；不受极端ts正态分布的概率：概率是曲线的面积。PX=x)=x=12/ ；l统计学：收集、处理、分析、解释数据并从数据中得出结论的科学。 1.收集数据：取得数据。2.处理数据：图表展示。3.分析数据：利用统计方法分析数据。 4.数据解释：结果的说明。5.得到结论：从数据分析中得出客观结论。统计学的滥用：把简单的问题复杂化。不好的样本；过小的样本；误导性图表；局部描述；故意曲解。变量(variable):从一次观察到下一次观察会出现不同结果的某种特征。数据(data)：观察到的变量的结果。变量的分类：1.定量变量(quantitative variable) 或数值变量(metric variable)。可以用阿拉伯数据来记录其观察结果。如“企业销售额”、 “上涨股票的家数”、“生活费支出”、“投掷一枚

2、骰子出现的点数”。定量变量的观察结果称为定量数据或数值型数据(metric data)2.分类变量(categorical variable)。表现为不同的类别。如“性别”、“企业所属的行业”、“学生所在的学院” 等。分类变量的观察结果就是分类数据(categorical data)。3.顺序变量(rank variable)或有序分类变量具有一定顺序的类别变量。如考试成绩按等级，一个人对事物的态度。顺序变量的观察结果就是顺序数据或有序分类数据(rank data)。4.分类变量和顺序变量统称为定性变量(qualitative variable)。抽样方法的分类： 1.概率抽样。包括简单随机抽样，分层抽样，整群抽样，系统抽样与多阶段抽样。 2.非概率抽样。包括方便抽样，判断抽样，自愿样本，滚雪球抽样与配额抽样。常用图表的种类：1. 定性数据的图示：条形图；饼图；环形图；帕累托图。 2.分组数据：直方图。 3.原始数据：茎叶图；箱线图(最大值、最小值、中位数 M 和两个四分位数(下四分位数Q和上四分彳位数Q )。4.两个变量间的关系：二维散点图。5.

3、三个变量间的关系：三维散点图；气泡图。 5.比较多个样本的相似性：雷达图(也成为蜘蛛图)。直方图与条形图的区别： 1.条形图是用条形的长度(横置时)表示各类别频数的多少，其宽度(表示类别)则是固定的。 2.直方图是用面积表示各组频数的多少，矩形的高度表示每一组的频数或百分比，宽度则表示各组的组距，其高度与宽度均有意义。 3.直方图的各矩形通常是连续排列，条形图则是分开排列。 4. 条形图主要用于展示分类数据，直方图则主要用于展示数值型数据。茎叶图与直方图的区别：茎叶图类似于横置的直方图，但又有区别。 1.直方图可观察一组数据的分布状况，但没有给出具体的数值。2. 茎叶图既能给出数据的分布状况，又能给出每一个原始数值，保留了原始数据的信息。3. 直方图适用于大批量数据，茎叶图适用于小批量数据。n为奇数n为偶数四分位数：1. 定义算法(右 1)2.较准确算法(右 2)3左 124. 左 3Q位置=LQ 位置=U平均数、中位数、众数的1.平均数。易受极端值影数据对称分布或接近对称分布时应用。 2.中位数。不受极端值影响，具有稳健性；数据值的影响；用于衡量中

4、位数的代表性。 Qd=Q -Q平均差(各变量值与其平均数离差绝对值的平均数，能全面反映一组数据的离散程度)：X |x -x|i样本方差与标准差用n-1,总体方差和标准差用 N。自由度：如果对 n 个观测值附加的约束个数为k个，自由度则为n-k。总体是n,样本是 n-1。标准分数：对某一个值在一组数据中相对位置的度量。经验法则：经验法则表明：当一组数据对称分布时：约有68%的数据在平均数加减1个标准差的范围之内；约有95%的数据在平均数加减2个标准差的范围之内；约有99%的数据在平均数加减3个标准差的范围之内。切比雪夫不等式：对于任意分布形态的数据，根据切比雪夫不等式，至少有 1-1/k2 的数据落在平均数加减k个标准差之内。其中k是大于1的任意值，但不一定是整数。离散系数：偏态(数据分布偏斜程度的测度)与峰态(数据分布扁平程度的测度)：偏态系数=0 为对称分布；0 为右偏分布；0 为左偏分布。峰态系数=0 扁平峰度适中；峰态系数0为扁平分布；峰态系数0 为尖峰分布。概率：对事件发生的可能性大小的度量。事件A发生的次数重复试验次数概率的获取方式：1.重复试验

5、获得概率。 2.用类似的比例来逼近。 3.主观概率。随机变量：事先不知道会出现什么结果，一般用 X，Y，Z 来表示，根据取值情况的不同分为离散型随机变量和连续型随机变量。离散型随机变量：随机变量 X 取有限个值或所有取值都可以逐个列举出来 x1 , x2，以确定的概率取这些不同的值。连续型随机变量：可以取一个或多个区间中任何值，所有可能取值不可以逐个列举出来，而是取数轴上某一区间内的任意点。离散型随机变量的期望值：描述离散型随机变量取值的集中程度。离散型随机变量x的所有可能取值X与其取相对应的概率p.乘积之和卩=E( X) = lLxp(X取有限个值)ii卩=E( X) = xp(X取无穷个值)iii离散型随机变量的方差:随机变量X的每一个取值与期望值的离差平方和的数学期望，记为6或D(X),描述离散型随机变量取值的分散程度，G 2 = D(X ) = x (x -卩)2 - pii i连续型随机变量的期望值：E (X) = J；s xf (x)dx = Rg二项分布：重复进行n次试验，出现“成功”的次数的概率分布称为二项分布，记为XB(n,p)。设X为n次重复试验

6、中出现成功的次数，X 取 x 的概率为：ipX=x)=Cpxqx(x=Q12 ,n)n式中：x = nx!(n-x)!期望值 |J=E(X) = np 方差 6=D(X) = npq泊松分布：用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布。Px ”(x=Q12 ；九0x!。入一给定的时间间隔、长度、面积、体积内“成功”的平均数， e = 2.71828 ， x 给定的时间间隔、长度、面积、体积内 “成功”的次数。期望值：E ( X )=九方差：D ( X )=九超几何分布：采用不重复抽样，各次试验并不独立，成功的概率也互不相等。总体元素的数目N很小，或样本容量n相对于N来说较大时，样本中“成功”的次数则服从超几何概率分布。概率分布函数：Cx Cn-xM N-MCn正态分布：描述连续型随机变量的最重要的分布。许多现象都可以由正态分布来描述。可用于近似离散型随机变量的分布(例如：二项分布)。是经典统计推断的基础。增态分布概率密度函数：正态分布函数的性质：1.图形是关于x=y对称钟形曲线，且峰值在x=处。2.均值M和标准差

7、o旦确定，分布的具体形式也惟一确定，不同参数正态分布构成一个完整的“正态分布族”。3.均值卩可取实数轴上的任意数值，决定正态曲线的具体位置；标准差决定曲线的陡峭”或扁平”程度。o越大，正态曲线扁平；o越小，正态曲线越高陡峭。4. 当 X 的取值向横轴左右两个方向无限延伸时，曲线的两个尾端也无限渐近横轴，理论上永远不会与之相交。 5.正态随机变量在特定区间上的取值概率由正态曲线下的面积给出，而且其曲线下的总面积等于1 。P(a x b)二 Jbf (x)dxa标准正态分布：1.随机变量具有均值为 0，标准差为 1 的正态分布。2.任何一个一般的正态分布，可通过下面的线性变换转化为标准正态分布X uZ 二-N (0,1)标准正态分布的概率密度函数1x 2申(x ) = c e 22 ng x +8准正态分布的分布函数：O(x)二Jx 申(x)dt 二8Jx_l e-2dt812n由正态分布导出的几个重要分布分布：炉分布：设XN（PQ2），则z = X -U N(0,1)QY二Z2，则y服从自由度为1的炉分布，即Y咒2d）。对于n个正态随机变量 y1 ， y2 ，

8、yn ，则随机变量nY 2 =乙 y 2i 称为具有 n 个自由度的i=1yy 2花分布，记为人y2 分布的性质和特点： 1.分布的变量值始终为正。2.分布的形状取决于其自由度n的大小，通常为不对称的正偏分布，但随着自由度的增大逐渐趋于对称。3.期望为：E（y2）=n, 方差为：D（y）=2n（n为自由度）。4.可加性：若 U 和 V 为两个独立的 y2 分布随机变量， Uy2（n ）， Vy2（n ）,则 U+V 这一随机变量服从自由度1为 n +n 的2 y2 分布。t分布：t分布是类似正态分布的一种对称分布，通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大，分布也逐渐趋于正态分布。F-分布:设若U为服从自由度为n,的y2分布, 即Uy2（n）,!/为服从自由度为n 的 y2分布，即Vy2（n ），且U和V相互独立称F为服从自由度竹和僞的F分布,记为:F F(n , n )12抽样分布： 1 .样本统计量的概率分布，是一种理论分布。（在重复选取样本量为 n 的样本时，由该统计量的所有可能取值形成的相对频数分布）。

9、 2.随机变量是样本统计量。（样本均值，样本比例，样本方差等）。 3.结果来自容量相同的所有可能样本。 4.提供了样本统计量长远而稳定的信息，是进行推断的理论基础，也是抽样推断科学性的重要依据。样本均值的抽样分布：1.在重复选取容量为 n 的样本时，由样本均值的所有可能取值形成的相对频数分布。 2.一种理论概率分布。 3. 推断总体均值 u 的理论基础。统计量的标准误差：1.样本统计量的抽样分布的标准差，称为统计量的标准误，也称为标准误差。 2.标准误衡量的是统计量的离散程度，它测度了用样本统计量估计总体参数的精确程度。 3.样本均值和样本比例的标准误差分别为兀（1冗）1 n估计的标准误差：1.当计算标准误时涉及的总体参数未知时，用样本统计量代替计算的标准误，称为估计的标准误。 2.以样本均值为例：当总体标准差 Q 未知时，可用样本标准差 s 代替，则在重复抽样条件下，样本均值的估计标准误为s。Qx估计量：用于估计总体参数的随机变量。估计值：估计参数时计算出来的统计量的具体值。点估计：用样本的估计量的某个取值直接作为总体参数的估计值。区间估计：在点估计的基础上，给出总体参数估计的一个区间范围，该区间由样本统计量加减估计误差而得到。置信水平：将构造置信区间的步骤重复很多次，置信区间包含总体参数真值的次数所占的比例称为置信水平。置信区间：由样本统计量所构造的总体参数的估计区间称为置信区间。用什么样的估计量去估计？无偏性：估

《应用统计学(简单计量)考试实用版(完美排版)》由会员s9****2分享，可在线阅读，更多相关《应用统计学(简单计量)考试实用版(完美排版)》请在金锄头文库上搜索。

点击阅读更多内容

TA的资源