电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

应用统计学(简单计量)考试实用版(完美排版)

3页
  • 卖家[上传人]:s9****2
  • 文档编号:478354815
  • 上传时间:2023-05-22
  • 文档格式:DOCX
  • 文档大小:54.81KB
  • / 3 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、+1Q位置n+3L位置Q 位置3n+;1u位置4琳对比:置=现;皿 h ;数学性质优良4分布偏斜程度较大时应用。 3.众数。不受极 端值影响;具有不唯一性;数据分布偏斜程度较大且有明显峰值时应用。四分位差(上四分位数与下四分位数之差):反映了中间 50%数据的离散程度;不受极端ts正态分布的概率: 概率是曲线的面积。PX=x)=x=12/ ;l统计学:收集、处理、分析、解释数据并从 数据中得出结论的科学。 1.收集数据:取得 数据。2.处理数据:图表展示。3.分析数据: 利用统计方法分析数据。 4.数据解释:结果 的说明。5.得到结论:从数据分析中得出客 观结论。统计学的滥用:把简单的问题复杂化。不好 的样本;过小的样本;误导性图表;局部描 述;故意曲解。变量(variable):从一次观察到下一次观察会 出现不同结果的某种特征。数据(data):观察到的变量的结果。变量的分类:1.定量变量(quantitative variable) 或数值变量(metric variable)。可以用阿拉伯 数据来记录其观察结果。如“企业销售额”、 “上涨股票的家数”、“生活费支出”、“投掷 一枚

      2、骰子出现的点数”。定量变量的观察结果 称为定量数据或数值型数据(metric data)2.分 类变量(categorical variable)。表现为不同的类 别。如“性别”、“企业所属的行业”、“学生 所在的学院” 等。分类变量的观察结果就是 分类数据(categorical data)。3.顺序变量(rank variable)或有序分类变量具有一定顺序的类 别变量。如考试成绩按等级,一个人对事物 的态度。顺序变量的观察结果就是顺序数据 或有序分类数据(rank data)。4.分类变量和顺 序变量统称为定性变量(qualitative variable)。 抽样方法的分类: 1.概率抽样。包括简单随 机抽样,分层抽样,整群抽样,系统抽样与 多阶段抽样。 2.非概率抽样。包括方便抽样, 判断抽样,自愿样本,滚雪球抽样与配额抽 样。常用图表的种类:1. 定性数据的图示:条形 图;饼图;环形图;帕累托图。 2.分组数据: 直方图。 3.原始数据:茎叶图;箱线图(最 大值、最小值、中位数 M 和两个四分位数(下 四分位数Q和上四分彳位数Q )。4.两个变量 间的关系:二维散点图。5.

      3、三个变量间的关 系:三维散点图;气泡图。 5.比较多个样本 的相似性:雷达图(也成为蜘蛛图)。 直方图与条形图的区别: 1.条形图是用条形 的长度(横置时)表示各类别频数的多少,其宽 度(表示类别)则是固定的。 2.直方图是用面积 表示各组频数的多少,矩形的高度表示每一 组的频数或百分比,宽度则表示各组的组距, 其高度与宽度均有意义。 3.直方图的各矩形 通常是连续排列,条形图则是分开排列。 4. 条形图主要用于展示分类数据,直方图则主 要用于展示数值型数据。 茎叶图与直方图的区别: 茎叶图类似于横置 的直方图,但又有区别。 1.直方图可观察一 组数据的分布状况,但没有给出具体的数值。2. 茎叶图既能给出数据的分布状况,又能给 出每一个原始数值,保留了原始数据的信息。3. 直方图适用于大批量数据,茎叶图适用于 小批量数据。n为奇数n为偶数四分位数:1. 定义算法(右 1)2.较准确算法(右 2)3左 124. 左 3Q位置=LQ 位置=U平均数、中位数、众数的1.平均数。易受极端值影 数据对称分布或接近对称分布时应用。 2.中 位数。不受极端值影响,具有稳健性;数据值的影响;用于衡量中

      4、位数的代表性。 Qd=Q -Q平均差(各变量值与其平均数离差绝对值的平均数,能全面反映一组数据的离散程度):X |x -x|i样本方差与标准差用n-1,总体方差和标准 差用 N。自由度:如果对 n 个观测值附加的约束个数 为k个,自由度则为n-k。总体是n,样本是 n-1。标准分数:对某一个值在一组数据中相对位置的度量。经验法则:经验法则表明:当一组数据对称 分布时:约有68%的数据在平均数加减1个 标准差的范围之内;约有95%的数据在平均 数加减2个标准差的范围之内;约有99%的 数据在平均数加减3个标准差的范围之内。 切比雪夫不等式:对于任意分布形态的数据, 根据切比雪夫不等式,至少有 1-1/k2 的数据 落在平均数加减k个标准差之内。其中k是 大于1的任意值,但不一定是整数。离散系数: 偏态(数据分布偏斜程度的测度)与峰态(数 据分布扁平程度的测度):偏态系数=0 为对 称分布;0 为右偏分布;0 为左偏分布。峰 态系数=0 扁平峰度适中;峰态系数0为扁平 分布;峰态系数0 为尖峰分布。概率:对事件发生的可能性大小的度量。事件A发生的次数重复试验次数概率的获取方式:1.重复试验

      5、获得概率。 2.用类似的比例来逼近。 3.主观概率。随机变量:事先不知道会出现什么结果,一 般用 X,Y,Z 来表示,根据取值情况的不同 分为离散型随机变量和连续型随机变量。 离散型随机变量:随机变量 X 取有限个值或 所有取值都可以逐个列举出来 x1 , x2, 以确定的概率取这些不同的值。连续型随机变量:可以取一个或多个区间中 任何值,所有可能取值不可以逐个列举出来, 而是取数轴上某一区间内的任意点。离散型随机变量的期望值:描述离散型随机变量取值的集中程度。离散型随机变量x的所有可能取值X与其取相对应的概率p.乘积之和卩=E( X) = lLxp(X取有限个值)ii卩=E( X) = xp(X取无穷个值)iii离散型随机变量的方差:随机变量X的每一个 取值与期望值的离差平方和的数学期望,记 为6或D(X),描述离散型随机变量取值的分 散程度,G 2 = D(X ) = x (x -卩)2 - pii i连续型随机变量的期望值:E (X) = J;s xf (x)dx = Rg二项分布:重复进行n次试验,出现“成功”的次数的概率分布称为二项分布,记为XB(n,p)。设X为n次重复试验

      6、中出现成功的次数,X 取 x 的 概 率 为 :ipX=x)=Cpxqx(x=Q12 ,n)n式中:x = nx!(n-x)!期望值 |J=E(X) = np 方差 6=D(X) = npq泊松分布:用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布。Px ”(x=Q12 ;九0x!。入一给定的时间间隔、长度、面积、体积 内“成功”的平均数, e = 2.71828 , x 给定 的时间间隔、长度、面积、体积内 “成功”的 次数。期望值:E ( X )=九方差:D ( X )=九 超几何分布:采用不重复抽样,各次试验并 不独立,成功的概率也互不相等。总体元素 的数目N很小,或样本容量n相对于N来说 较大时,样本中“成功”的次数则服从超几 何概率分布。 概率分布函数:Cx Cn-xM N-MCn正态分布:描述连续型随机变量的最重要的 分布。许多现象都可以由正态分布来描述。 可用于近似离散型随机变量的分布(例如: 二项分布)。是经典统计推断的基础。 增态分布概率密度函数:正态分布函数的性质:1.图形是关于x=y对 称钟形曲线,且峰值在x=处。2.均值M和 标准差

      7、o旦确定,分布的具体形式也惟一 确定,不同参数正态分布构成一个完整的“正 态分布族”。3.均值卩可取实数轴上的任意 数值,决定正态曲线的具体位置;标准差决 定曲线的陡峭”或扁平”程度。o越大,正态 曲线扁平;o越小,正态曲线越高陡峭。4. 当 X 的取值向横轴左右两个方向无限延伸时, 曲线的两个尾端也无限渐近横轴,理论上永 远不会与之相交。 5.正态随机变量在特定区 间上的取值概率由正态曲线下的面积给出, 而且其曲线下的总面积等于1 。P(a x b)二 Jbf (x)dxa标准正态分布:1.随机变量具有均值为 0,标准差为 1 的正态分布。2.任何一个一般的正态分布,可通过下面的线性变换转化为标准 正态分布X uZ 二-N (0,1)标准正态分布的概率密度函数1x 2申(x ) = c e 22 ng x +8准正态分布的分布函数:O(x)二Jx 申(x)dt 二8Jx_l e-2dt812n由正态分布导出的几个重要分布分布: 炉分布:设XN(PQ2),则z = X -U N(0,1)QY二Z2,则y服从自由度为1的炉分布,即Y咒2d)。对于n个正态随机 变 量 y1 , y2 ,

      8、yn , 则 随 机 变 量nY 2 =乙 y 2i 称为具有 n 个自由度的i=1yy 2花分布,记为人y2 分布的性质和特点: 1.分布的变量值始终 为正。2.分布的形状取决于其自由度n的大 小,通常为不对称的正偏分布,但随着自由 度的增大逐渐趋于对称。3.期望为:E(y2)=n, 方差为:D(y)=2n(n为自由度)。4.可加性: 若 U 和 V 为两个独立的 y2 分布随机变量, Uy2(n ), Vy2(n ),则 U+V 这一随机变量服从 自由度1为 n +n 的2 y2 分布。t分布:t分布是类似正态分布的一种对称分 布,通常要比正态分布平坦和分散。一个特 定的分布依赖于称之为自由度的参数。随着 自由度的增大,分布也逐渐趋于正态分布。F-分布:设若U为服从自由度为n,的y2分布, 即Uy2(n),!/为服从自由度为n 的 y2分布, 即Vy2(n ),且U和V相互独立称F为服从自由度竹和僞的F分布,记为:F F(n , n )12抽样分布: 1 .样本统计量的概率分布,是一 种理论分布。(在重复选取样本量为 n 的样本 时,由该统计量的所有可能取值形成的相对 频数分布)。

      9、 2.随机变量是 样本统计量。(样 本均值, 样本比例,样本方差等)。 3.结果来 自容量相同的所有可能样本。 4.提供了样本 统计量长远而稳定的信息,是进行推断的理 论基础,也是抽样推断科学性的重要依据。 样本均值的抽样分布:1.在重复选取容量为 n 的样本时,由样本均值的所有可能取值形成 的相对频数分布。 2.一种理论概率分布。 3. 推断总体均值 u 的理论基础。统计量的标准误差:1.样本统计量的抽样分 布的标准差,称为统计量的标准误,也称为 标准误差。 2.标准误衡量的是统计量的离散 程度,它测度了用样本统计量估计总体参数 的精确程度。 3.样本均值和样本比例的标准误差分别为兀(1冗)1 n估计的标准误差:1.当计算标准误时涉及的 总体参数未知时,用样本统计量代替计算的 标准误,称为估计的标准误。 2.以样本均值 为例:当总体标准差 Q 未知时,可用样本标 准差 s 代替,则在重复抽样条件下,样本均 值的估计标准误为s。Qx估计量:用于估计总体参数的随机变量。 估计值:估计参数时计算出来的统计量的具 体值。点估计:用样本的估计量的某个取值直接作 为总体参数的估计值。区间估计:在点估计的基础上,给出总体参 数估计的一个区间范围,该区间由样本统计 量加减估计误差而得到。置信水平:将构造置信区间的步骤重复很多 次,置信区间包含总体参数真值的次数所占 的比例称为置信水平。置信区间:由样本统计量所构造的总体参数 的估计区间称为置信区间。用什么样的估计量去估计? 无偏性:估

      《应用统计学(简单计量)考试实用版(完美排版)》由会员s9****2分享,可在线阅读,更多相关《应用统计学(简单计量)考试实用版(完美排版)》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.