您所在位置：网站首页 > 学术论文 > 其它学术论文 > 统计学第四版答案

统计学第四版答案.docx

24页

卖家[上传人]：夏**

文档编号：509333235

上传时间：2023-05-14

文档格式：DOCX

文档大小：109.17KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20金贝

下载

/ 24 举报版权申诉马上下载

文本预览

下载提示

常见问题

请举出统计应用的几个例子：1、用统计识别作者：对于存在争议的论文，通过统计量推出作者2、用统计量得到一个重要发现：在不同海域鳗鱼脊椎骨数量变化不大，推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3、挑战者航天飞机失事预测请举出应用统计的几个领域：1、在企业发展战略中的应用 2、在产品质量管理中的应用 3、在市场研究中的应用 ④在财务分析中的应用 ⑤在经济预测中的应用你怎么理解统计的研究内容：1、统计学研究的基本内容包括统计对象、统计方法和统计规律 2、统计对象就是统计研究的课题，称谓统计总体3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律举例说明分类变量、顺序变量和数值变量：分类变量：表现为不同类别的变量称为分类变量，如“性别”表现为“男”或“女,”“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等，“学生所在的学院”可能是“商学院”、“法学院”等顺序变量：如果类别有一定的顺序，这样的分类变量称为顺序变量，如考试成绩按等级分为优、良、中、及格、不及格，一个人对事物的态度分为赞成、中立、反对。

这里的“考试成绩等级”、“态度”等就是顺序变量数值变量：可以用数字记录其观察结果，这样的变量称为数值变量，如“企业销售额”、 “生活费支出”、“掷一枚骰子出现的点数”定性数据和定量数据的图示方法各有哪些：1、定性数据的图示：条形图、帕累托图、饼图、环形图2、定量数据的图示：a、分组数据看分布：直方图b、未分组数据看分布：茎叶图、箱线图、垂线图、误差图c、两个变量间的关系：散点图d、比较多个样本的相似性：雷达图和轮廓图直方图与条形图有何区别：1、条形图中的每一个矩形表示一个类别，其宽度没有意义，而直方图的宽度则表示各组的组距2、由于分组数据具有连续性，直方图的各矩形通常是连续排列，而条形图则是分开排列3、条形图主要用于展示定性数据，而直方图则主要用于展示定量数据一组数据的分布特征可以从哪几个方面进行描述：1、数据的水平，反映数据的集中程度2、数据的差异，反映各数据的离散程度3、分布的形状，反映数据分布的偏态和峰态说明平均数、中位数和众数的特点及应用场合：平均数也称为均值，它是一组数据相加后除以数据的个数而得到的结果平均数是度量数据水平的常用统计量，在参数估计以及假设检验中经常用到。

中位数是一组在数据排序后处于中间位置上的数值，用Me表示中位数是用中间位置上的值代表数据水平，其特点是不受极端值影响，在研究收入分配中很有用众数与数据出现的次数有关，着眼于对各数据出现的频率的考察，其大小只与这组数据中的部分数据有关，其特点是不受极端值的影响，具有不惟一性，一组数据中可能会有一个人众数，也可能会有多个或没有为什么要计算离散系数：极差、平均差、方差和标准差等都是反映数据分散程度的绝对值，其数值的大小取决于原变量值本身水平高低的影响它们与原变量值的计量单位相同，采用不同计量单位计量的变量值，其离散程度的测度值也就不同因此，为消除变量值水平高低和数量单位不同对离散程度的测度值的影响，需要计算离散系数举例说明离散型随机变量和连续性随机变量：离散型随机变量：设X是一个随机变量，如果它全部可能的取值只有有限个或可数无穷个，则称X为一个离散型随机变量包括二项分布、泊松分布、超几何分布，如一定时间内某航空公司接到的订票数连续型概率分布：包括正态分布、均匀分布和指数分布叙述正态分布曲线的特点：正态曲线的图形是关于x=u对称的钟形曲线，且峰值在x=u处正态分布的两个参数 U和。

一旦确定，正态分布的具体形式也惟一确定，不同参数取值的正态分布构成一个完整的“正态分布族” 当X的取值向横轴左右两个方向无限延伸时，正态曲线的左右两个尾端也无限渐近横轴，但理论上永远不会与之相交④正态随机变量在特定区间上取值的概率由正态曲线下的面积给出，而且其曲线下的总面积等于1解释中心极限定理的含义：随着样本量n的增大（通常要求n>=30），不论原来的总体是否服从正态分布，样本均值的概率分布都将趋于正态分布，其分布的期望值为总体均值u,方差为总体方差的1/n这一定理可表述为：从均值为u、方差为人2的总体中，抽取样本量为n的随机样本，当n充分大时（通常要求n>=30）,样本均值的分布近似服从均值为u,方差为人2/n的正态分布说明区间估计的基本原理：区间估计，是在点估计的基础上给出总体参数估计的一个估计区间，该区间通常是由样本统计量加减估计误差得到的与点估计不同，进行区间估计时，根据样本统计量的抽样分布，可以对统计量与总体参数的接近程度给出的一个概率度量简述评价估计量的标准：无偏性：它是指估计量抽样分布的期望值等于被估计的总体参数；有效性：它是指估计量的方差尽可能小；一致性：它是指随着样本量的增大，点估计量的值越来越接近被估计总体的参数解释置信水平的含义：置信水平，是指总体参数值落在样本统计值某一区内的概率；而置信区间是指在某一置信水平下，样本统计值与总体参数值间误差范围。

置信区间越大，置信水平越高简述样本量与置信水平、总体方差、估计误差的关系样本量与置信水平成正比，在其他条件不变的情况下，置信水平越大，所需的样本量也就越大；样本量与总体方差成正比，总体的差异越大，所要求的样本量也越大；样本量与估计误差的平方成正比，即允许的估计误差的平方越大，所要求的样本量就越大解释原假设和备择假设：原假设：它通常是研究者想收集证据予以推翻的假设，用H0表示，原假设所表达的含义总是指参数没有变化或变量之间没有关系，等号“=”总放在原假设上备择假设：通常指研究者想收集证据予以支持的假设，用H1或Ha表示备择假设所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设的形式总是为 Hl:u工uO,Hl:uvuO 或 u>uO第一类错误和第二类错误分别是指什么？它们发生的概率大小之间存在怎样的关系：第I类错误(弃真错误)：原假设为真时拒绝原假设时所犯的错误第II类错误(取伪错误)：原假设为假时未拒绝原假设当样本容量n确定后，当a变小时，则检验的拒绝域变小，相应的接受域会变大，因此B值也就随之变大；相反，若B变小，则a又会变大.样本量的大小与显著性有怎样的关系：显著性水平与样本的大小密切相关，相关量越大，检验统计量的值也就越大，显著性水平越小，就越有可能拒绝原假设。

相关分析主要解决哪些问题：变量之间是否存在关系如果存在关系，它们之间是什么样的关系变量之间的关系强度如何④样本所反映的变量之间的关系能否代表总体变量之间的关系解释回归模型和估计的回归方程的含义：回归模型是描述因变量y如何依赖于自变量x和误差项的方程回归方程是描述因变量y 的期望值如何依赖于自变量x的方程估计的回归方程是利用最小二乘法，根据样本数据求出的回归方程的估计简述参数最小二乘估计的基本原理：这一公式的x和y的n对观察值，用于描述其关系的直线有多条，用距离观测点最近的一条直线，用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小根据这一思想确定直线中未知常数和的方法称为最小二乘法什么是P值？利用P值进行检验和利用统计量进行检验有什么不同？如果能把犯第I类错误的真实概率算出来，就可以直接用这个概率做出决策而不需要管什么事先给定的显著性水平a,这个犯第I类错误的真实概率就是P值不同：统计量检验是根据事先确定的显著性水平a围成的拒绝域作出决策，不论检验统计量的值是大是小，只要把它落入拒绝域就拒绝原假设H否则就不拒绝H这样，无论统计量落在拒绝域的什么位置，你也只能说犯第一错误的概率为a,而用P值检验则能把犯第I 类错误的真实概率算出来。

获得数据的概率抽样方法有哪些(1) 简单随机抽样简单随机抽样又称纯随机抽样，是指在特定总体的所有单位中直接抽取n个组成样本它最直观地体现了抽样的基本原理，是最基本的概率抽样2) 系统抽样系统抽样也称等距抽样或机械抽样，是按一定的间隔距离抽取样本的方法3) 分层抽样分层抽样也叫分类抽样，就是先将总体的所有单位依照一种或几种特征分为若干个子总体，每一个子总体即为一类，然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本，称为分类样本，它们的集合即为总体样本4) 整群抽样整群抽样又称聚类抽样或集体抽样，是将总体按照某种标准划分为一些群体，每一个群体为一个抽样单位，再用随机的方法从这些群体中抽取若干群体，并将所抽出群体中的所有个体集合为总体的样本⑸多阶段抽样多阶段抽样又称多级抽样或分段抽样，就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法样本量的大小与显著性有怎样的关系通常在做某种统计推断时，显著性水平要求越高，要达到该显著性水平的样本量越大样本量越大，检验统计量的值夜就越大，P值就越小，就越有可能拒绝原假设反之则相反第1章统计和统计数据1.1 指出下面的变量类型。

（1）年龄（2）性别（3）汽车产量4）员工对企业某项改革措施的态度（赞成、中立、反对）（5）购买商品时的支付方式（现金、信用卡、支票）详细答案：（1）数值变量（2）分类变量（3）数值变量4）顺序变量（5）分类变量1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查，其中60%回答他们的月收入在5000元以上， 50%的人回答他们的消费支付方式是用信用卡1）这一研究的总体是什么？样本是什么？样本量是多少？（2）“月收入”是分类变量、顺序变量还是数值变量？（3） “消费支付方式”是分类变量、顺序变量还是数值变量？详细答案：（1）总体是“所有IT从业者”样本是“所抽取的1000名IT从业者”样本量是1000 （2）数值变量 3）分类变量1.3 一项调查表明，消费者每月在网上购物的平均花费是200元，他们选择在网上购物的主要原因是“价格便宜”1）这一研究的总体是什么？（2） “消费者在网上购物的原因”是分类变量、顺序变量还是数值变量？详细答案：（1）总体是“所有的网上购物者” （2）分类变量1.4 某大学的商学院为了解毕业生的就业倾向，分别在会计专业抽取50 人、市场营销专业抽取30、企业管理20人进行调查。

1）这种抽样方式是分层抽样、系统抽样还是整群抽样？（2）样本量是多少？详细答案：（1）分层抽样（2） 100第 3 章用统计量描述数据教材习题答案3.1随机抽取25个网络用户，得到他们的年19152925242321382218302019191623272234244120311723龄数据如下（单位：周岁）：计算网民年龄的描述统计量，并对网民年龄的分布特征进行综合分析详细答案：网民年龄的描述统计量如下：平均24中位数2325%四分位数1975%四分位数26.5众数19标准差6.65方差44.25峰度0.77偏度1.08极差26最小值15最大值41从集中度来看，网民平均年龄为24岁，中位数为23岁从离散度来看，标准差在为6.65。

点击阅读更多内容