您所在位置：网站首页 > 商业/管理/HR > 其它文档 > 多元统计分析思考题答案

多元统计分析思考题答案.pdf

8页

卖家[上传人]：飞***

文档编号：54026937

上传时间：2018-09-07

文档格式：PDF

文档大小：110.79KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20金贝

下载

/ 8 举报版权申诉马上下载

文本预览

下载提示

常见问题

多元统计分析思考题答案1 《多元统计分析》思考题答案记得老师课堂上说过考试内容不会超出这九道思考题，如下九道题题目中有错误的或不清楚的地方，欢迎大家指出、更改、补充1、简述信度分析答题提示：要答可靠度概念，可靠度度量，克朗巴哈系数、拆半系数、单项与总体相关系数、稀释相关系数等（至少要答四个系数，至少要给出两个指标的公式）答：信度（ Reliability ）即可靠性，它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度信度指标多以相关系数表示，大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性）和内在一致性系数（跨项目的一致性）信度分析的方法主要有以下四种：1)、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测，计算两次施测结果的相关系数重测信度属于稳定系数重测信度法特别适用于事实式问卷，如果没有突发事件导致被调查者的态度、意见突变，这种方法也适用于态度、意见式问卷由于重测信度法需要对同一样本试测两次，被调查者容易受到各种事件、活动和他人的影响，而且间隔时间长短也有一定限制，因此在实施中有一定困难2)、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本，计算两个复本的相关系数。

复本信度属于等值系数复本信度法要求两个复本除表述方式不同外，在内容、格式、难度和对应题项的提问方向等方面要完全一致，而在实际调查中，很难使调查问卷达到这种要求，因此采用这种方法者较少3)、折半信度法折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度折半信度属于内在一致性系数，测量的是两半题项得分间的一致性这种方法一般不适用于事实式问卷（如年龄与性别无法相比），常用于态度、意见式问卷的信度分析在问卷调查中，态度测量最常见的形式是5 级李克特（ Likert ）量表进行折半信度分析时，如果量表中含有反意题项，应先将反意题项的得分作逆向处理，以保证各题项得分方向的一致性，然后将全部题项按奇偶或前后分为尽可能相等的两半，计算二者的相关系数为了校正差异，两半测验的方差相等时，常运用斯皮尔曼-布朗公式（ Spearman-Brown Formula）：rxx=2rhh/(1+rhh) ，其中， rhh：两半测验的相关系数；rxx ：估计或修正后的信度该公式可以估计增长或缩短一个测验对其信度系数的影响当两半测验的方差不同时，应采用卢伦公式（ Rulon Formula ）或弗拉纳根公式（Flanagan Formula）进行修正。

4)、α信度系数法Cronbach α信度系数是目前最常用的信度系数，其公式为：21211XniiSSnn其中，2 iS为每一项目的方差；2 XS为测验总分方差从公式中可以看出，α系数评价的是量表中各题项得分间的一致性，属于内在一致性系数多元统计分析思考题答案2 这种方法适用于态度、意见式问卷（量表）的信度分析2、简述多元尺度分析在你工作中的应用答：多元尺度分析 (Multi-dimension Analysis)是市场研究的一种有力手段，是市场调查、分析数据的统计方法之一它可以通过低维空间（通常是二维空间）展示多个研究对象（比如品牌）之间的联系，利用平面距离来反映研究对象之间的相似程度由于多维尺度分析法通常是基于研究对象之间的相似性（距离）的，只要获得了两个研究对象之间的距离矩阵，我们就可以通过相应统计软件做出他们的相似性知觉图在实际应用中，距离矩阵的获得主要有两种方法：一种是采用直接的相似性评价，先对所有评价对象进行两两组合，然后要求被访者对所有的这些组合间进行直接相似性评价，这种方法我们称之为直接评价法；另一种为间接评价法，由研究人员根据事先经验，找出影响人们评价研究对象相似性的主要属性，然后对每个研究对象，让被访者对这些属性进行逐一评价，最后将所有属性作为多维空间的坐标，通过距离变换计算对象之间的距离。

多维尺度分析的主要思路是利用对被访者对研究对象的分组，来反映被访者对研究对象相似性的感知，这种方法具有一定直观合理性在工作中，通过多维尺度分析，可以将消费者对商品相似性的判断产生一张能够看出这些商品间相关性的图形例如：有十个百货商场，让消费者排列出对这些百货商场两两间相似的感知程度，根据这些数据，用多维尺度分析，可以判断消费者认为哪些商场是相似的，从而可以判断竞争对手用于反映多个研究事物间相似（不相似）程度，通过适当的降维方法，将这种相似（不相似）程度在低维度空间中用点与点之间的距离表示出来，并有可能帮助识别那些影响事物间相似性的潜在因素这种方法在市场研究中应用得非常广泛3、简述两个变量之间的相关分析答题提示：答什么是相关，对连续型变量用相关系数，对离散型变量用质相关系数答：相关分析（ correlation analysis），研究随机变量之间的相关关系的一种统计方法相关关系是一种非确定性的关系相关性探讨的是两变量间相关情况的的大致趋势相关分析涉及两个变量：应变量和自变量应变量(response variable)是度量研究结果的变量；自变量是解释或影响反应变量的变量两变量数据相关检验的步骤：一、图示两变量数据以及各个统计数字；二、查看整体状态及数据的离散情况；三、如果有较稳定的关系，就用简单的数学模式描述该关系。

对连续型变量常用相关系数刻画两个变量之间的相关性，而对离散型变量则用质相关系数多元统计分析思考题答案3 4、聚类和判别分析的异同答：聚类分析是把研究目标分割成为具有相同属性的小的群体对变量的聚类称为R型聚类，而对观测值聚类称为Q型聚类它们在数学上是无区别的聚类的基本想法：根据某种距离，把最近的聚在一起这里的距离含义很广，如欧氏距离、马氏距离等距离，相似系数也可看作为距离判别分析的基本思路是：设有 G1 、G2 、,GK 个总体，从不同的总体中抽出不同的样本，根据样本→建立判别法则→判别新的样品属于哪一个总体当然，根据不同的方法，建立的判别法则也是不同的常用的判别方法有：距离判别、Fisher判别、 Bayes 判别判别分析和聚类分析都是分类其主要不同点就是，在聚类分析中一般人们事先并不知道或一定要明确应该分成几类，完全根据数据来确定而在判别分析中，至少有一个已经明确知道类别的“训练样本”，利用这个数据，就可以建立判别准则，并通过预测变量来为未知类别的观测值进行判别了可以先聚类以得知类型, 再进行判别 . 5、因子分析和主成分分析的异同答：主成分分析和因子分析是多元统计方法中关系密切的两种方法，应用范围十分广泛，可以解决经济、教育、科技、社会等领域中的综合评价问题。

主成分分析采用降维的思想，将研究对象的多个相关变量（指标）综合为少数几个不相关的变量，反映原变量提供的主要信息因子分析是主成分分析的推广和发展，它将具有错综复杂关系的变量综合为数量较少的几个因子，以再现原始变量与因子之间的相互关系，同时根据不同因子还可以对变量进行分类，它属于多元分析中处理降维的一种统计方法但是，在许多论文中用SPSS进行综合分析时，出现这两种方法运用混淆的错误比如，主成分分析中对变量进行了因子旋转，因子分析的公因子系数错误等问题本文就此对主成分分析和因子分析的异同进行比较，并在SPSS和 DPS软件上如何实现给予说明一、主成分分析与因子分析的异同点两者的相同点：1、思想一致：都是降维的思想；2、应用范围一致：都要求变量之间具有不完全的相关性；3、数据处理过程一致：数据的无量纲化，求相关系数矩阵的特征值和特征向量，通过累计贡献率确定主成分个数、因子个数；4、合成方法一致：都没有考虑原始变量之间的关系，直接用线性关系处理变量与主成分和因子之间的关系两者的不同点：1、方差损失上：主成分解释了原始变量的全部方差，无方差损失；因子模型中除了有公因子外还有特殊因子，公因子只解释了部分信息，有方差损失；2、唯一性：主成分分析不存在因子旋转，主成分是唯一的；因子分析进行因子旋转，解不唯一；3、多元统计分析思考题答案4 实际意义：主成分没有实际意义；公因子有实际意义；4、应用：主成分侧重信息贡献、影响力综合评价；因子分析侧重成因清晰性的综合评价。

1. 因子分析中是把变量表示成各因子的线性组合，而主成分分析中则是把主成分表示成几个变量的线性组合2. 主成分分析的重点在于解释个变量的总方差，而因子分析则把重点放在解释各变量之间的协方差3. 主成分分析中不需要有假设(assumptions),因子分析则需要一些假设因子分析的假设包括：各个共同因子之间不相关，特殊因子（specific factor）之间也不相关，共同因子和特殊因子之间也不相关4. 主成分分析中，当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候，的主成分一般是独特的；而因子分析中因子不是独特的，可以旋转得到不到的因子5. 在因子分析中，因子个数需要分析者指定（spss 根据一定的条件自动设定，只要是特征值大于 1 的因子进入分析），而指定的因子数量不同而结果不同在主成分分析中，成分的数量是一定的，一般有几个变量就有几个主成分和主成分分析相比，由于因子分析可以使用旋转技术帮助解释因子，在解释方面更加有优势大致说来，当需要寻找潜在的因子，并对这些因子进行解释的时候，更加倾向于使用因子分析，并且借助旋转技术帮助更好解释而如果想把现有的变量变成少数几个新的变量（新的变量几乎带有原来所有变量的信息）来进入后续的分析，则可以使用主成分分析。

当然，这中情况也可以使用因子得分做到所以这中区分不是绝对的总得来说，主成分分析主要是作为一种探索性的技术，在分析者进行多元数据分析之前，用主成分分析来分析数据，让自己对数据有一个大致的了解是非常重要的主成分分析一般很少单独使用： a，了解数据 (screening the data),b,和 cluster analysis一起使用， c，和判别分析一起使用，比如当变量很多，个案数不多，直接使用判别分析可能无解，这时候可以使用主成份发对变量简化reduce dimensionality）d, 在多元回归中，主成分分析可以帮助判断是否存在共线性（条件指数），还可以用来处理共线性在算法上，主成分分析和因子分析很类似，不过，在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差，而是和变量对应的共同度（变量方差中被各因子所解释的部分6、系统聚类与K-means 聚类的基本原理答：系统聚类法基本原理和步骤为：1、先计算n 个样本两两间的距离2、构造 n个类，每个类只包含一个样本3、合并距离最近的两类为一新类4、计算新类与当前各类的距离多元统计分析思考题答案5 5、类的个数是否等于1，如果不等于回到3 在做6、画出聚类图7、决定分类个数和类K-means 聚类的基本原理：聚类可以走着瞧，不一定事先确定有多少类；但是 K-means聚类却要求先说好要分多少类。

看起来有些主观假定分 3 类，这个方法还进一步要求你事先确定3 个点为“聚类种子”( 多数软件会自动选种子 )；也就是说，把这3 个点作为三类中每一类的基石然后根据和这三个点的距离远近，把所有点分成三类再把这三类的中心( 均值 ) 作为新的基石或种子( 原来 “种子” 就没用了 ) ，再重新按照距离分类如此叠代下去，直到达到停止叠代的要求（比如，各类最后变化不大了，或者叠代次数太多了）显然，前面的聚类种子的选择并不必太认真，它们很可能最后还会分到同一类中呢7、 Fisher 判别和贝叶斯判别的基本原理答：Fisher判别法是一种先投影的方法使多维问题简化为一维问题来处理选择一个适当的投影轴 , 使所有的样品点都投影到这个轴上得到一个投影值对这个投影轴的方向的要求是：使每一类内的投影值所形成的类内离差尽可能小，而不同类间的投影值所形成的类间离差尽可能大进行投影后，再根据距离判别思想由距离的远近得到判别准则，从而进行。

点击阅读更多内容