您所在位置：网站首页 > 学术论文 > 其它学术论文 > 第十一章双变量统计分析

第十一章双变量统计分析.docx

7页

卖家[上传人]：博****1

文档编号：500602022

上传时间：2023-12-18

文档格式：DOCX

文档大小：24.16KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 7 举报版权申诉马上下载

文本预览

下载提示

常见问题

第十一章双变量统计分析在社会学研究中，不但要了解一个变量的情况，更要进一步了解一个变量与另一个变量之间的关系在这一讲中我们介绍几种双变量的统计分析方法一、交互分类表交互分类表又称列联表，是指同时依据两个变量的值，将所研究的个案分类交互分类的目的是将两变量分组，然后比较各组的分布状况，以寻找变量间的关系1、条件次数表：表 10-1是交互分类表的一个例子：表 10-1 500 名工人的文化水平与工资收入交互分类表（人）工资收入合计文化水平大专以上中学小学及以下26186142023455514045275180（1）表中的次数分布是同时根据文化水平和工资收入而定，如大专以上高收入的有26 人从表中可以清楚地知道每种文化水平的工资收入的次数分布，因此这样的表又称为条件次数表在表的最下一行和最右一列分别是不同文化水平和不同收入的总次数，称为边缘次数，它们的分布情况称为边缘分布；表中的其它次数，称为条件次数，每一条件下的分布称为条件分布2）条件次数表有大小之分，计算的方法，通常是将因变量的数目乘上自变量的数目如果我们将因变量放在表的旁边，将自变量放于表的上端，则表的大小就是横行数目（rows简写r）乘上纵行数目（columns简写c）,即表的大小=rXc。

这个先后次序的用意是表示前者（因变量）是受后者（自变量）影响的要注意的是，3X2表不同于2X3表，因为前后两个数值代表不同的变量，包含不同类别数2、条件百分表：条件次数表中的数字是绝对数字，由于各个类别的基数不同，相互之间无法进行比较，因而不能看出两变量之间的关系为克服条件次数表的这一缺点，使各个类别之间可以比较，应将表中的绝对数字转变成相对数字——百分数，这样制成的表称为条件百分表如上表可改成百分表为：表 10-2 500 名工人文化水平与工资收入的交互百分表（ % ）工资收入总数文化水平大专以上中学小学及以下%%%57.86.53.331.173.518.911.120.077.8(45)(275)（180）在计算条件百分表时，最好能依据下列准则：1）每个表的顶端要有表号和标题加上表号，可以方便讨论和减少混乱简明标题，能使读者容易领会表内统计数值的意义2）绘表时所用的线条，要尽可能简短舍去不必要的线条，可以节省绘制的功夫，也会令人对表中的数值一目了然3）在表上层的自变量每个值之下的%号，表示下列的数值是百分率如果表内每个数值都附有%符号，就太繁复了4）计算百分比表通常是按照自变量的方向，因为研究的目的是要了解自变量对因变量的影响，理应计算在不同的自变量情况下，因变量的变化如何。

如上表是要分析教育水平对工资收入的影响，各个百分率所表示的，是在不同的教育水平中的工资收入情况如果教育水平不同，工资收入也不同，就表示教育对工资是有影响的了5）表下层括弧内的数值，表示在计算百分率时所依据的个案总数写出这些数值，可以使我们知道各列百分率的基础，同时也使我们可以随时将百分率数值变回原来的次数值6）表内百分率数值的小数位要保留多少，视乎研究的需要，但最好是有一致性例如上表既然用 6.5 与 73.5，就要用 20.0 而不是 20，这个小数点后的 0 是有意义的，它表示全部百分率的计算都是以保留一位小数作准则二、相关分析（一）统计相关的性质1、所谓相关，是指一个变量的值与另一个变量的值有连带性也就是一个变量的值发生变化，另一个变量的值也发生变化，则两个变量就是相关的了2、两个变量之间的相关程度有强弱之分，可用统计法予以测量大多数统计 0 代表无相关，1 代表完全相关，介于0 和1 之间的数值越大，表示相关程度越强3、另一种值得注意的性质是相关方向，也可用统计法予以测量变量之间的关系可以分为正与负两个方向所谓正相关表示当一个变量的值增大时，另一个变量的值也增大；所谓负相关则表示当一个变量的值增加时，另一个变量的值却减少。

这里要注意，相关方向的分析只限于定序以上层次的变量，因为这些变量的值有高低或多少之分至于定类变量，则没有相关方向的问题4、虽然相关系数可以描述变量间关系的有无、大小和方向，但相关系数多大时才能断定两个变量有必然的、规律性的联系，是很难说的，在统计学中需要大于 0．7 以上，但社会现象间很少有这样密切的联系，所以研究人员一般要结合定性分析来断定事物内在的、本质的联系5、数据所显示的相关（或无关）关系，实际上也可能并不反映变量间存在（或不存在）有意义的关系二）相关测量法1、相关测量法就是以一个统计值表示变量与变量间的关系，这个统计值称为相关系数相关测量法有很多种，我们在选择时首先要注意变量的测量层次，不同层次的变量要用不同的相关测量法其次，要注意两个变量之间的关系是否对称对称关系是指两个变量X与Y,我们不确定或不区分两变量之间影响的方向反之，如果我们认为X影响Y,而Y不会影响X,这种情况称为不对称关系有些相关测量法假定变量之间具有对程关系，有些则假定是不对称关系另一项选择标准，就是统计值的意义有些相关测量法所计算出来的统计值除相关程度外，还含有其它意义，我们最好选择统计值有意义的相关测量法。

在统计学中有一组相关测量法，其统计值具有消减误差比例的意义，称为 PRE 测量法这组测量法常用在社会学研究中2、消减误差比例社会学研究的主要目标是预测或解释社会现象的变化比如有一种社会现象是Y（例如工资收入），我们就要预测或理解其变化的情况预测或解释时，难免会有误差（即错误）假定另一种社会现象X （例如文化水平）是与Y有关系的，如果我们根据X的值来预测Y的值（例如根据文化来估计其工资水平），理应可以减少若干误差而且， X 与 Y 的关系愈强，所能减少的预测误差就会愈多换言之，所消减的误差有多少，可以反映X与Y的相关强弱程度现在假定不知道X的值，我们在预测Y值时所产生的全部误差是E1如果知道X的值，我们可以根据X的每个值来预测Y值；假定误差的总数是E2,则以X值来预测Y值时所减少的误差就是：E1—E2这个数值（E1—E2）与原来全部误差（E1）相比，就是消减误差比例可用下面的公式表示：E1 ◎PRE= E1PRE的数值越大，就表示以X值预测Y值时能够减少的误差所占的比例愈大；也就是说，X与Y的关系愈强消减误差比例适用于各种测量层次的变量，但公式中的E1与E2的具体定义在不同层次的变量间，或同一层次的变量内部有所不同。

3、相关测量法测量不同层次的变量有不同形式的相关系数下面介绍几种相关系数：（1）、九相关：用于测量两个定类变量间的相关关系九相关测量法的基本逻辑是计算以一个定类变量的值来预测另一个定类变量的值时，如果以众数作为预测的准则，可以减除多少误差消减的误差在全部误差中所占的比例愈大，就表示这两个变量的关系愈强九相关测量法有两种形式：一种是对称形式，用九表示，即用于测量的两个变量间的关系是对等的，没有自变量与因变量之分；另一种是非对等的，用九y 表示，即所测量的两个变量有自变量与因变量之分，X是自变量，Y是因变量公式如下：（公式写错了）m 一 (M + M )y x y/2 n 一( Mx - My)Y m 一 M y yn 一 My其中， My=Y 变量的众数次数Mx=X 变量的众数次数my=X变量的每个值（类别）之下Y变量的众数次数mx=Y变量的每个值（类别）之下X变量的众数次数n 全部个案数目例1：根据下表（表10-3）的资料计算九系数表10-3性别与吸烟态度的交互分类（人）态度性别X合计Y男女赞同9618114反对246286合计12080200根据\系数公式有九=工 my-M = （96 + 62）-114 =0 51y n - 气 200 -114因此，我们可以说，性别与对吸烟态度之间存在中等程度的相关例 2 ：研究青年人的志愿与他们的知心朋友的志愿是否相关，得到下表的统计资料。

试计算九系数表 4 青年人与其知心朋友的志愿自己志愿知心朋友志愿快乐家庭理想工作增广见闻总数快乐家庭289340理想工作241750增广见闻24410总数325414100由于青年人的志愿与他们的知心朋友的志愿可能是相互影响的，难于区分何者是自变量或因变量，故用九相关测量法的对称形式根据九系数公式有:冶工 mx + 工 my-( Mx + My)=2、G相关：用于测量两个定序变量间的关系，用G来表示G系数值在－1 至＋1 之间，既表示相关的程度，也表示相关的方向，而且也都有消减误差比例的意义G 相关测量法的基本逻辑是：根据任何两个个案在某变量上的等级来预测他们在另一个变量上的等级时，可以减少的误差是多少换言之，G相关测量法是以每对个案之间的相对等级作为预测的准则G系数的计算公式是：G= N一NN Ns+ d式中Ns表示同序对数目，Nd表示异序对数目所谓同序对是指某对个案在两个变量上的相对等级相同，如果不相同，则称为异序对下面举例说明 Ns 和 Nd 的计算方法例 2 ：根据下表（10-4 ）的资料计算 G 系数表 10- 文化程度与收入的交互分类表收入水平文化程度大专以上下中学小学以高12103中8305低41612合计245620合计254332100表中计算同序对数量等于表内每个频数乘以其右下方全部频数之和，然后加总，而异序对数量则等于表内每个频数乘以其左下方全部频数之和，然后加总。

因而上例中：Ns=12（30+5+16+12）+10（5+12）+8（16+12）+30（12）=1510Nd=3（30+8+16+4）+10（8+4）+5（4+16）+30（4）=514G== Ns-N =1510-514 =0. 49N N 1510 + 514 s + d说明用文化程度去预测收入水平，可以消减 49%的误差。

点击阅读更多内容