
【统计】笔记2.doc
28页统计表:每列一种性质,第一行是概括该列性质的,最后一行(和最后一列)是总计统计图:X轴是基线,表示被观察的现象;Y轴是尺度线,表示其数量能够分析发展趋势的是:线形图数据类型举例能否数学运算统计方法称名数据男、女只是数字符号,无数量意义,不能代数运算百分比、次数、众数、检验(考点)顺序数据第一名、第二名、第三名特别注意:职称只表等级、程度;无绝对零点,无相等单位,既不表示真正数量,也不表示绝对数值,不能代数运算中位数、百分位数、等级相关、肯德尔和谐相关(考点)从本质上讲,心理测验是顺序量表,因为无绝对零点、无相等单位所以心理测验一直尝试将顺序量表转化为等距量表标准九分数、导出分数)等距数据摄氏温度℃、智商指代类别,具有等级,有相等单位而且等距,可加减;无绝对零点,不能乘除平均数、标准差、积差相关系数、t检验(考点)、F检验比率数据最高水平的数据,有绝对零点,能加减乘除除了上述,还有几何平均数(知道是什么)、变异系数CV(08年考过,不用当重点了,知道怎么计算就行)例:(07年)等距量表的特点是()A无绝对零点,无相同单位 B无绝对零点,有相同单位 C有绝对零点,无相同单位 D有绝对零点,有相同单位答:B例:(08年)下列量表中,具有绝对零点的是()A称名量表 B顺序量表 C等距量表 D比率量表答:D例:(09年)教师的职称和薪水这两个变量的数据类型分别属于()A命名数据和等比数据 B等距数据和等比数据 C顺序数据和等距数据 D顺序数据和等比数据答:D数据类型离散型条形图、圆形图 没有中间值。
例:男、女)连续型直方图、次数分布多边形、线形图、累加次数分布图(累加直方图、累加曲线)、散点图两个数之间可以无限分下去例:时间的秒、毫秒、微秒)在统计里,连续变量代表的是一个区间,而不是一个点例:23代表从22.5到23.5这个区间例:(07年)用于描述两个变量之间相关关系的统计图是()A直方图 B线形图 C条形图 D散点图答:D例:(09年)根据测验中不同维度或分测验的导出分数,绘制形成的折线图或柱形图称为()A结构图 B碎石图 C剖面图 D茎叶图答:C组距= 精确上限-精确下限(例:10~19的组距是10)(其实一般不这么写,而写成10~)(特别注意)组中值= 精确下限 + 组距的一半全距R=最大值-最小值(不用考虑精确上下限)例:(07年)现有一列数据,它们是4,4,5,3,5,5,2这列数据的平均数、众数和全距依次是()答:4,5,3如何求中数:“画木块”使中数两边的木块数相等推广:数字不连续也没关系,可以省略没有次数的区间例:求11、11、11、11、13、13、13、17的中数求中数的题只会这一道就行了)答案:12.67(特别注意:精确下限!设x)口诀中数永远在中间,众数人多站高峰,均数认真作重心,正态分布三合一。
皮尔逊经验法:Mo=3Md-2M(众=3中-2平)正态分布三数重合,正偏态则M>Md>Mo,负偏态则M x40~4930~3920~2910~190~9f101015105cf(累积)504030155c%10080603010解: = x=26.17(根据梯形做辅助线推导出来)(在用差值法求百分等级时,要代入精确组限)四分位差=中间50%的次数距离的一半=P25到P75距离的一半平均差= 离差绝对值的平均值(带着绝对值平均,否则为0)和方Sum of squareSS=Σ =Σ- 离均差平方之和,是全部数据对平均数离散程度的指标,由于和方具有可分解的性质,因而在方差分析中有重要作用回忆线索:看到SS,就想到张P93那堆方块相加)经验值:标准差= 或全距(可以用来验算例:μ=142,σ=54)(如果有一个值在±3S以外,在整理数据时,可作为异常值舍弃)(S也就是SD)利用各组方差和平均数求总方差时,分母(每一项都×n)别忘了加上各组平均数与总平均数之差的平方(即要考虑各组平均数之间的方差)(非中心极限定理也适用)例:(09年)一组数据中每个数的值都是5,那么这组数据的标准差和方差分别是()A0,0 B5,25 C0,5 D0,25答:A绝对差异量标准差的单位与原数据的单位相同,因而有时称它为绝对差异量。 可以理解为标准差带着原来的单位)相对差异量差异系数(变异系数、相对标准差),标比平的百分比CV= ×100%用途:①同一团体不同观测值离散程度的比较②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较例:智商的相对标准差是0.15,而心理统考的相对标准差是0.38,说明人们在考研分数上的离散程度大于在智商上的离散程度例:(08年)一组数据的平均数是100,标准差是25,这组数据的变异系数是()A4% B25% C4 D25答:B抽样方法简单随机取样常简称为随机取样对总体中所有个体不作任何有意挑选,所有个体都相互独立并以相等概率被选取的取样法等距抽样也叫机械抽样或系统抽样把所有个体按一定顺序编号,然后每隔若干个抽取一个如每隔10个,每第三列等分层取样在取样前,研究者根据已有的或与研究目的有关的某种标准,将群体中的个体分为若干类或组,称为“层”;然后在各层中随机取出若干个体作为样本① 按各层人数比例分配这是在各层内的标准差未知时常用的分配方式,基本思想是人数多的层多分配,人数少的层少分配② 最佳分配若各层内的标准差已知,在根据各层人数比率的同时还要考虑各层标准差标准差大的层多分配,标准差小的层少分配。 两阶段随机抽样在实际研究中,对于大范围的调查一般采取阶段抽样方法,如第一阶段先以城市为抽取单位,从全国所有城市中随机抽取一部分城市;第二阶段再从所选取的城市中随机抽取调查对象为获得正确定义的概率,个体的选择一定要完全随机抽样:每个个体被抽机会均等(放回)且彼此之间被抽机会独立若抽样没有完全代表总体,最后的变化结果可能会不纯洁抽样误差的特性:不可预测性、分析统计非对称性、永远存在例:(08年)抽样的基本原则是()A随机化原则 B标准化原则 C概括化原则 D等距化原则答:A后验概率:观察n次以后的总结先验概率:若符合一定条件,可直接计算,结果与真实概率一样乘法定律:两个独立事件同时出现的概率等于两事件概率之积(想象一个表格:行×列)加法定律:两个互不相容事件A、B之和的概率,等于两个事件概率之和例:得优的概率是0.1,得良的概率是0.5,则得优或良的概率是0.6)例:(08年)简述正态分布与标准正态分布的区别与联系张P163正态分布标准正态分布区别平均数为μ,标准差为σ;不同的正态分布可能有不同的μ值和σ值;平均数为0,标准差为1,μ和σ都是固定值;正态分布曲线的形态因此不同标准正态分布曲线形态固定。 联系正态分布可以通过标准化处理,转化为标准正态分布具体方法是用Z= 将原始数据转化为标准分数Z分数:离平均数有几个标准差)标准分数Z的计算必考选择(张P165图)标准分数对应原始分数±1S±3S±4S±1.96S±2.58S68.26%99.74%99.99%95%99%要会表述:正负几个标准差包含所有数据的百分之多少大于3个标准差为异常值,可舍弃例:(07年)已知某次学业成就测验的平均分数是80,标准差为4如果某考生得分为92,则该分数转换为标准分后是()A1 B2 C3 D4答:C例:(07年)在标准正态分布曲线下,正、负1个标准差范围内的面积占曲线下总面积的()A25.00% B34.13% C50.00% D68.26%答:D例:(09年)在标准正态曲线下,正、负三个标准差范围内的面积占总面积的比例是()A99.73% B99.00% C95.46% D95%答:A关于单双侧的问题:1.96、2.58对应的是双侧检验而某些情况,如判断题的正确率在95%以上就算真会,不是瞎猜,则属于单侧检验张P186例6-5)教师给学生的等级评定转化成Z分数时,要用所占等级比率的一半来找对应的Z分数。 等级对应一定的百分比,将等级的中值对应的累积百分比视为正态分布的概率)某一标准分对应的比率要从0点找测验分数的正态化定义将样本原始分数分布转换成正态分布原理利用改变次数的方法,将原来偏态分布中众数所偏的一边拉长,使之成为正态,这是一种非线性转换T分数定义T分数是从Z分数转换而来的一种正态化的标准分数公式T=10Z+50性质①无负值;②不等距(原始分数等距)用途心理与教育测验常用它来建立常模步骤① 先将原始分数正态化(非线性转换)② 把正态化的Z分数代入公式(线性转换)例:(07年)将Z分数转换成T分数时,需要进行()A正态化转换 B非正态化转换 C线性转换 D非线性转换答:C例:(09年)某次高考分数呈正态分布,以此为基础可以()A计算考生的标准分数 B由P值,计算Z值 C确定某一分数界限内的考生比例 D知道计划录取人数后确定录取分数线答:ABCD二项试验的条件①两种结果(成功或失败);②每次试验中成功概率和失败概率保持不变;③n次试验;④试验之间相互独立②④是理想情况)二项分布设有n次试验,各试验之间彼此独立,每次试验成功的概率是p,失败的概率是q(q=1-p),则x次成功的概率是b(x,n,p)= Cnxpxqn-x 其中Cn。
