
利用插补法求解组距数列的中位数和众数.docx
4页利用插补法求解组距数列的中位数和众数—、中位数(Median)工 |x - M | = min(最小)中位数是一组数据按从小到大排序后,处在中间位置上的变量值,用Me表示中位数 将全部数据等分成两部分,使一部分数据比中位数大,另一部分数据则比中位数小中位数 是一个位置代表值,它主要用于测定数据的集中趋势,且不受极端数值的影响此外,中位 数还具有一个性质,就是各变量值与中位数的离差绝对值之和最小,即i=1 ' ' (1)根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式n +1xn+1n若n为奇数,则中位数为2 ;若n为偶数,则为:中位数的位置=2 ,式中的n为数据的个数,凭此确定中位数的具体数值设有一 组数据从小到大排序后为Xi'X 2' X3‘…'Xxxn n中位数是2与2+1的平均数即Me = 式(3)中,假定 中位数所在组的频数在该组内是均匀分布的 *审*X人f 、审 < * * ** •-A C B图-1 组距数列中位数的分布图那么,我们接下来要讨论的是如何求证式(3),即组距数列中位数的计算公式假设上面图-1 是某组距数列次数分布图利用插补法进行比例推算图-1中,A点表示中位数所在组的下限,其值为L; B点表示中位数所在组的上限;C 点表示中位数所处的位置,其值为Me; A点到B点所夹的距离,也就是中位数所在组的组距,其值为i ; A点到C点所夹的距离,就是中位数所在组的下限到中位数位置的距离,其值设为X我们假定图-1中,AB区域即整个中位数所在的组内,次数分布是均匀的,依次 分布着fm个次数或频数同样,再假定AC区域内,次数分布也是均匀的,且依次分布着Sm-1为中位数所在组以前(4)LS 仝2 m 一1个次数或频数,式中的2是中位数所在的位置,各组的累积频数这样,我们可以得到下面的等式:A到C的距离=AC区域中的次数分布A至UB的距离—AB区域中的次数分布-Sm-1将上述假设代入式(4),得:-Sm-1所以,有(5)(6)中位数所在的位置是:将式(5)代入式(6),则:Me = L +If - S2 m -1xi上面的式(3)就得到了证明。 例一、设某车间50 名工人日加工零件数分组表如下: 表-1按零件数分组(个)频数(人)频率(%)105〜11036110〜115510115〜120816120〜1251428125〜1301020130〜135612135〜14048合计50100要求:计算该车间50 名工人日加工零件数的中位数解:由表-i可知,中位数的位置=250 二 25,根据累计频数可测得中位数在120〜125Sf这一组中,L=120, m-1=16,丿m =14,i =5,根据式(3),得50 -16=120 +14x 5 = 123.21(个)二、众数(Mode)众数是一组数据中出现次数最多的变量值,用Mo表示众数是一个位置代表值,它也 不受数列中极端数值的影响但它可以反映总体各单位某一标志值的集中趋势当然,在特 殊情况下,可能没有众数,也可能多于一个众数在实际应用中,众数用来说明现象的一般 水平众数的计算分两种情况,在未分组资料或单项数列中,可用观察法直接确定众数,即总 体中出现次数最多的标志值就是众数在组距数列中,确定众数时,先要确定次数最多的一组为众数组,然后根据数列的次数分布情况,计算众数的近似值用公式表示为:xi(7)A 1—A +A12式中,L为众数组的下限值;'为众数组的组距;A1是众数组的次数与靠近下限的邻组次 数之差;A2是众数组的次数与靠近上限的邻组次数之差。 面,我们仍要利用插补法推导组距数列中众数的计算公式,即式(7),为了能直观地介绍该方法,利用几何图解比较好理解图-2 组距数列中的众数位置图图-2 假定是组距数列的次数分布直方图,横坐标是组距,纵坐标是次数分布状况一 般来说,在等距数列中次数分布愈集中,直方柱愈高为了便于说明此问题,我们只画了三 根直方柱从图中可以看到,中间一组就是中位数所在的组,其次数分布最集中我们假定 G点是众数所在的组的下限,H点是众数所在的组的上限,GH的距离就是众数组的组距('), Mo点就是众数所处的位置从图中我们可以看出,众数的位置主要取决于众数所在组的左右两邻组的次数分布如 果左右两邻组的次数分布相等即高度相等(f 1 = f+i),无疑众数就在众数所在组的正中央; 如果左邻组的次数分布高于右邻组的次数分布(f_i > f+i),则Mo会偏向左边,靠近众数组 的下限;如果左邻组的次数分布低于右邻组的次数分布(f_i V f+i),则Mo会偏向右边,靠 近众数组的上限图-2中,我们连结AD和BC两条线段,它们的交点为O,而O点垂直连线与横坐标 轴的交点就是Mo,现假定G点到Mo的长度为X,则Mo到H点的长度是i —X。 另外, 假定众数所在组的次数为f ; AB的距离为人i,且人i = f — fi ; CD的距离为人2,且人2 =f — f+i由于OMo是垂直连线,EO=GMo =X; OF= MoH= i —XG点是众数所在组的 下限,其值为L我们从图-2中可以发现‘△AOB^ACOD,根据相似三角形的性质,这两个相似三角 形所对应的底边和高成比例,即(8)(9)AB _ EO ~CD~~OF将上述的设定分别代入式(8),则A X1 = A i - X2化简得:X = i x iA +Ai由于Mo = L + XAM = L + i x io A + A所以, i 2这样,组距数列的众数计算公式得以证明例二、根据表-1的数据,计算50名工人日加工零件数的众数解:从表-1中的数据可以看出,出现频数最多的是14,即众数组为120〜125这一组,根据 式(7)得50名工人日加工零件数的众数为:M = 120 + x 5 = 123(个)(i4 - 8) + (i4 -i0)。
