
一种识别及处理特高品位值的新方法.docx
7页一种识别及处理特高品位值的新方法摘 要: 通过对目前特高品位值识别及处理方式进行综合分析评价,提出一种新的特高品位值识别及处理方式新方法采用准则判断特高品位值及特高品位值个数产生一组数目为样本数目的数据,要求这组数据符合样品统计分布规律将样品和随机数都由大到小排序,用相应序列的随机数代替特高品位值在实例分析时,新方法处理之后其品位分布特征的峰度、偏度均大幅度下降,并且品位均值和标准差均无较大变化对比应用品位变化系数法处理的结果,在峰度和偏度下降相当时,品位值更加接近原始数据,说明新方法处理结果较为合理关键词: 特高品位值;随机数;地质统计学;统计分布;品位变化系数法1 引言采用地质统计学方法对矿床储量进行估计的过程中,需要对特异值进行处理,然后将处理之后的品位值作为储量估算的原始数据特高品位对矿床资源储量的估算影响较大,在对矿床资源储量进行估算时,很有必要对特高品位进行处理特高品位值的处理至今没有一个可以被普遍接受的方法目前主要采用准则[1]、估计邻域法[2]、影响系数法[2,3]、邻近点数据比较法[1]、品位变化系数法[4,5]、分布函数法[5,6]等,这些方法在识别和处理特高品位值的过程中存在对品位分布特征分析不足、识别及处理过程人为影响因素大、关键参数选择缺乏科学理论依据等一系列问题,在处理单一矿床特高品位的时候,有必要采用一种能够反映矿床品位分布特征且可操作性强的处理方式,以降低特高品位值对矿床真实储量的影响。
2 特高品位值识别及处理评价2.1 特高品位值对资源储量估算的影响当在地质勘探及矿山地质研究中出现特异值(高值)时,称之为特高品位[2]特高品位一般具有特点[2,7]:比所研究的全部数据的算术平均值或中位数的数值要高得多;存在于所研究的母体之中,不是采样或化验分析等所引起的认为误差;只占所研究数据的极少部分,但是对全部数据的统计结果影响较大;存在于所研究母体的一定空间位置特高品位导致的结果[8]主要有:(1)影响数据统计参数的变化,并且影响实验变异函数的性状;(2)影响特异值周围的矿块品位,从而导致高估矿石量和金属量;(3)在使用克里格估计过程中也可能产生奇异的样品权系数,如负的权系数资源储量估算的准确性关系到整个矿床资源的开发利用,涉及到大量的人力物力投入而特异值的存在使得资源储量估算存在很多偏差和不准确性因此所有的特异值都有必要受到特殊的处理,其中包括在可能的情况下重新化验分析样品、根据经验将数据限制在一定的范围之内[8]2.2 特异值识别及处理方法评述孙玉建[8]认为如果发现特高品位是分析错误或反应了截然不同的地质子环境或者是一个矿床的特殊的域,就应该采取措施检查这个高值并分析其地质意义,以排除是由于分析错误造成的;如果高值是真实的值,就要分析如何将这些高值融入到资源量估算任务之中。
在特高品位处理过程中都要求的是不能给特异值过高的权重在地质勘探中,特异值识别方式[7]主要有:(1)按照样品均方差的倍数来确定是否是特高品位,即特高品位值大于或等于m+3σ(其中m为均值,σ为均方差);(2)按照样品品位变化系数(v=σ/m)来识别特高品位;(3)在分布密度函数曲线上将拐点对应值作为特高品位的下限值特异值处理方法[9~10]主要包括:将特异值去掉,不参加统计;用正常值的最大值代替特异值;用以剔除特高品位或包括特高品位的平均品位代替特高品位值;用特高品位相邻两侧的样品或包括特高品位在内的三个连续样品品位值代替特高品位;用前述各种方法确定特高品位下限值代替特高品位的样品另外刘振升还提到采用概率分布函数法识别特异值,认为特高品位相邻两个或3个或4个样品品位的平均值代替特高品位比较实用[11]所有这些方法在生产实践中也不同程度的发挥了作用,但也存在着某些容易忽视的缺点,例如只是经验而无统计意义,或未将特异值与正常值置于同一领域来研究等[2]目前所采用的识别及处理方式评价如下:(1)准则[1]方法,以样本平均值加减三倍标准差作为区间,如果数据分布在区间意外,则定为特异值,然后分别用正常最大和正常最小值代替特异值。
2)估值邻域法[2,3],是由D.G.克立格和D.M霍斯把地质统计学的基本思想用于识别和处理特异值的方法,它是一种把被识别的观测值(称为可疑样品)置于一个空间连续矿化域的背景上进行研究[2]在使用该法时,其中的n、以及替代值的确定都是人为确定,没有一致的标准;在面对大量数据的时候,可操作性不强3)影响系数法,该法是通过认为确定特异值的影响程度进行特异值的识别和处理[2,3],采用此法是,过程相对比较繁琐,而且参数K值的确定存在模糊性4)邻近点数据比较法[1],将常规统计特征与空间位置关系相结合,在判断样点数据是否可疑时,需要将该数据与总体数据进行比较外,还要将该数据与周围邻近的8点的数据进行比较在实际操作时很难在拿到样点数据时想象出空间数据进行分析,而且也没有给出相关处理特异值的方法,所以实际操作上存在困难5)品位变化系数法,有两种实现方式,一种是程宗芳提出的采用估值块段方法确定品位变化系数[4],另外一种是采用矿体均方差和矿体算术平均品位来计算品位变化系数[5]在使用时,如果品位空间位置不明朗,采用后一种方法更加便于实际操作,不过不能反映出品位分布特征对特高品位处理的影响,存在局限性。
6)分布函数法[6],用概率分布函数来确定矿石的特高品位体现了用偶然性的角度来判断特高品位,能更接近矿床的实际情况能够判断出在n个样品中出现高品位值的客观实际性在识别及处理特高品位值时,要考虑到统计矿区可用品位的分布规律,应用概率统计的方式,给定品位值在一定置信水平(通常为95%)的期望值,再结合实际应用此统计分布规律去随机产生一些符合概率分布的一组数来代替特高品位值3 一种新的特高品位值识别及处理方式根据经验得知,单铜金属矿体的品位值的统计分布规律基本上符合对数正态分布,因此在进行特高品位值处理的时候首先要对其数据进行正态分布转化,然后得出其某一置信水平(95%)的期望值以及相应的统计分布特征,以此为基础进行特高品位值的识别及处理3.1 特高品位值数据前处理常用的正态变换方法[10]主要有:(1)对数变换:对于j个样品第i个变量,对数变换后的变量为,式中C为常数,当分析样品中有小于1的数据时,在取对数后会出现较大的负数,因此按照公式加常数后再取对数[12];(2)平方根变换:;(3)反正弦和反余弦变换:或者;其中n是正整数,相当于变量初始观测值中最大值的整数位数以上三种方法都属于使偏态变量接近于正态的变换方法,若数据的频率分布曲线右偏,则用反正弦变换;若是频率分布曲线左偏,按长尾收敛程度选择变换方法,左偏程度较大时采用对数变换,偏度中等采用平方根变换,弱左偏采用反余弦变换。
如果区分偏倚程度的尺寸很难掌握,就对同一变量进行多种方法的变换,从中选出适当的变换方法3.2 概率统计分布及特高品位值识别 将数据进行正态分布转换后,统计其期望、标准差,以及峰度、偏度等参数,采用准则[1]判断其特高品位临界值及特高品位值个数即样本平均值(这里用期望)加上3倍的标准差,大于这个和值的数据定为特高品位值,并统计其个数3.3 特高品位值处理采用统计分布中的期望及标准差,通过计算机随机产生一组数目为可用样品数目的随机数,这组随机数要求满足原始样品的正态统计分布规律,这里是满足相应的矿体对数转换后的品位值的统计分布规律将这一组数和特高品位值都从大到小进行排序,利用随机数分别代替相应序列的特高品位值4 工程实例以四川某铜矿为例,通过地质分析得出共有三个主要矿体1号矿、2号矿、3号矿进行资源储量估算时,可用样品品位总数为912个统计分布图形采用SPSS13进行处理可用品位分布直方图见图1,左偏程度较大,采用对数转换数据,按照式进行转换,见图2,对所有Cu品位对数转化后进行Q-Q校验分析见图3由图可见整个矿区Cu品位呈现对数正态分布图1 所有Cu品位分布直方图Fig.1 All Cu grade distribution histogram 图2 所有Cu品位对数转化后分布直方图Fig.2 Logarithmic transformation of all Cu grade distribution histogram图3 所有Cu品位对数转化后Q-Q校验图Fig.3 Logarithmic transformation of all Cu grade of Q-Q parity map4.1 新方法处理鉴于三个矿体之间相关性不强,有必要分别对三个矿体进行特高品位值处理。
对三个矿体分别按照(0.3,0.5)和(0.5,+∞)分成低品位矿体和工业矿体其中由于3号低品位矿体样品数为5个,不构成统计分布的条件,不对其进行处理,这里只统计了其分布特征而2号低品位矿体中经判断没有特高品位值其中1号矿体工业矿品位的统计分布曲线见图4~6,从图6的Q-Q校验图看出1号工业矿体满足正态对数分布采用新方法对1号矿体进行特高品位值处理情况见表1图4 1号工业矿Cu分布直方图Fig.4 Histogram of 1 industrial mineral Cu图5 1号工业矿体Cu对数转换后分布直方图Fig.5 Logarithmic transformation of 1 industrial mineral Cu grade distribution histogram图6 1号工业矿体对数转换后Q-Q校验图Fig.6 Logarithmic transformation of 1 industrial mineral Cu grade of Q-Q parity map1号工业矿体通过新方法判断总共有5个特高品位,其特高品位处理见表1,处理的特高品位值降幅在20%~40%。
表1 1号工业矿体特高品位处理表Table 1 Treatment table of 1 industrial mineral Cu extra-high-grade矿体特高品位编号处理前品位(%)处理后品位(%)品位降幅(%)特高品位临界值(%)1号工业矿15.973.82136.003.99324.723.79519.5934.73.54024.6844.523.34825.9354.413.08330.10对1号、2号、3号矿体进行特高品位处理的结果统计见表2,其中置信度一栏的数据是通过统计分析其矿床平均品位值在可行度达到95%以上时的偏差值由表2中可见处理过后的样品平均品位、标准差、方差降低较少,而峰度、偏度等均有较大降幅,说明处理之后的数据更加符合矿体品位的统计分布规律表2 新方法处理矿体特高品位综合统计表Table 2 New approach to Cu extra-high-grade comprehensive tables元素矿体平均品位(%)标准差方差峰度偏度置信度(95%)样品数(个)处理样品数(个)处理前Cu1号工业矿体1.0550.8420.7106.1592.1300.0853825处理后Cu1号工业矿体1.0370.7720.5952.5411.5880.078处理前Cu1号低品位矿体0.3520.1760.0316.2761.4930.0281502处理后Cu1号低品位矿体0.3450.1500.0230.4350.2160.024。
