
Matlab数据归一化.docx
11页1. 数据预处理 在训练神经网络前一般需要对数据进行预处理,一种重要的预处理手段是归一化处理下面简要介绍归一化处理的原理与方法1) 什么是归一化? 数据归一化,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,比如(0.1,0.9) 2) 为什么要归一化处理? <1>输入数据的单位不一样,有些数据的范围可能特别大,导致的结果是神经网络收敛慢、训练时间长<2>数据范围大的输入在模式分类中的作用可能会偏大,而数据范围小的输入作用就可能会偏小<3>由于神经网络输出层的激活函数的值域是有限制的,因此需要将网络训练的目标数据映射到激活函数的值域例如神经网络的输出层若采用S形激活函数,由于S形函数的值域限制在(0,1),也就是说神经网络的输出只能限制在(0,1),所以训练数据的输出就要归一化到[0,1]区间<4>S形激活函数在(0,1)区间以外区域很平缓,区分度太小例如S形函数f(X)在参数a=1时,f(100)与f(5)只相差0.00673) 归一化算法 一种简单而快速的归一化算法是线性转换算法线性转换算法常见有两种形式: <1>y = ( x - min )/( max - min ) 其中min为x的最小值,max为x的最大值,输入向量为x,归一化后的输出向量为y 。
上式将数据归一化到 [ 0 , 1 ]区间,当激活函数采用S形函数时(值域为(0,1))时这条式子适用 <2>y = 2 * ( x - min ) / ( max - min ) - 1 这条公式将数据归一化到 [ -1 , 1 ] 区间当激活函数采用双极S形函数(值域为(-1,1))时这条式子适用4) Matlab数据归一化处理函数 Matlab中归一化处理数据可以采用premnmx , postmnmx , tramnmx 这3个函数<1> premnmx语法:[pn,minp,maxp,tn,mint,maxt] = premnmx(p,t)参数:pn: p矩阵按行归一化后的矩阵minp,maxp:p矩阵每一行的最小值,最大值 ,主要用于归一化处理训练数据集<2> tramnmx语法:[pn] = tramnmx(p,minp,maxp)参数:minp,maxp:premnmx函数计算的矩阵的最小,最大值pn:归一化后的矩阵作用:主要用于归一化处理待分类的输入数据<3> postmnmx语法: [p,t] = postmnmx(pn,minp,maxp,tn,mint,maxt)参数:minp,maxp:premnmx函数计算的p矩阵每行的最小值,最大值mint,maxt:premnmx函数计算的t矩阵每行的最小值,最大值作用:将矩阵pn,tn映射回归一化处理前的范围。
postmnmx函数主要用于将神经网络的输出结果映射回归一化前的数据范围 有关mapminmax的用法详解 by faruto==================================几个要说明的函数接口:[Y,PS] = mapminmax(X)[Y,PS] = mapminmax(X,FP)Y = mapminmax('apply',X,PS)X = mapminmax('reverse',Y,PS)用实例来讲解,测试数据 x1 = [1 2 4], x2 = [5 2 3];>> [y,ps] = mapminmax(x1)y = -1.0000 -0.3333 1.0000ps = name: 'mapminmax' xrows: 1 xmax: 4 xmin: 1 xrange: 3 yrows: 1 ymax: 1 ymin: -1 yrange: 2其中y是对进行某种规范化后得到的数据,这种规范化的映射记录在结构体ps中.让我们来看一下这个规范化的映射到底是怎样的?AlgorithmIt is assumed that X has only finite real values, and that the elements of each row are not all equal.· y = (ymax-ymin)*(x-xmin)/(xmax-xmin) + ymin;· [关于此算法的一个问题.算法的假设是每一行的元素都不想相同,那如果都相同怎么办?实现的办法是,如果有一行的元素都相同比如xt = [1 1 1],此时xmax = xmin = 1,把此时的变换变为y = ymin,matlab内部就是这么解决的.否则该除以0了,没有意义!]也就是说对x1 = [1 2 4]采用这个映射 f: 2*(x-xmin)/(xmax-xmin)+(-1),就可以得到y = [ -1.0000 -0.3333 1.0000]我们来看一下是不是: 对于x1而言 xmin = 1,xmax = 4;则y(1) = 2*(1 - 1)/(4-1)+(-1) = -1; y(2) = 2*(2 - 1)/(4-1)+(-1) = -1/3 = -0.3333; y(3) = 2*(4-1)/(4-1)+(-1) = 1;看来的确就是这个映射来实现的.对于上面algorithm中的映射函数 其中ymin,和ymax是参数,可以自己设定,默认为-1,1;比如:>>[y,ps] = mapminmax(x1)>> ps.ymin = 0;>> [y,ps] = mapminmax(x1,ps)y = 0 0.3333 1.0000ps = name: 'mapminmax' xrows: 1 xmax: 4 xmin: 1 xrange: 3 yrows: 1 ymax: 1 ymin: 0 yrange: 1则此时的映射函数为: f: 1*(x-xmin)/(xmax-xmin)+(0),是否是这样的这回你可自己验证.O(∩_∩)O如果我对x1 = [1 2 4]采用了某种规范化的方式, 现在我要对x2 = [5 2 3]采用同样的规范化方式[同样的映射],如下可办到:>> [y1,ps] = mapminmax(x1);>> y2 = mapminmax('apply',x2,ps)y2 = 1.6667 -0.3333 0.3333即对x1采用的规范化映射为: f: 2*(x-1)/(4-1)+(-1),(记录在ps中),对x2也要采取这个映射.x2 = [5,2,3],用这个映射我们来算一下.y2(1) = 2(5-1)/(4-1)+(-1) = 5/3 = 1+2/3 = 1.66667y2(2) = 2(2-1)/(4-1)+(-1) = -1/3 = -0.3333y2(3) = 2(3-1)/(4-1)+(-1) = 1/3 = 0.3333X = mapminmax('reverse',Y,PS)的作用就是进行反归一化,讲归一化的数据反归一化再得到原来的数据:>> [y1,ps] = mapminmax(x1);>> xtt = mapminmax('reverse',y1,ps)xtt = 1 2 4此时又得到了原来的x1(xtt = x1);=================================Matlab 数字归一化问题(by yingzhilian) 1],prestd归一到单位方差和零均值。
3)关于自己编程一般是归一到[0.1 0.9] 具体用法见下面实例为什么要用归一化呢?首先先说一个概念,叫做奇异样本数据,所谓奇异样本数据数据指的是相对于其他输入样本特别大或特别小的样本矢量下面举例:m=[0.11 0.15 0.32 0.45 30; 0.13 0.24 0.27 0.25 45];其中的第五列数据相对于其他4列数据就可以成为奇异样本数据(下面所说的网络均值bp)奇异样本数据存在所引起的网络训练时间增加,并可能引起网络无法收敛,所以对于训练样本存在奇异样本数据的数据集在训练之前,最好先进形归一化,若不存在奇异样本数据,则不需要事先归一化具体举例:close allclearecho onclc%BP建模%原始数据归一化 m_data=[1047.92 1047.83 0.39 0.39 1.0 3500 5075; 1047.83 1047.68 0.39 0.40 1.0 3452 4912; 1047.68 1047.52 0.40 0.41 1.0 3404 4749; 1047.52 1047.27 0.41 0.42 1.0 3356 4586; 1047.27 1047.41 0.42 0.43 1.0 3308 4423; 1046.73 1046.74 1.70 1.80 0.75 2733 2465; 1046.74 1046.82 1.80 1.78 0.75 2419 2185; 1046.82 1046.73 1.78 1.75 0.75 2105 1905; 1046.73 1046.48 1.75 1.85 0.70 1791 1625; 1046.48 1046.03 1.85 1.82 0.70 1477 1345; 1046.03 1045.33 1.82 1.68 0.70 1163 1065; 1045.33 1044.95 1.68 1.。












