
DSP浮点转定点方法总结.doc
27页目录定点运算措施 31.1 数 的 定 标 31.2 c语言:从浮点到定点 41.2.1 加法 41.2.2乘法 61.2.3除法 71.2.4 三角函数运算 81.2.5 开方运算 91.3 附录 101.3.1 附录1:定点函数库 101.3.2附录2:正弦和余弦表 28定点运算措施1.1 数 的 定 标对某些解决器而言,参与数值运算的数就是16位的整型数但在许多状况下,数学运算过程中的数不一定都是整数那么,如何解决小数的呢?应当说,解决器自身无能为力那么是不是就不能解决多种小数呢?固然不是这其中的核心就是由程序员来拟定一种数的小数点处在16位中的哪一位这就是数的定标通过设定小数点在16位数中的不同位置,就可以表达不同大小和不同精度的小数了数的定标用Q表达法表1.1列出了一种16位数的16种Q表达能表达的十进制数值范畴和近似的精度Q表达精度(近似)十进制数表达范畴Q150.00002-1≤X≤0.9999695Q140.00005-2≤X≤1.9999390Q130.0001-4≤X≤3.9998779Q120.0002-8≤X≤7.9997559Q110.0005-16≤X≤15.9995117Q100.001-32≤X≤31.9990234Q90.002-64≤X≤63.9980469Q80.005-128≤X≤127.9960938Q70.01-256≤X≤255.9921875Q60.02-512≤X≤511.9804375Q50.04-1024≤X≤1023.96875Q40.08-2048≤X≤2047.9375Q30.1-4096≤X≤4095.875Q20.25-8192≤X≤8191.75Q10.5-16384≤X≤16383.5Q01-32768≤X≤32767表1.1 Q表达、S表达及数值范畴从表1.1可以看出,同样一种16位数,若小数点设定的位置不同,它所示的数也就不同。
例如:16进制数H=8192,用Q0表达16进制数H=0.25,用Q15表达从表1.1还可以看出,不同的Q所示的数不仅范畴不同,并且精度也不相似Q越大,数值范畴越小,但精度越高;相反,Q越小,数值范畴越大,但精度就越低例如,Q0的数值范畴是-32768到+32767,其精度为1,而Q15的数值范畴为-1到0.9999695,精度为 1/32768 = 0.00003051因此,对定点数而言,数值范畴与精度是一对矛盾,一种变量要想可以表达比较大的数值范畴,必须以牺牲精度为代价;而想提高精度,则数的表达范畴就相应地减小在实际的定点算法中,为了达到最佳的性能,必须充足考虑到这一点浮点数与定点数的转换关系可表达为:浮点数(x)转换为定点数():定点数()转换为浮点数(x):例如,浮点数 x=0.5,定标 Q=15,则定点数=,式中表达下取整反之,一种用 Q=15 表达的定点数16384,其浮点数为16384×2-15=16384/32768=0.51.2 c语言:从浮点到定点下面所描述的几种基本运算是浮点到定点转换中常常遇到的,从中可以体会到某些基本的技巧和措施1.2.1 加法设浮点加法运算的体现式为:float x,y,z;z=x+y;将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值同样。
若两者不同样,则在做加法/减法运算前先进行小数点的调节为保证运算精度,需使Q值小的数调节为与另一种数的Q值同样大此外,在做加法/减法运算时,必须注意成果也许会超过16位表达,即数的动态范畴如果加法/减法的成果超过16位的表达范畴,则必须保存32位成果,以保证运算的精度1. 成果不超过16位表达范畴设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法/减法成果z的定标值为Qz,则z=x+y Þ= = Þ 一般状况,我们取x,y和z的定标值相似,即Qx = Qy = Qz = Qa 因此定点加法可以描述为: short x, y, z ; //Qa z = add (x,y); //Qa函数add ( ) 有防饱和机制,如果可以确信x + y 不会溢出(-2^15 <= z < = 2^15-1),可以直接写为 z = x + y .定点减法: short x, y, z ; //Qa z = sub (x,y); //Qa函数sub ( ) 有防饱和机制,如果可以确信x - y 不会溢出(-2^15 <= z < = 2^15-1),可以直接写为 z = x - y .2. 成果超过16位表达范畴设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法成果z的定标值为Qz,则定点加法为:int x,y;long temp,z;temp=y<<(Qx-Qy);temp=x+temp;z=temp>>(Qx-Qz),若Qx≥Qzz=temp<<(Qz-Qx),若Qx≤Qz一般状况,我们取x,y和z的定标值相似,即Qx = Qy = Qz = Qa 。
因此定点加法可以描述为: int x, y, z ; //Qa z = L_add (x,y); //Qa函数L_add ( ) 有防饱和机制,如果可以确信x + y 不会溢出(-2^31 <= z < = 2^31-1),可以直接写为 z = x + y .定点减法: int x, y, z ; //Qa z = L_sub (x,y); //Qa函数L_sub ( ) 有防饱和机制,如果可以确信x - y 不会溢出(-2^31 <= z < = 2^31-1),可以直接写为 z = x - y .3. 成果超过32位表达范畴这种状况下位数超过了原则c语言的数的表达范畴,只能用数组来保存变量定点加法可以描述为: #define NN_DIGIT unsigned intNN_DIGIT x [digits], y [digits], z [digits] ;//QaNN_Add (z, x, y, digits) ; //Qa定点减法:NN_DIGIT x [digits], y [digits], z [digits] ; //QaNN_Sub (z, x, y, digits) ; Qa应注意的是以上32位定点加减法都是无符号数操作。
1.2.2乘法1. 16位乘法设浮点乘法运算的体现式为:float x,y,z;z = xy;假设通过记录后x的定标值为Qx,y的定标值为Qy,乘积z的定标值为Qz,则z = xy Þ= Þ =因此定点表达的乘法为:short x; //Qxshort y; //Qyint z ; //Qzz = L_mult(x, y) >> (Qx+Qy+1-Qz);上式中x乘y的定标本来应当是Qx + Qy, 但为理解决以便,函数L_mult( ) 多乘了一次2,因此要再加1函数L_mult ( ) 有防饱和机制,如果可以确信z = x y 不会溢出(-2^31 <= z < = 2^31-1),可以直接写为z = (xy) >>(Qx+Qy-Qz)2. 成果超过32位表达范畴这种状况下位数超过了原则c语言的数的表达范畴,只能用数组来保存变量定点乘法可表达为:#define NN_DIGIT unsigned int NN_DIGIT x [digits]; NN_DIGIT y [digits]; NN_DIGIT z [2* digits]; NN_Mult (z, x, y, digits);应注意的是以上32位乘法都是无符号数操作,如果需要做有符号数乘法,则需要根据乘数的符号来判断。
例1 设x = 18.4,y = 36.8,则浮点运算值为z =18.4×36.8 = 677.12;设 Qx = 10,Qy = 9,Qz = 5,因此int x = 18841;//Q10int y = 18841;//Q9z = L_mult(18841, 18841)>>(10+9+1-5) = L>>14 = 21666;由于z的定标值为5,故定点 z = 21666即为浮点的 z = 21666/32 = 677.08例2设x = 18.4,y = 36.8,则浮点运算值为z =18.4×36.8 = 677.12;#define NN_DIGIT unsigned int 设Qx = 20, Qy = 20, Qy = 20, 因此 NN_DIGIT x = 18.4 * (1<<20); //Q20 NN_DIGIT y = 36.8 * (1<<20); //Q20 NN_DIGIT z[2]; //Q20NN_Mult(z, &x, &y, 1); //Q40NN_Rshift(z, z, 20, 1); //Q(40-20)1.2.3除法1. 32位除法设浮点除法运算的体现式为:float x,y,z;z = x/y;假设通过记录后被除数x的定标值为Qx,除数y的定标值为Qy,商z的定标值为Qz,则z = x/y Þ = Þ因此定点表达的除法为:int x,y,z;z = L_shl(x, (Qz-Qx+Qy) )/y; //Qz2. 32位以上的除法这种状况下位数超过了原则c语言的数的表达范畴,只能用数组来保存变量。
define NN_DIGIT unsigned int NN_DIGIT x [2*digits]; //Qx NN_DIGIT y [digits]; //Qy NN_DIGIT z [digits]; //QzNN_Lshift(x, x, (Qz-Qx+Qy), 2);NN_Div(z, x, 2*digits, y, digits); 做以上运算是要保证Qz-Qx+Qy <32, 否则要多次移位来实现;应注意的是以上除法都是无符号数操作,如果需要做有符号数除法,需要根据被除数和除数的符号来判断例 1: 设x = 18.4,y = 36.8,浮点运算值为z = x/y = 18.4/36.8 = 0.5;根据上节,得Qx = 10,Qy = 9,Qz = 15;因此有int x = 18841, y = 18841;z = L_shl(x, (15-10+9) )/18841; // L/18841 = 16384由于商z的定标值为15,因此定点z = 16384即为浮点 z = 16384/215= 0.51.2.4 三角函数运算1 正弦和余弦一般求cos、sin用查表法,措施是预先定义正弦和余弦表,表的长度及表中各元素的定标是根据精度规定拟定的,精度规定越高,表的长度及元素的定标都可以增长。
余弦表制作环节:1) 计算cos(2*pi*t/N),其中0<= t <=N-1,N是0~2*pi之间的采样点数2) 将。
