
第四章多媒体数据压缩编码技术.docx
11页第四章 多媒体数据压缩编码技术学习要点:1、多媒体数据要所编码的重要性和分类2、 常用压缩编码算法的基本原理及实现技术,预测编码、交换编码(K-L变换、DCT变换)、统计编 码( Hufman 编码、算术编码)3、 量化的基本原理和量化器的设计思想4、 静态图象压缩编码的国际标准(JPEG)原理、实现技术,以及动态图像压缩编码国际标准(MPEG) 的基本原理一、多媒体数据压缩编码的重要性和分类1、 多媒体数据压缩的重要性多媒体技术最大难题是海量数据存储与传送电视信号数字化后的数据量2、 多媒体数据压缩的可能性(1) 空间冗余例:图象中的“A”是一个规则物体光的亮度、饱和度及颜色都一样,因此,数据A有很大的冗余2) 时间冗余(3) 信息熵冗余信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量和含量 信息熵:指一团数据所带的信息量,平均信息量就是信息熵(en tropy)例:从64个数中选出某一个数,可先问“是否大于32?”消除半数的可能,这样只要6次就可选出某数 这是因为每提问一次都会得到1比特的信息量因此,在64个数中选定某一数所需的信息量是 log2 64=6(bits) 。
设从N个数中选任意一个数X的概率为P(x),假定选定任意一个数的概率都相等,P(x)= 1/N,因此 定义信息量I(x)=log2N= -log2(l/N)= -log2P(x)=I[P(x)],如果将信源所有可能事件的信息量进行平均, 就得到了信息熵(entropy)熵就是平均信息量信息源的符号集为Xj (j=l,2,3……..N)设X出现的概率为P(xj),则信息源X的熵为(4) 结构冗余 图象有非常强的纹理结构如草席图结构上存在冗余5) 知识冗余图像的理解与某些基础知识有关例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上(6) 视觉冗余视觉冗余是非均匀、非线性的例:人类视觉分辨率为2 ,但常用 2 就是数据冗余7) 其他冗余:空白的非定长性3、多媒体数据压缩方法的分类 按压缩方法分:有失真压缩、无失真压缩 按编码算法原理分:(1) 预测编码(2) 变换编码(3) 量化与向量量化编码(4) 信息熵编码(5) 子带编码(6) 结构编码(7) 基于知识的编码二、量化1、量化原理量化处理是使数据比特率下降的一个强有力的措施脉冲编码调制(PCM)的量化处理是采样之后进 行,从理论分析的角度,图像灰度值是连续的数值,而我们通常看到的是以(0〜255)的整数表示图像灰 度,这是经A/D变换后的以256级灰度分层量化处理了的离散数值,这样可以用log2256=8比特表示一个 图像像素的灰度值,或色差信号值。
数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差 分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理量化输入值的动态范围 很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量化后的数值用 较少的比特数便可表示每个量化输入被强行归一到与其接近的某个输出,即量化到某个级量化处理总 是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处 理中有信息丢失,或者说,会引起量化误差(量化噪声)2、标量量化器的设计通常设计量化器有下述两种情况:▲给定量化分层级数,满足量化误差最小 ▲限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出 量化方法有标量量化和矢量量化之分,标量量化又可分为,均匀量化、非均匀量化和自适应量化3、矢量量化 矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种新型量化编码方法矢量量化编码方法一般是有失真编码方法矢量量化的名字是相对于标量量化而提出的对于PCM数据,一个数一个数 地进行量化叫标量量化若对这些数据分组,每组K个数构成一个K维矢量,然后以矢量为单元,逐个矢 量进行量化,称矢量量化。
三、统计编码1、 统计编码原理 ——信息量和信息熵图像的概率分布、信息量和信息熵之间有什么关系?在图像编码压缩理论研究中,为什么要引入信息 论中“熵”值的概念,有什么重要意义?这是我们下面需要说明的问题概念:(1) 信息:是用不确定性的量度定义的2) 信息量:从 N 个相等可能事件中选出一个事件所需要的信息度量或含量3) 熵:如果将信源所有可能事件信息量进行平均就得到信息的熵(熵就是平均信息量) 传输包括:(1) 传输所需要的信息2) 以任意小的失真或零失真接收这些信息已经证明:只要符号速率不超过信道容量C符号可以以任意小的差错概率向该信道中传输另外几种 典型的方法是:Fans,Huffman,编码方法定理,变字长编码最佳编码定理在变字长编码中,对于出现概率大的信息符号,编以短字长的码, 对于出现概率小的信息符号编以长 字长的码,如果码字长度严格按照符号概率的大小的相反顺序排列,则平均码字长一定小于按任何其他符 号顺序排列方式得到的码字长度1) 熵、熵编码原理、变字长编码最佳编码定理(2) Huffman 就是利用了这个定理进行编码2、 哈夫曼编码Huffman 编码就是利用变字长最佳编码实现信源符号按概率大小顺序排列。
信源符号按概率大小顺序排列:(1) 出现概率最小的两个符号概率相加合成一个概率2) 将合成概率看成一个新组合符号概率,重复上述做法,直到最后只剩下两个符号概率为止3) 反过来逐步向前编码,每一步有两个分支各赋予一个二进制码,可以对概率大的赋编码为“0”, 概率小的赋编码为“1”反之,也可以大的赋“1”,小的赋“0”)特点:Huffman 编码字长参差不齐Huffman编码在信源编码概率分布不均匀时效率高,所以效率比较均匀时,不用Huffman编码0Huffman 编码表省缺好处:解决对称性,降低了编码时间概率统计和Huffman编码一般不对称3、算术编码20 世纪 60 年代初, E1ias 提出了算术编码概念1976 年, Bissanen 和 Pasco 首次介绍了它的实用技 术算术编码在图像数据压缩标准(如JPEG, JBIG)中扮演了重要的角色在算术编码中,消息用0到1之 间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔信源符号的概率决定压 缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0 到 1 之间编码过程中的间隔决 定了符号压缩后的输出。
基本思路:用一个浮点输出数值代替一个流的输入符号;把要压缩的整段数据映射到一段实数半开区间[0, 1)内的某一区段,然后构造出小于l且大于或等于 0的一个数值,这个数值就是对该输入流进行压缩编码后的输出代码例如:可将输入字符流“eai”映 射到区间[0.23, 0.236),然后取该区间的任一个数,如 0.23,作为该输入字符流的编码基本原理:将编码的信息表示成实数 0 和 1 之间的一个间隔,信息越长,编码表示它的间隔就越小,表示这一间 隔所需的二进制位就越多是一种二元码的编码方法在不考虑信源统计的情况下,只要监视一小段时间内码出现的频率,不管 统计是平稳的或非平稳的,编码的码率总能趋近于信源熵值,每次迭代时的编码算法只处理一个数据符号, 并且只有算术运算设编码初始化子区间为[0, 1), Qe从0算起,则Pe=1-Qe随着被编码数据流符号的 输入,子区间逐渐缩小新子区间的起始位置=前子区间的起始位置+当前符号的区间左端X前子区间长度;新子区间的长度=前子区间的长度X当前符号的概率(等价于范围长度); 最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数算术编码在编、译码的过程中,子区间的起始位置和长度值的小数点后的位数越来越长,实际中无法 实现。
因此较实用的改进算法是限制小数点后的位数在算术编码中需要注意的几个问题:(1) 由于实际计算机精度不可能无限长,运算中溢出是明显的问题,但多数机器都有16 位、32 位或 者 64 位的精度,因此可使用比例缩放法解决2) 算术编码器对消息只产生一个码字,这个码字是在[0, 1]中的一个实数,因此译码器在接受到 表示这个实数的所有位之前不能进行译码3) 算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错算术编码可以是静态的或者自适应的在静态算术编码中,信源符号的概率是固定的在自适应算术 编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号概率 的过程叫做建模需要开开发态算术编码的原因是因为事先知道精确的信源概率是很难的,而且是不切实 际的当压缩消息时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效的方法是在编码过 程中估算概率因此动态建模就成为确定编码器压缩效率的关键特点:① 不必预先定义概率模型,自适应模式具有独特的优点;② 信源符号概率接近时,建议使用算术编码,这种情况下其效率高于Huffman编码③ 算术编码实现方法复杂一些,但JPEG成员对多幅图像的测试结果表明,算术编码比Huffman编码提高了 5%左右的效率,因此在JPEG扩展系统中用算术编码取代Huffman编码。
四、预测编码1、预测编码方法基本原理从相邻数据之间由强的相关性特点考虑,可以利用前面已经出现的数值,进行预测(估计),得到 一个预测值,将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法即成为预测编码方 法不带量化器的DPCM线性预测编码,属于无失真编码系统;带有量化器的DPCM线性预测编码,属于有 失真编码系统最佳量化器的设计,可利用人眼的视觉可见度阈值和视觉掩蔽效应等生理特征,来确定量化器的级数 和步距,使量化误差总处于人眼难以觉察的范围内,达到主观评定准则的要求自适应预测编码 ADPCM:自适应技术的概念是:预测器的预测系数和量化器的量化参数,能够根据图像的局部区域分布特点自动调整实践证明,ADPCM编、解码系统与DPCM编、解码系统相比,不仅能改善恢复图像的评测质量和视觉效 果,同时还能进一步压缩数据ADPCM 系统包括自适应预测,即预测系数的自适应调整和自适应量化,即量化器参数的自适应调整两 部分内容五、 变换编码1、变换编码的基本原理 利用图像块像素值之间的相关性,把图像变换到一组新的基上,使得能量集中到少数几个变换系数上, 通过存储这些系数达到压缩的目的本方法采用对整幅的原始图像分成许多个矩形区域子图像独立进行变换。
常用变换有:卡亨南一洛维变换(KLT)离散余弦变换(DCT)沃尔什—哈达玛变换( WHT)离散傅里叶变换(DFT)六、 多媒体数据压缩编码的国际标准由国际标准化协会ISO、国际电信协会IEC和国际点心协会ITU领导下,制定的三个有关视频图像压 缩编码的国家标准:JPEG标准,H・261标准,MPEG标准1、静态图像压缩编码的国际标准(J PEG)JPEG 联合图像专家小组标准,一种对静态图像压缩的编码算法联合”:国际电报咨询委员会 CCITT 和国际标准化协会 ISO 联合组成的图像专家小组JPEG 给出了一个使用于连续色调图像的压缩方法JPEG 要求图像应达到目的的基本要求: 达到或接近当前压缩比与图像保真度的技术水平,能覆盖一个较宽的图像质量等级范围,能达到“很 好”到“极好”的评估,与原始图像相比。












