数字彩色电视制式课程PPT课件
第4章 数字彩色电视制式电视原理4.1 数字彩色电视制式概述 模拟彩色电视制式的缺陷 高清晰度电视的需求 数字技术的发展国际电信联盟(ITU)对高清晰度电视的定义:垂直和水平方向的空间分解力大致是CCIR601号建议书中规定值的两倍,例如水平1920像素,垂直1080像素;宽高比为16:9,屏幕对角线长度大于1米,并配有多声道优质伴音;观看距离为屏幕高度的三倍时,图像的主观质量接近或达到观看真实景物的效果,相当于35mm电影放映的图像质量。4.1.1 多极化的传输标准美国1986年以前支持日本的MUSE制1987年提出发展ATV(Advanced Television,高级电视)1990年5月,美国GI公司正式发表全数字HDTV传输制式DigiCipher1993年5月成立HDTV大联盟(Grand Alliance, GA),着手制定统一的美国HDTV标准1995年4月通过了ATSC(Advanced Television System Committee)数字电视标准欧洲1981年英国独立广播公司研制出C-MAC(Multipled Analogue Component)制:亮度、色差时分,两个色差逐行轮换,射频载波调频传送,视频带宽8.4MHz1986年提出HD-MAC制受美国数字制式影响,1993年开展DVB(Digital Video Broadcasting)研究1995年,欧洲成立了DVB联盟,共同制定数字电视的DVB标准:DVB-S(Satellite)、 DVB-C(Cable)、 DVB-T(Terrestrial)日本l日本广播协会(NHK)1970-80年代提出模拟高清晰度电视制式MUSE制(多重亚奈抽样编码):1125行,60场,隔行扫描,16:9幅型比;色度信号与亮度信号时分复用:TCI(时间压缩合成);多重亚奈抽样压缩信号频带:4场传送1幅HDTV图像;8.1MHz带宽,调频传送l1996年启动数字电视研制l1998年9月制订ISDB-T(Integrated Services Digital Broadcasting -Terrestrial)数字电视地面广播系统标准,与欧洲的DVB-T类似中国l2002年组建音视频技术(AVS)标准工作组l2006年视频部分正式颁布为国家标准需要注意:上述标准适用于HDTV和SDTV 4.1.2 通用的压缩编码标准 数据压缩的必要性4:2:2 ,PAL:8646252528=216Mb/s(108MHz) 数字电视系统框图 通用的信源编码标准MPEG-2MPEG(Moving Pictures Experts Group)即活动图像专家组,建立于1988年MPEG-1: 4:2:0采样压缩,每秒1.5Mbps的传输码率,图像大小352240,扫描频率30场/秒。图像质量比电视略强,适合于非专业视频领域,如VCD等。MPEG-4:一种广域传输标准,传输码率10kbps- 1Mbps,于2000年正式成为国际标准:内容的交互性, 高效的压缩性,通用的访问性MPEG-2:1994-1996年提出的用于广播电视的视频压缩标准。“Profile”和“Level”(“型”和“级”) 按视频格式分四个级按编码工具分五个型“级”与“型”的若干组合构成MPEG-2视频编码标准在某种特定应用下的子集:对某一输入格式的图像,采用特定集合的压缩编码工具,产生规定速率范围内的编码码流。在20种可能的组合中,目前有11种是已获通过的,称为MPEG-2适用点。 图像输入格式最大输出码率主型高型低级 LLITU-R601标准的1/44Mb/s35224030pel/s35228825pel/s主级 ML符合ITU-R601标准15Mb/s20Mb/s72048030pel/s72057625pel/s高1440级H14LITU-R601标准的4倍(4:3)60Mb/s80Mb/s1440115230pel高级 HLITU-R601标准的4倍(16:9)80Mb/s100Mb/s1920115230pel码率简单型 SP主型MP信噪比可分级型SNRP空间可分级型SSP高型HP低级LL44主级ML15151520高1440级H14L606080高级HL80100MPEG-2适用点4.2.1 视频信源编码的理论依据原始图像数据在空间及时间上的统计冗余度很大,存在大量无需传送的多余信息:l图像的相邻像素、相邻行之间存在很强的相关性空间相关性l相邻场或帧对应像素间存在相关性时间相关性l信息保持无损压缩编码人眼对图像细节、幅度的变化、图像的运动不同时具有最高的分辨力:l信息非保持有损压缩编码4.2 视频信源编码原理4.2.2 预测编码原理预测编码概述l预测编码也称为差分脉冲编码调制(DPCM,Differential Pulse Code Modulation),使用已编码像素的线性组合对未编码像素进行预测,传送其预测误差(残差)。l约80%-90%以上的残差信号的绝对值落在16-18个量化级以内。可以用较少的比特表示差值,达到数据压缩的目的。l帧内预测采用1阶前值预测,利用空间相关性;帧间预测采用1阶前向预测或2阶双向预测,利用时间相关性。l预测编码的主要缺点是抗误码能力差。若传输中产生误码,由于递归预测算法,对于帧内编码会使误差扩散到图像中一个较大的区域,对于帧间编码会使误差扩散到后续的若干帧中。为便于联合运用帧内编码和帧间编码技术,把由连续的电视画面组成的视频序列 ( sequence ) 划分为许多图像组(GOP,Group of Picture),每个图像组由几帧或十几帧图像组成,这些图像相互间存在预测和生成关系。采用帧内预测编码的图像称为I图像(Intra-Coded Picture)采用前向帧间预测编码的图像称为P图像(Predictively-Coded Picture)采用双向帧间预测编码的图像称为B图像(Bidirectionally-Coded Picture)下页为由9帧图像组成的GOP示意图编码器输入端或解码器输出端的显示顺序编码器输出端或解码器输入端的编解码顺序 视频数据结构 块:Block 88像素块宏块:Macroblock1616像素块像条:Slice由多个Macroblock组成图像组:GOP视频序列:Sequence图像:Picture宏块的组成4:2:0格式的宏块4:2:2格式的宏块4:4:4格式的宏块宏块的三种构成方式,其中亮度块的数目均为4,而色度块的数目分别为2、4和8。 在对I图像进行帧内预测编码之前,首先对每一个88的像块进行二维离散余弦变换(DCT,Discrete Cosine Transform),将像块变换为由88个变换系数组成的系数块。位于系数块左上角的第一个系数是像块中88个像素的平均值,代表像块的直流分量,称为DC系数,其余系数为AC系数。帧内预测编码是对各个系数块的DC系数进行的,目的是去除在相邻像块的直流分量之间较强的相关性。帧内预测编码只在像条所在的区域进行。帧内预测编码采用前值预测:帧间预测编码是以图像组GOP为单位进行的I图像帧内编码图像,其编码不依赖于其它图像,它还是P图像和B图像编码、解码的参考图像。使用周期性的I帧便于初始化接收机和捕获频道。I帧出现的频度可以变化,由编码器选择。P图像前向编码预测图像,像素的预测值为其前面一帧I图像或P图像中相应像素值,即帧间运动补偿前值预测。B图像双向预测编码图像,像素的预测值为其前后相邻帧相应像素值的加权平均。B图像不能作为其它图像的编码参考图像。使用B帧可提高压缩效率,但需要帧存储器。帧间预测编码中的运动补偿最简单的时域预测就是用前一帧作为当前帧的预测参考帧。一个视频序列里两个相邻帧如右图所示。第一帧作为第二帧的参考帧,残差是第二帧与参考帧之差。在右图中,中间灰度代表差值为零,浅灰和深灰分别对应正、负差值。这种简单预测的明显问题是残差帧中剩余能量太多,也就是说预测后还有很多信息需要压缩。多数残差是由于两帧之间物体运动引起的,所以更好的预测是在两帧之间进行运动补偿。运动补偿预测示意图运动矢量:表示从编码帧到参考帧像素运动的方向和距离。运动估值:通过比较参考帧与编码帧中的图像,求出运动物体像素的运动矢量。运动补偿:考虑了运动矢量的帧间预测称为具有运动补偿的帧间预测。采用块匹配算法进行运动估值l摄像机所摄取的景物的运动可能是十分复杂的,精确对每个像素进行运动估值是十分困难的。l在许多情况下物体上的各个像素均做相同的运动,这时只需估计其整体的运动就可以了。块匹配算法:对每个编码帧宏块中的1616亮度块,在参考帧中一定搜索范围内,搜索与它最相似的亮度块匹配块,并根据匹配块与它的坐标差,确定运动矢量。像块匹配程度的判定常采用平均绝对差准则(MAD,Mean Absolute Difference),即在搜索范围内按下式求帧间像素块亮度差的绝对值的平均值。当MAD(i,j)达到最小时,两个像素块匹配。此时运动矢量为MV(i,j)。这种搜索方法称为全搜索,运算量相当大。为加快搜索过程,提出了三步法、共轭方向法、正交搜索法等,但效果不如全搜索,全搜索仍然是通用的方法。MPEG-2中运动补偿的精度是半像素,H.264中运动补偿的精度是四分之一像素,都需要在参考帧中根据已知整像素值,用线性内插的方法得到半像素和四分之一像素值以后,再进行块匹配计算。B帧图像的帧间预测编码预测值是其前面参考帧的前向预测值与其后面参考帧的后向预测值的平均值双向预测。在进行运动补偿时,需要前向和后向两个运动矢量。图4-9在图像序列中,P帧和B帧传送的是像素值与预测值的差值和每个宏块的运动矢量。考虑到邻近宏块间运动矢量存在相关性,对运动矢量也采用预测编码。 帧间预测模式为了既能处理逐行扫描图像,又能处理隔行扫描图像,数字电视的帧间预测编码主要有两类:帧预测和场预测。帧预测:预测来自于最近的重构参考图像。P帧预测示意B帧预测示意P场预测:预测来自于最近的重构参考图像。编码帧中第一场图像的预测编码帧中第二场图像为底场的预测B场预测:用于预测的两个参考场来自于最近的解码参考顶场和底场。编码帧中第二场图像为顶场的预测B场图像或B帧图像的预测4.2.3 变换编码原理变换编码是为了将图像数据或运动补偿残差数据转换到变换域,以去除空间相关性,对变换后的系数编码,达到数据压缩的目的。变换编码系统基本结构离散余弦变换(DCT,Discrete Cosine Transform)考虑到空间相关性只在一定范围内存在,变换是以块为单位进行的,采用88块。设由88像素组成的像素块用矩阵X表示,变换后的系数块用矩阵Y表示,则:正向DCT反DCT其中C表示88的DCT矩阵,CT是其转置矩阵C满足正交矩阵性质右图为88DCT基本图像。任何88图像块都可以用基本图像与变换系数乘积的组合来表示。DCT系数矩阵左上角系数y00对应空间直流分量,称为DC系数,其他63个对应交流分量,称为AC系数。经过DCT变换后,64个样值仍然得到64个系数。原样值是9比特,数据从0511;得到的直流系数的范围是04095,交流系数的范围是-20482047;量化之后大多数高频分量的系数变为0。人眼对低频分量比较敏感,对高频分量则不太敏感;因而量化的结果是去掉了不太重要的高频分量,降低了码率。 I帧:系数矩阵左上角部位的系数对应空间低频分量,采用较小的量化间隔,位于右下角部位的系数采用较大的量化间隔。 P帧和B帧:是对帧间预测差值的变换,DCT系数不仅仅决定于空间频率,故采用相同的量化间隔。DCT系数的量化81619222627293416162224272934371922262729343438222226272934374022262729323540482627293235404858262729343846566927293538465669831616161616161616161616161616161616161616161616161616161616