1、1下一代数字视频技术下一代数字视频技术一、前言移动互联网的迅速发展为人们的生存方式带来深刻的变化,商务、社交、娱乐等各方面的信息流量呈爆炸式增长,其中视频信息流量占据了很大的比例,现在每分钟上传到 YouTube 的视频就达 100 小时。数字视频的信息量非常大,用现有的数字视频压缩技术制成的标清数字视频每小时约为 12GB,目前数字视频向高清或超高清方向发展的趋势愈加明显:(1) 高清晰度(Higher Definition):数字视频的分辨率从 720 P 向 1080 P 全面升级,在一些视频应用领域甚至出现了 4K2K、8K4K 的数字视频图像;(2) 高帧率(Higher frame rate ):数字视频的帧率从 30 fps 向 60fps、120fps 甚至240fps 的应用场景升级。高清或超高清视频的信息量将数倍的增加,给传输带宽和存储空间带来更大的压力。传输带宽和存储空间是视频应用中最为关键的资源,以更少的资源获得更高清的视频体验一直是用户的不懈追求,下一代数字视频技术即是在此背景下发展起来的。二、数字视频技术的发展历程对于数字视频技术的研究始于上世纪八十年代,第
2、一个实用的数字视频编码标准H.261 于 1990 年由 ITU-T 制定的,其后 ITU-T 制定了 H.262(MPEG-2) 、H.263、H.263+、H.263+、H.264(MPEG-4 AVC)和 H.265 等视频编码标准。另一个视频编码标准的制定者是 ISO/IEC 组织的活动图像专家组 MPEG(Moving Picture Expert Group) ,MPEG 制定了 MPEG-1、MPEG-2(H.262) 、MPEG-4、MPEG-4 AVC(H.264)等视频编码标准,其中 MPEG-2(H.262)和 MPEG-4 AVC(H.264)是 ISO/IEC MPEG 与 ITU-T 组织联合制定分别发布的。我国于 1996 年以 MPEG China 的名义正式参与国际 MPEG 专家组的工作,并开展数字视音频技术的研究工作。2002 年我国成立“数字视音频编解码技术标准化工作组(简称 AVS) ” ,并决定与 MPEG China 合并,两个组织的名称继续保留,分别用于国内和国际。AVS 工作组制定了 AVS1-P2 等视频编码标准,并于 2006 年颁
3、布为国标GB/T 20090.2-2006,之后于 2012 年在国标的基础上升级为 AVS+,形成了广电行业标准 GY/T 257.1-2012。AVS 标准针对视频监控的伸展档 AVS-S2 又于 2013 年被国际电子电气工程师协会(IEEE)标准化委员会接受并颁布为 IEEE 1857 标准。2013 年 12 月中国移动通信集团设计院有限公司第十九届新技术论坛231 日国家质检总局、国家标准委批准发布了信息技术 先进音视频编码 第 2 部:视频 (修订) (国标代号 GB/T 20090.2-2013) 、 信息技术 先进音视频编码 第 10 部:移动语音和音频 (国标代号 GB/T 20090.10-2013)为国家标准,标准将于 2014 年 7月 15 日正式实施。下图为 ITU-T、MPEG、AVS 三个标准化组织的视频技术发展历程。图 1 数字视音频压缩标准的发展历程值得一提的是,除上述之外还有其它一些很好的视频压缩技术,如 Google 公司的VP8、VP9 和微软公司的 VC-1 等。三、下一代数字视频技术下面将简要介绍一下以 H.265/HEVC、VP9、AV
4、S2 等为代表的下一代数字视频技术。3.1 H.265/HEVCH.264 是目前应用最广泛的数字视频编解码标准,H.265 是其后继者,于 2013 年1 月 ITU-T 正式发布。H.265/HEVC 标准共有三种模式:Main、Main 10、Main Still Picture。Main 模式支持 8 位色深,Main 10 模式支持 10 位色深,将用于超高清电视(UHDTV)上,Main 和 Main10 模式都将色度采样格式限制为 4:2:0。H.265 视频压缩标准的核心目标是在 H.264/AVC high profile 的基础上将压缩效率提高一倍,即在保证相同视频图像质量的前提下,视频流的码率减少 50%。H.265 使用了先进的技术用以提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、中国移动通信集团设计院有限公司第十九届新技术论坛3减少信道获取时间和随机接入时延、降低复杂度等。H.265 标准将能更好地适应各种类型的网络,如 Internet、LAN、Mobile、ISDN、NGN 等。H.265/HEVC 与 H.264/AVC 的编码架构大致相似,仍
5、然属于预测加变换的混合编码,主要也包含:帧内预测(intra prediction)、帧间预测(inter prediction)、转换 (transform)、量化(quantization)、去区块滤波器(deblocking filter)、熵编码(entropy coding)等模块,其主要的技术特点为:(1) 灵活的编码结构在 H.265/HEVC 编码架构中,整体被分为编码单位(coding unit,CU)、预测单位(predict unit,PU) 和转换单位(transform unit,TU )等三个基本单位。与 H.264 每个宏块大小都是固定的 16x16 像素不同,H.265 的编码单位可以选择从最小的 88 到最大的6464。 H.265 采用一种自适应的变换技术,即根据当前块信号的特性,自适应的选择变换块大小,如信息量不多的区域划分的宏块较大(如 6464) ,而细节多的地方划分的宏块就相应的小一些(如 88) ,这样一方面能够提供更好的能量集中效果,并能在量化后保存更多的图像细节,就相当于对图像进行了有重点的编码,从而降低了整体的码率,编码效率就相应提高
6、了。H.265 还提供了更多不同的工具来降低码率,其帧内预测模式支持 33 种方向(H.264 只支持 8 种),并且提供了更好的运动补偿处理和矢量预测方法。(2) 采样点自适应偏离(Sample Adaptive Offset)经去区块滤波器(deblocking filter)之后,在帧间预测环路内引入一个非线性的幅值映射并建立一个映射表,目的是在解码时通过查映射表获得参数使得更好地重建原始图像的幅值,从而减少失真。(3) 自适应环路滤波(Adaptive Loop Filter)经去区块滤波器(deblocking filter)和 SAO 之后,自适应环路滤波(ALF)在编解码环路内用于恢复重建图像,以达到重建图像与原始图像之间的均方差最小。(4) 并行化处理H.265/HEVC 引入了一些新的特性以强化并行处理能力和为包传输而改良的片结构,这两个特性在某些应用中可能会十分有用,具体实现可以根据情况采用。这些特性有:a) 并行块(Tile):可以把一帧图像分割成称之为 Tile 的矩形区域,其目的是增中国移动通信集团设计院有限公司第十九届新技术论坛4强并行处理的能力同时又不引入
7、新的错误扩散。Tile 是可以互相独立解码的区域,由几乎数量相等的 CTU(Coding Tree Unit)组成。b) 错峰并行处理 WPP(Wavefront Parallel Processing):WPP 功能启用时,将图像分片被分成数个 CTU 行,第一行正常处理,第二行在第一行处理完两个 CTU 之后开始处理,第三行在第二行处理完两个 CTU 之后开始处理,以此类推。c) 依赖更小片(Dependent slice segments):允许数据与错峰并行处理或者并行块关联起来。在碎片化的包传输网络中,相对于一次编码一整片而言,这种做法可以更快进入解码流程,从而降低延迟。与错峰并行处理一起使用时,它也需要类似错峰的机制。这项设计尤为适合低延迟要求下的并行处理。H.265/HEVC 在很多特性上都做了较大的改进以获得较好的编码压缩性能,但是相对于 H.264,其算法的复杂性也大大提高了。3.2 VP9VP9 是 Google 公司制定开发的开放视频编解码技术,于 2013 年 6 月正式完成制定,是 VP8 的后继者。VP9 的开发从 2011 年第三季开始,目标是在同画质下比
8、 VP8 编码减少 50,另一个目标则是要在编码效率上超越 H.265/HEVC。VP9 支持两种编码格式文档(Profiles):文档 0(profile 0)支持 4:2:0 的色度抽样;文档 1(Profile 1)针对硬件播放环境,新增支持 4:2:2 的色度抽样、4:4:4 色度抽样等。另外 Google 也在考虑新增一个支持 10 位色深的编码格式文档(profile) 。VP9 在 VP8 的基础上做了许多技术改进,比如:(1)引入超大块(Superblock):支持 3232 的编码区块,且将来会扩充到6464;(2)优化宏块分割:将具有相同特征的分成一个宏块(macroblock) ;(3)多种预测改进措施:如新的帧内预测功能和策略,应用多种多样的预测器或参考帧的混合预测,与新变换相关联的新预测模式等;(4)熵编码改进:与上下文有关的宏块跳跃编码;参考帧与上下文有关的编码;(5)新变换方式:如更大的 DCT(88 DCT,1616 DCT) ,不对称DST(ADST)等;3.3 H.265 和 VP9 比较H.265/HEVC 不仅提升图像质量,同时达到 H.264/
9、MPEG-4 AVC 两倍之压缩率中国移动通信集团设计院有限公司第十九届新技术论坛5(等同于同样画面质量下比特率减少了 50%) ,可支持 4K 分辨率甚至到超高清视频,最高分辨率可达到 81924320(8K4K 分辨率) 。Google 公司的 VP9 在相同质量下相对于 VP8 可以减少 50%的比特率。VP9 是Google WebM 媒体文件的视频编码格式,WebM 标准的网络视频更加偏向于开源并且是基于 HTML5 标准的,WebM 旨在开发高质量、开放的视频格式,其重点是解决网络视频服务这一核心的用户体验,Google 公司已经发布了第一个支持 VP9 解码技术的Google Chrome 网页浏览器。从一些组织对 H.265 和 VP9 进行的对比测试结果看,VP9 的编码效率在 H.264 之上,但是在 H.265 之下,两者编码效率相差约 1%。3.4 AVS2AVS2 是 AVS+的下一代,其视频标准(信息技术 先进音视频编码 第 2 部:视频 (修订) (国标代号 GB/T 20090.2-2013) ,简称 AVS2 视频标准)的首要应用目标是超高清晰度视频。超高清视频的分辨率相当于高清视频的 4 倍(4K 超高清)或 16倍(8K 超高清) ,需要压缩效率更高的视频编码标准。测试表明,AVS2 视频标准的压缩效率已经比上一代 AVS 国家标准和 AVC/H.264 国际标准提高了一倍,在场景类视频编码方面大幅度领先于最新国际标准 HEVC,实现复杂度不高于同等级的编码标准。
《下一代数字视频技术》由会员lcm****20分享,可在线阅读,更多相关《下一代数字视频技术》请在金锄头文库上搜索。