好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第10讲 信源编码的性能指标.docx

11页
  • 卖家[上传人]:天****步
  • 文档编号:291886950
  • 上传时间:2022-05-13
  • 文档格式:DOCX
  • 文档大小:20.46KB
  • / 11 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 本文格式为Word版,下载可任意编辑第10讲 信源编码的性能指标 第10讲 信源编码的性能指标 1. 无失真信源编码的冗余度压缩原理 为了压缩冗余度,务必改造信源输出符号的统计特性一方面要尽量提高任一时刻输出符号的概率分布的平匀性,另一方面要尽量消释前后输出符号的统计相关性因此,无失真信源编码的实质是将信源尽可能地改造为平匀分布的无记忆信源这种信源的通信效率是最大的改造后的新信源是由原信源和编码器共同组成的,称为编码后的信源设f是信源S的一个编码,X是编码后的信源,那么三者之间的关系表示如下 f S ???X 信源编码f所用的码元可以与信源S的符号不同,一般是某个信道的输入符号 从数据处理这个角度来看,编码f是一个数据处理器,输入信源S的数据,输出信源X的数据从通信的角度看,编码f是一个信道,输入信源S的数据,输出信源X的数据 无失真信源编码的目的是无损压缩,即用完可能少的数据表示数据中的全体信息,不能破坏数据原有信息这相当于提高信息传输效率,使之接近于1因此,度量无失真编码的压缩性能可以看编码后信息传输效率,称为编码效率。

      编码效率越接近于1,无损压缩性能越好下面介绍信源编码的5天性能指标,包括平均码长、码率、编码效率、编码冗余度和压缩率 2. 平均码长 平均码长是信源编码的一个关键的性能指标在已知信源熵的前提下,根据平均码长,可以计算出无损压缩编码的码率和编码效率 定义2.1 设f是一个N-分组码,各码字的码长分别记为li,1?i?q,对应的N长分组的概率为pi,那么f的平均码长定义为 1qL??pili (码元/信源) Ni?1 注:在有的教材中,当平均码长的单位转化为“比特/信源”时,称为编码速率本课程用不到这个概念 议论:用平均码长估计编码后的数据长度 设S是一个离散无记忆信源,f:S?C是信源S的一个编码,其平均码长为L令假设用f对该数据举行编码,试估计编码后码元序列的长度 s?s1s2?sn是一个信源序列 对于信源数据s?s1s2?sn,我们令Li表示信源符号si所对应的码字f(si)的长度,那么编码后的数据长度为L1+L2+我们把Li视为随机变量,那么对于任何i,我们有E[Li]?L 1 / 6 由于S是离散无记忆的,所以{Li}是独立同分布随机序列。

      根据辛钦大数定理,我们有 1(L1+L2+nP+Ln)???L 这说明,编码后的数据长度可以估计为nL,并且n越大,这个估计的越精确、可信我们把上述结论推广如下 定理2.2 (无失真编码的数据长度定理)设S是具有AEP性质的信源,f是S的一个平均码长为L的无失真N-分组码假设在编码f下,某数据在编码前的长度为n信源,在编码后的长度为m码元,那么 mP???L (n??) n意义:信源序列长度n越大,编码后所得的码元序列的长度越有可能近似于nL (码元) 3. 码率和编码效率 定义3.1 码率(code rate):编码后的信息传输率H∞(X),记为R,单位是“比特/码元” 以下定理给出了无失真编码的码率计算公式 定理3.2 设S是具有AEP性质的信源,f是信源S的无失真编码若S的熵率为H∞,f的平均码长为L,那么f的码率为 R?H? L证明:记编码后的信源为X根据定义,X的熵率为码率R用Sk, Xk分别表示信源S和X所产生的信源序列中的第k个符号根据渐近等分性定理, 1I(S1S2nPSn)???H? (1) 由于S具有渐近等分割性,易知X也具有渐近等分割性。

      于是我们有 1I(X1X2m其中X1X2PXm)???R (2) Xm为S1S2Sn经编码后的码元序列,故有 Sn)?I(X1X2Xm). I(S1S2根据依概率收敛的性质,由(1)和(2)得 mPH?. ???nR码 2 / 6 再由前面的编码后数据长度定理, mP???L. n于是我们得L?HH?,即R码?? 证毕 R码L 定义3.2 编码效率(code efficiency):对于编码f来说,编码后信源X的信息传输效率称为f的编码效率,记为?f因此, ?f??X?H??X?H0?X? 码率和编码效率是信源编码的两个重要性能指标,其值越大,那么编码的数据压缩才能越强留神,对于无失真信源编码来说,提高编码效率与数据压缩是一回事而对于限失真信源编码来说,除了通过提高编码效率来实现数据压缩之外,还通过量化方法缩小信源熵率,为后面的无失真压缩提高更大的压缩空间 提问: (1)码率与编码效率的的最大值分别是多少? (2)试确定码率与编码效率的之间的数量关系。

      答:(1)码率最大值=码元最大熵H0(X),从而最大编码效率= H0(X) /H0(X)=1 (2)编码效率=码率/码元最大熵 定义3.3编码冗余度:度量信源编码与梦想编码之间的差距,定义为 编码冗余度=最大码率-码率 编码相对冗余度=编码冗余度 / 最大码率=1-编码效率 4. 压缩率 根据第8讲的渐近等分割性定理,对于足够长的的数据,我们有如下近似关系: 数据长度?数据信息量 信源熵率数据越长,该近似关系越切实和可信根据该近似关系,读者可以看出,在信息量不变的前提下,熵率越大,数据越短因此,提高熵率所带来的结果就是数据压缩压缩效果用压缩率来度量,定义为 压缩率=编码后的数据长度 编码前的数据长度 3 / 6 (1)数据压缩率:对于一个数据x,其以比特为单位的长度称为x的比特数,记为l(x)x 经过编码后的比特数记为L(x)x的在此编码下的压缩率(也称压缩比)定义为 ?(x)?L(x) l(x)(2)无失真信源编码压缩率:教材上都没有定义。

      能否给出一个合理的定义? 设f是信源S的无失真编码,s是S的一个信源序列,x是 在编码f下所得的码元序列令s的长度是n,即nH0(S)比特令x的长度是m,即mH0(X)比特那么s在f下的压缩率为 mH0?X? nH0?S? 根据渐近等分割性,我们有 I(s)PI(x)P???H?(S)和???H?(X) nm由于编码是无失真的,故I(s)=I(x)因此, mPH?(S) ???nH?(X)mH0(X)PH?(S)H0(X) ???nH0(S)H?(X)H0(S)即 mH0(X)P?S??? nH0(S)?X其中?S是信源S的信息传输效率, ?X是编码后信源X的信息传输效率,即编码效率这个收敛关系说明,当信源序列足够长时,其数据压缩率很有可能近似于信源效率比上编码效 率因此,这个常数可以度量编码f的压缩效果因此,我们定义无失真信源编码的压缩效率如下: 无失真信源的压缩效率=信源效率/编码效率 因此,编码效率越大,那么压缩才能越强 (3)信源的极限压缩率: 数据是不成能被无限压缩下去的,总存在各自的极限我们议论信源数据的压缩极限。

      假设信源S的熵率H∞在某编码下被提高到了最大值H0,那么该编码的压缩性能达成理论允许的极限此时压缩率为 编码后的数据长度数据的信息量I?编码前的数据长度编码后的信息速率H0H数据的信息量I?? 编码前的信息速率H?H0因此,信源的相通信效率H?H0是信源数据的压缩率期望的极限我们把这个极限称为信源极限压缩率 4 / 6 无失真信源编码关系图 信源序列s 信息量: I(s) 数据长度:n信源 信息速率:H? r-元编码器f 码元序列x I(x) m码元 Rf 无失真:I(s)?I(x)I(s)PI(x)P???H?且 ???RfnmmP辛钦大数定理: ???L nH结论: Rf=?LH? ?f= LlogrAEP: 5. 信源的最优无失真编码 根据上面的计算公式,编码效率与平均码长是反比例关系这说明,缩短平均码长与提 高编码效率是同一回事因此,对于无失真编码来说,数据压缩与提高编码效率是同一回事。

      编码效率越接近于1,编码的压缩才能越强因此,在某信源的全体无失真编码中,我们把其中编码效率达成1的编码称为该信源的最优无失真编码这为无失真编码的设计工作指领略努力的目标一般来说,由于编码的离散性,这个目标是永远达不到的,但是可以无限地接近因此,一般来说,信源编码没有最好,但有更好 (当编码效率=1时,编码后的信源是平匀分布的无记忆信源要做到这一点,信源编码务必消释原信源的记忆性,即前后输出符号之间的统计相关性,并且要让编码后的信源在任何时刻输出符号的概率分布是平匀的对于一般的信源来说,其任何编码都不成能完全做到这一点,十足最优的信源编码是不存在的 假设把上述最优编码称为十足最优编码的话,还有一种相对最优编码,其定义如下 定义5.1在信源S的全体r-元N-分组无失真编码中,平均码长最小的称为S的最优r-元N-分组无失真编码 注:(1)一个信源的r-元N-分组码是有限多的,所以其中确定存在最优码 (2)对比两个不同元数的编码的平均码长时,其单位要化为一致的单位后才可以对比 无失真信源编码理论的核心问题就是探索最优无失真编码 根据编码效率与平均码长的反比关系,要提高编码效率只需缩短平均码长即可,这是实现无失真编码的数据压缩功能的唯一途径。

      下一讲我们将重点议论这个问题这里我们先了解最优编码的两个简朴性质 命题5.2 最优编码是概率匹配编码,即信源符号的概率越小,对应的码字长越大 5 / 6 证明 设f是信源U的最优的1-分组编码令U的n个符号的分别为ai,对应的概率为pi,在某编码下,对应码字长为li假设存在两个符号ai,aj,有pi >pj且li > lj, 那么pi li + pj lj > pi lj+ pj li 因此,对调ai与aj的码字后,可以得到平均码长更小的编码这与f的最优性冲突 证毕 命题5.3最优编码充分用短字符串作为码字设f是某信源的最优编码,最大码字长为L,那么任何长度小于L的串确定是f的某个码字的前缀 证明 留给读者 证毕 6. 本讲要点小结 1) 平均码长的定义和物理意义 2) 平均码长的应用: (1) 估计无失真编码的码元序列长度≈信源序。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.