好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

计算机信息技术张福炎.ppt

95页
  • 卖家[上传人]:M****1
  • 文档编号:574100838
  • 上传时间:2024-08-15
  • 文档格式:PPT
  • 文档大小:2.67MB
  • / 95 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 大学计算机信息技术大学计算机信息技术”课程课程研讨会研讨会(2)张福炎南京大学 计算机系(2003.7)8/15/20241 研研 讨讨 内内 容容一、 Background——对IT教育的认识二、 What——教什么?三、 How ——怎么教?8/15/20242 第3章   数字媒体及应用8/15/20243 什么是数字媒体?•“媒体”指的是信息的各种表示形式(如数值、文字、图象、声音、视频等)•数字媒体就是数值、文字、声音、图像等的二进制数字表示•数字媒体是随着计算机功能的不断增强、计算机应用的不断深入而发展起来的8/15/20244 2 种不同类型的数字媒体•自然媒体(使用数字化方法从现实世界获取的媒体)•合成媒体(使用计算机制作的媒体)Model(description)采用特定符号(语言) 表示的文本,合成语音, MIDI , 图形, 动画Modeling(describing)人工交互方式命令语言方式rendering人可以感知的形式声波光波力温度检测与转换器电信号数字化数字自然媒体取样声音 ,扫描图像 , 数字视频8/15/20245 数字媒体技术的内容媒体编辑媒体编辑媒体编辑媒体编辑多媒体作品(文档)媒体消费媒体集成文本图像音频视频网络媒体通信媒体准备媒体准备媒体准备媒体准备(文本)(图象)(音频)(视频)(浏览、检索、播放、交易)数字媒体的表示多媒体文档的表示8/15/20246 为什么要学习数字媒体?•数字媒体是各种计算机应用的处理对象,也是网络的传输对象。

      不了解“对象”,就不能透彻地理解计算机和网络的工作原理1进一步理解计算机的工作原理2更好地理解常用工具软件的操作原理3扩大知识面,了解更多的计算机应用4为各个专业和学科进一步学习、使用计算机打下必要的基础8/15/20247 本章的学习目标与要求1 熟悉二进制的特点,掌握整数和实数在计算机内的表示方法,了解数值计算的应用2 理解GB2312,GBK和GB18030三种汉字编码标准的内容、关系与应用,熟悉中文文本准备的方法,掌握常用文本编辑与处理软件的功能与应用3 懂得数字图像获取的原理与方法,熟悉图像在计算机中的表示,初步了解数字图像处理的内容与应用,大体明白计算机图形的生成过程及应用4 掌握声音获取的方法与设备,熟悉波形声音在计算机中的表示、标准与应用,初步了解语音合成和音乐合成的过程与应用5 了解数字视频的获取方法与设备,熟悉视频压缩编码的几种标准及其应用,初步懂得计算机动画的制作过程 8/15/20248 1  数值信息与数值计算•整数(定点数)的类型:–unsigned integer与signed integer –8位、16位、32位、64位整数–二进制整数与二进制编码的十进制整数(BCD)•整数(定点数)的编码方法–原码–补码•Pentium中的整数:8/15/20249 实数(浮点数)的表示 •实数(浮点数)的表示方法:•Pentium浮点数类型:–单精度浮点数(32位)–双精度浮点数(64位)–扩充精度浮点数(80位)–增强精度浮点数(128位)•Pentium浮点数的表示(IEEE754标准)8/15/202410 数值计算的应用与软件•科学工程领域:–Fortran、C语言、MATLAB •社会、经济、管理领域:–统计分析软件:SAS和SPSS •办公领域:–“电子表格”(spreadsheet):Excel  8/15/202411 2  文本与文本处理•文本:  基于特定字符集的、按一定格式组织起来的、具有上下文相关性的一个字符流,每个字符均使用编码表示。

      文本展现(阅读器)文本处理(文本处理软件)文本生成其他媒体电子文本文本编辑(编辑器)格式化的电子文本网络传输•计算机对文本的处理8/15/202412 编码字符集•字符(character)  是记录语言的符号,它适用于一种或多种书面语言•编码字符集(coded character set)  按某种规则编码的字符的有序集合每个编码字符集有两个最重要的属性:–字汇(repertoire):编码字符集中有哪些字符–编码规则:如何确定每个字符的代码•码长: 字符代码的长度它决定了代码空间的大小–定长码:7位,8位,双字节,4字节–可变长码:单-双-4字节码8/15/202413 汉字编码字符集•汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素•汉字的特点:–数量大(我国汉字自古至今累计已超过7万字,国家语委颁布的“现代汉语通用字表”包含7000汉字)–多个国家和地区使用:港台地区,日、韩、朝、新、马等–字形复杂,同音字多,异体字多•我国汉字编码的国家标准:–GB2312-80(6763个常用简体汉字和682个非汉字字符 )–GBK-95 (20902个CJK汉字和······符号)–GB18030-20008/15/202414 GB2312字符集及其码位分布GB2312 字符集及区位码在双字节代码空间中 GB2312 汉字内码的码位分布 8/15/202415 GBK字符集及其码位分布图形符号CJK汉字增补汉字•总计 23940 个码位,共收入 21003 个汉字和883图形符号•双字节编码,第1字节的最高位必为“1”,第2字节的最高位不一定是“1”;•简体和繁体汉字在同一个字符集中;•包含了中、日、韩认同的全部CJK汉字;•与GB2312-80保持向下兼容;8/15/202416 GB18030-2000的编码•采用单字节、双字节和四字节三种方式对字符编码。

      •单字节部分使用0x00至0x80码位•双字节部分采用两个八位二进制位串表示一个字符,其首字节码位从0x81至0xFE,尾字节码位分别是0x40至0x7E和0x80至0xFE•四字节部分采用GB 11383未采用的0x30到0x39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0x81308130到0xFE39FE398/15/202417 GB18030 双字节汉字的代码空间第一字节第二字节8/15/202418 GB18030 四字节汉字的代码空间第一字节第三、四字节8/15/202419 GBK和GB18030的应用•条件:–输入–显示与打印–处理:排序、检索、分词…..•举例:–扩充的汉字:朱鎔基, 冃 冄 円 冇 冊 冋 冎 冏 冐 冑 冓 冔 冘 冚 冝 冞 –繁體字:南京大學計算機係,今天天氣很好 8/15/202420 汉字编码 小结00                                         FF00FF27484汉字GB2312-80GB18030-2000GBKCJK汉字字汇兼 容兼容UCS/UnicodeISO 646ISO 2022兼 容兼容映射00                                         FF00FF20902汉字00                                         FF00FF6763汉字8/15/202421 文本的准备 •文本信息的输入:•文本的编辑(使文本内容正确,版面清晰整齐、美观大方):–对字、词、句、段落进行添加、删除、修改等操作;–字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等;–段落的处理:设置行距、段间距、段缩进、对称方式等;–页面布局处理:设置页边距、每页行列数、分栏、页眉、页脚等。

       8/15/202422 文本处理(Text Processing)•对文本中包含的文字信息进行深层次的分析、加工和处理例如对字、词、短语、句子、篇章的检查、统计、识别、转换、压缩、存储、检索、分析、理解和生成等) 翻译(Translation)文摘生成Summarizing释义(Paraphrase)摘要、关键字相同含义但不同的表达相同含义但不同的语种多文档自动综述Question-Answering自动分类提问回答综述文档分类文本过滤/文本检索文档8/15/202423 文本的分类•按是否格式化分:–简单文本(plain text) / 丰富格式文本(rich text)•按结构分:–线性文本 / 超文本(hypertext)•按是否可执行来分:–静态文本 / 动态文本 / 主动文档8/15/202424 文本处理软件(1)面向通信的文本处理软件 :           Outlook Express (2)面向办公的文本处理软件 :          MS Word , WPS2000(3)面向印刷出版的文本处理软件:          “飞腾”排版软件,PageMaker,PDF Writer (4)面向网络信息发布和电子出版的文本处理软件:          FrontPage, PDF Writer 8/15/202425 文本的输出(阅读、浏览与打印)•过程:1.对文本的格式描述进行解释2.生成文字和图表的映像(bitmap)3.传送到显示器或打印机输出•2种文本阅读器/浏览器:–嵌入在文本编辑(处理)软件中,如微软的Word,–独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等。

       8/15/202426 输出过程中字形的生成 •过程:–先根据字符的字体确定相应的字型库(font),–再按照该字符的代码从字型库中取出该字符的形状描述信息,–然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换,–最后将变换得到的字形放置在页面的指定位置处•2种不同的字库:–点阵描述 –轮廓描述  8/15/202427 3  图象与图形•数字图像按其生成方法可以分为两大类:–通过数字化设备获取的图像,它们称为取样图像(sampled image)、点阵图像(dot matrix image)、位图图像(bitmap image),以下简称图像(image);–计算机合成的图像(synthetic image),它们称为矢量图形(vector graphics),或简称图形(graphics);•两者在外观上很难区分•两者有许多不同的属性,一般需要使用不同的软件进行处理 8/15/202428 图象的获取过程•图象的获取设备:扫描仪,数码相机取 样模拟图像量  化量  化量  化数字图像分 色8/15/202429 黑白图象的表示Black and white image8/15/202430 灰度图象的表示Gray scale image8/15/202431 彩色图象的表示•图象的主要参数:图象分辨率,位平面数目,颜色空间的类型,像素深度等蓝色分量绿色分量红色分量8/15/202432 图象数据的压缩•图像数据量的计算公式(以字节为单位): 数据量=图像水平分辨率×图像垂直分辨率×像素深度/8 •数据压缩的必要性•数据压缩的可能性•数据压缩的两种类型:–无损压缩–有损压缩•压缩编码方法的评价:–压缩倍数的大小,–重建图像的质量(有损压缩时)–压缩算法的复杂程度  8/15/202433 图像压缩编码的国际标准 •JPEG•JPEG20008/15/202434 常用的图像文件•要求:–熟悉常用的图象文件名–了解它们有什么特性和适用的场合8/15/202435 BMP图像文件•微软公司提出,在Windows操作系统下使用的一种标准图像格式,•支持单色、16色、256色、真彩色图像,•一个文件存放一幅图像,可以使用RLC进行无损压缩,也可不压缩图像数据,•非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持。

      8/15/202436 TIF图像文件•是一种工业标准,有许多图像图形应用软件支持这种文件格式, •大量使用于扫描仪和桌面出版,•使用RLC、LZW等方法对图像数据进行无损压缩•支持单色、彩色图像8/15/202437 GIF 图像•颜色数较少(不超过256色) ,文件特别小,压缩比可调,适合网络传输•由于颜色数量受到限制,GIF更适合用来做插图、剪贴画等,用于色彩数要求不高的场合•GIF图象具有累进显示功能 •GIF89a格式能够支持透明背景(JPEG不支持) •目前网页上有大量的静态与动态GIF图象(20%)•属COMPUSERVE公司8/15/202438 GIF图像数据的交叉存储       行号          像 素                交插遍次   0  ……………………………………  1   1  ……………………………………           4   2  ……………………………………       3   3  ……………………………………           4   4  ……………………………………    2   5  ……………………………………           4   6  ……………………………………       3   7  ……………………………………           4   8  ……………………………………  1   9  ……………………………………           4 10  ……………………………………       3 11  ……………………………………           4 12  ……………………………………    2 13  ……………………………………           4 14  ……………………………………       3 15  ……………………………………           4 16  ……………………………………  1 17  ……………………………………           4 18  ……………………………………       3 8/15/202439 GIF图像的累进显示8/15/202440 GIF图像的累进显示8/15/202441 GIF支持透明背景• GIF 图象中的某个色彩,在浏览器显示该图像时被忽略而不被显示出来。

      • 效果是使图像浮现在页面上,增强了网页的外观•例8/15/202442 ANIMATED GIF将数张图片存成一个文件,从而形成动画效果 1 打开第1张图片;2 插入其他的图片;  3调整每张图片显示的时间;  4设定重复次数;       5 放入网页   例例8/15/202443 数字图象处理•内容:去噪、增强、复原、分割、提取特征、压缩、存储、检索等•主要目的:(1) 提高图像的视感质量如进行图像的亮度和彩色变换,增强或抑制某些成分,对图像进行几何变换,包括特技或效果处理等,以改善图像的质量2) 图像复原与重建如进行图像的校正,消除退化的影响,产生一个等价于理想成像系统所获得的图像,或者使用多个一维投影重建该图像3) 图像分析提取图像中的某些特征或特殊信息,如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征以及关系结构等,从而为图像的分类、识别、理解或解释创造条件4) 图像数据的变换、编码和数据压缩,用以更好地进行图像的存储和传输5) 图像的存储、管理、检索,以及图像内容与知识产权的保护等 8/15/202444 数字图像的应用(1) 图像通信包括图像传输、电视、电视会议等。

      2) 遥感3) 医疗诊断4) 工业生产中的应用如产品质量检测,生产过程的自动控制等5) 机器人视觉6) 军事、公安、档案管理等其他方面的应用如军事目标的侦察,制导和警戒,自动火器的控制及反伪装,指纹、手迹、印章、人像等的处理和辨识,古迹和图片档案的修复与管理等 8/15/202445 常用(通用)图像编辑软件•微软公司  画图软件(paint):可查看和编辑处理.jpg、.gif 或 .bmp图像•微软公司 imaging for windows•Microsoft Photo Editor•Ulead system 的PhotoImpact•ACD System公司的ACDSee32•Adobe PhotoShop8/15/202446 什么是计算机图形(graphics)•使用算法或几何要素(如点、线、面、体的位置、形状和大小)及表面材料的性质,在计算机中对景物和形体(无论是真实的还是假想的)进行描述(modeling),•需要显示时,计算机根据观察者的位置及光线的设定,生成该景物的图象    8/15/202447 形体与景物的建模方法线框模型实体模型表面模型几何造型技术过程模型技术分形几何形状语法微粒系统基于物理的建模8/15/202448 合成图像(graphics)的绘制•从景物的模型生成具有高度真实感的该景物的图像,此即所谓的图像绘制(rendering),也称为图像合成(image synthesis)。

      •图像绘制的过程包括如下处理:取景变换视域裁剪三角化光栅化隐藏面消除明暗处理阴影生成纹理映射景物的模型景物的图像Rendering Pipeline8/15/202449 计算机图形的应用(1) 计算机辅助设计和辅助制造(CAD/CAM)2) 利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等3) 作战指挥和军事训练4) 计算机动画和计算机艺术5) 其它:电子出版、数据处理、工业监控、辅助教学、软件工程等 8/15/202450 矢量绘图软件•专业绘图软件: –AutoCAD–MAPInfo、ARCInfo•办公与事务处理、平面设计、电子出版等领域:–Corel公司的CorelDraw,–Adobe 公司的Illustrator,–Macromedia公司的FreeHand,–微软公司的Microsoft Visio等•内嵌的绘图软件 8/15/202451 计算机图形的标准•图形软件(编程语言)标准:–国际标准:二维图形标准GKS,三维图形的国际标准是GKS-3D、PHIGS,–工业标准OpenGL,微软公司的Direct-3D•图形数据交换标准:–国际标准:CGM、WebCGM、SVG和STEP,–公司标准:Autodesk公司的DXF,以及Microsoft公司的WMF等。

       8/15/202452 4  数字声音•数字声音的特点:–是一种连续媒体,传输与播放有实时性要求–数据量大,对存储和传输的要求很高 •数字声音的类型:–取样(波形)声音•语音•全频带声音–计算机合成声音•合成音乐(MIDI)•合成语音8/15/202453 波形声音的获取方法:2. 量化(quantization,AD conversion )3. 编码(encoding)模拟声音信号量  化数字声音01100011001···编  码取  样1. 取样(sampling)8/15/202454 波形声音获取设备•联机获取设备(声卡)麦克风(microphone)声音卡(sound card)声波转换为电信号取样、量化、压缩、编码、模拟声音数字声音n脱机获取设备:数码录音笔8/15/202455 声卡的功能与原理DSPDMA接口PC总线取样,量化D/A重建滤波声音输出声音输入MIDI合成器mixerMIDI接口1.   波形声音的获取、编码;2.    波形声音的重建、播放;3.    MIDI消息的输 入;4.    MIDI声音的合成、播放;5.    (CD-ROM 驱动器的控制,CD-DA声音的播放)8/15/202456 波形声音的表示及参数•二进制串行表示,比特流(bitstream)形式•按一定的标准或规范进行了压缩编码•数据的结构按物理属性(时间,声道)进行组织,语义上没有结构化。

      •主要参数:–sampling  frequency(取样频率)–quantization  bits(量化位数)–number of sound channels(声道数目)–encoding  method ( compression method )(压缩编码方法)–bit rate(码率,比特率),每秒钟的数据量 波形声音的数据压缩•波形声音的码率 = 取样频率 × 量化位数 × 声道数 •全频带声音的压缩编码:–第1代压缩编码:PCM编码–第2代压缩编码:感知声音编码•数字语音的压缩编码:–波形编码–参数编码(模型编码)–混合编码8/15/202458 全频带声音的第1代编码技术•全频带声音指的是10 Hz~20,000 Hz范围里的所有可听声音.也叫做宽带声音或高保真(high-fidelity)声音;•第1代全频带数字声音(CD,DAT)的编码采用PCM编码:–采样频率:44.1 kHz 或 48 kHz–量化精度:16位–声道数目:1或2–码率:705.6/768 (kb/s) 或 1.41/1.54 (Mb/s)8/15/202459 全频带声音的第2代编码技术•目标:在保持高保真声音质量(transparent compression )的前提下,降低码率,减轻网络带宽的压力;•不但充分使用声音信息的统计冗余,而且利用人耳的听觉特性,即使用“心理声学模型(psycho-acoustic model)”,来达到压缩数据的目的,称为感知声音编码(perceptual audio coding)。

      8/15/202460 全频带数字音频的编码标准•MP3音乐是什么?•Dolby AC-3是什么?•Real Audio是什么?8/15/202461 关于流媒体•音(视)频媒体的传输要求–高带宽–连续实时传输–平稳传输,克服突发问题•传输音(视)频媒体的2种方式i先下载,后播放(下载方式,需要等待很长时间,有很大的存储需求)i边下载,边播放(流式传输方式,不需要下载完整个文件, 只需经过几秒或十数秒的启动延时即可进行播放)8/15/202462 什么是流媒体(Streaming)技术•流媒体技术就是允许在窄带网上让用户一边下载一边收看(听)音视频连续媒体的技术   ( Small packets of information comprising an audio or video file flow sequentially across the net to your computer only a step ahead of when you view(or listen to ) them)•使用流式传输技术的音/视频媒体,称为流媒体•1995年出现,优点:1.  等待时间大大缩短;  2.  减少了对缓冲容量的需求;3.  降低了对网络带宽的要求。

      8/15/202463 流媒体是如何工作的?a streaming media link is clicked the proper player or plug-in Web服务器流媒体专用服务器 Web browserStreaming media files HTML files http(TCP)rtsp:// HTML文档Real Time Streaming Protocols negotiates with the streaming serversends a steady and continuous data stream8/15/202464 HTTP, RTSP, and RTP/RTCPthe proper player or plug-in Web服务器Web browser流媒体专用服务器 Streaming media files HTML files (客户端)http/TCP启动A/VHelper程序参数:编码类型,服务器地址等RTSP/TCPRTP/UDP控制播放、暂停、快进、快倒及录制等命令将A/V数据传输给A/V客户程序RTCP/UDP8/15/202465 Streaming Technologies•四方面的技术内容:1.Encoding and creation tools(制作) 2.Servers and media files(发布)3.Transmission(传输)4.Media players or plug-ins (播放)•三个公司的产品:1.Real Networks公司的 Real Media2.微软公司的 Windows Media 3.苹果公司的 Quick Time8/15/202466 波形声音的文件格式•.wav (waveform),主要用在PC上, •.PCM,  使用PCM编码的声音文件,•.VOC,  声霸卡使用的音频文件格式•mp2, MPEG Layer I , II, •mp3, MPEG Layer III ,•rm,ra(RealAudio), RealNetworks的流式声音文件•.wma,  微软公司的流式声音文件•.aif (Audio Interchangeable File Format), 苹果机,8/15/202467 语音压缩编码的3类方法•波形编码 (Perception model-based compression)–benefits : generic–drawbacks : highest compression rates are difficult to achieve–Examples : PCM, ADPCM, Subband•参数编码,源编码 (Production model-based compression)–benefits : highest possible compression–drawbacks : signal source(s) must be know–Examples : vocoder•混合编码(Hybrid compression)–Examples : CELP极低低中码码率率(kb/s)1         2          4            8          16         32         64优     良     中     差      坏语音质量语音质量模型编码(源编码)混合编码波形编码8/15/202468 数字语音编码标准标准标准方法方法比特率比特率质量质量时间时间应用应用G.711PCM644.41972PSTNANSI 1015LPC-102.42.71976保密通信G.721ADPCM324.11984PSTNGSM(欧洲蜂窝通信)RPE-CELP133.61991ANSI 1016CELP4.83.21991G.728低延时CD-CELP164.01992IS 54(北美TDMA)VSELP83.51992IS 96(北美CDMA)QCELP1-83.41993日本蜂窝通信VSELP6.83.31993G.729ACS-ACELP84.21995IPG.723.1(H.323, H.324)ACELP6.33.981995IP半速率GSM(欧洲蜂窝通信)AMR5-63.41995新的低速率ANSI标准MELP2.43.319968/15/202469 数字语音的应用•记录/回放方式的应用–数字录音机(DAT)–数码录音笔                        –语音复读机,电子有声读物•通信/广播方式的应用–,移动–IP–DAB•合成声音的应用–自动应答系统–虚拟播音员–Story on demand8/15/202470 语音合成(TTS)文本分析与理解文本Prosody controlSpeech  generation合成语音一串语音基元语音基元库Text-to-phoneme   conversion发音标注发音规则库Prosody generation韵律控制参数韵律规则库n查找拼写错误,对不规范或无法发音的字符进行过滤。

      n分析文本中词或短语的边界,n分析文本中的数字、姓氏、特殊字符、专有词语等有关词语读音的性质n根据文本的结构、组成和标点符号,确定发音时语气的变换以及不同音的轻重方式n分析并决定各个音节的声调、语气和停顿方式,发音的轻重、长短等8/15/202471 音乐合成(MIDI)•乐曲的计算机表示方法——MIDI Message•乐曲的制作软件——音序器•存放乐曲的文件—— .MID 文件•播放乐曲的软件—— 媒体播放器•乐器声音的生成 —— 声卡上的音乐合成器8/15/202472 音序器软件的功能•MIDI乐曲的记录与制作;•MIDI乐曲的编辑,包括各种修改功能;•MIDI乐曲的播放,包括任意轨道的播放;•MIDI乐曲的存储;•乐谱的生成与打印8/15/202473 MIDI合成器的特性 1•MIDI合成器相当于一个电子乐队,它划分成16个 Channel(通道),每个通道是1个逻辑合成器, 各个逻辑合成器可演奏不同的乐器和不同的乐谱每个通道的volume, pan, reverb level及其它特性均可独立设置12345678910111213141516                                                                                                                                                                                                                                                8/15/202474 MIDI合成器的特性 2•每个通道能演奏最多128种不同的乐器(称为音色)。

      不同乐器有不同编号(称为Program或Patch号)每个通道一次只能演奏一种乐器,但可随时改变                                                                                                                                                                                                                                                                                                                                          8/15/202475 基于PC的电脑音乐系统 8/15/202476  •视频(video):随时间变化其内容的一组图象(24,25, 30帧/秒),又叫运动图象或活动图象(motion picture)•常见视频信号:电视,电影,动画等.•视频信号的特点:–内容随时间而变化,–伴随有与画面动作同步的声音(伴音),–人类接受的信息70%来自视觉, 其中活动图象是信息量最丰富、直观、生动、具体的一种承载信息的媒体。

      –视频信息的处理是多媒体技术的核心5  数字视频及应用 电视信号的彩色空间•彩色电视信号在远距离传输时,使用亮度信号Y和两个色度信号U、V来表示,与RGB表示可按下式进行转换: 亮度分量 Y = 0.3*R+0.59*G+0.11*B 色度分量 U = 0.493* (B-Y) 色度分量 V = 0.877 * (R-Y)•使用Y、U,V彩色空间的优点:①Y和U,V是独立的,因此彩色电视和黑白电视都可以使用,Y分量可由黑白电视接收机直接使用而不需做任何进一步的处理;②可以利用人的视觉特性来节省信号的带宽和功率,通过选择合适的颜色模型,可以使U,V的带宽明显低于Y的带宽,而又不明显影响彩色图像的质量8/15/202478 数字视频信号的获取视频信号数字化过程:(8-10 bits)prefiltersamplingQPCM编码数字视频信息模拟视频信号VUYUVY亮度信号的取样频率:13.5MHzU,V色度信号的取样方式有多种不同格式 亮度信号的取样(CCIR601)•ITU-R BT.601标准(CCIR601,美国称为D1标准),对3种制式电视的取样频率和有效分辨率都作了统一规定。

      •每一行的像素数目:PAL:      13.5MHz = 625×25×N = 15625×N,   N=864NTSC:   13.5 MHz = 525×30×N = 15734×N,  N=858     有效(可显示)像素 均统一为:720720 pel (有效取样样本)12/16 pel 132/122 pel水平扫描线(64us)蓝色为NTSC蓝色为NTSC8/15/202480 色度信号的取样(CCIR601)•人对颜色的敏感程度远不如对亮度信号那么灵敏,所以色度信号的取样频率可以比亮度信号的取样频率低,以减少数字视频的数据量•色度信号的取样频率有4种:   格式                 取样频率                   平均每个像素的样本数   4:4:4      同亮度信号取样频率                  3样本/像素   4:2:2      亮度信号取样频率的一半          2样本/像素   4:1:1      亮度信号取样频率的1/4             1.5样本/像素   4:2:0      亮度信号取样频率的一半,         1.5样本/像素                 但隔行处理8/15/202481 色度信号的4种取样格式4:2:2亮度信号色度信号4:4:44:2:04:1:1 常用数字视频信号的规格应用:      CCIR601——      CIF ——      QCIF——      SQCIF—— 视频捕获(采集)卡的功能•从多种视频源中选择一种作为视频输入;•支持不同的电视制式;•能同时处理图像信号的伴音;•可在显示器上监看输入的视频信号, 其位置及大小可调;•能将计算机生成的图像/图形/文本与视频图像迭加处理;•可随时冻结(定格)一幅画面,并按指定格式保存;•可 实时压缩与存储视频及其伴音信息;•可 实时解压缩并播放视频及其伴音信息,输出设备可选(VGA监视器、电视机、录相机等)8/15/202484 视频采集(捕获)卡的结构videograbbervideobufferoverlayconversionTV coderVGAgraphicsVGAVRAMMMCPUDSPCodecPCI  busvideoRGB monitorTV setdisc 数字摄像头•最高分辨率为640×480,一般都是352×288,•速度一般在30fps(每秒30帧)以下,•镜头的视角可达到45-60度, •支持USB接口 或FireWire(火线)接口。

      8/15/202486 数码摄像机 •提供480线以上的分辨率,清晰度高,•自动对焦(Auto focus),自动曝光(Auto Expose), •使用M-JPEG或MPEG-2进行压缩编码,然后记录在磁带或磁盘上,•提供录音功能,•数据量很大,采用USB接口或IEEE1394(FireWire)接口,后者传输速率可以达到200-800MB/s 8/15/202487 数字视频的压缩编码标准8/15/202488 数字视频的应用模式•Recording and playback模式–VCD–DVD–数字录像带•Communication 模式–单向(Broadcasting:数字电视,Web-TV)–双向(Interactive:ITV, VOD, 可视,视频会议)8/15/202489 数字视频应用的关键技术1存储/通信介质与信息记录/传输方法     (物理层)–大容量(高速率)–可靠性2数据组织与存取方法                               (系统层)•随机存取•不同系统之间的互操作3音视频数据编码                                       (应用层)–数据压缩、可伸缩性、基于内容、抗错能力,···–音视频同步,实时播放音视频信息的编码音视频信息的解码文件存取文件存取8/15/202490     数字电视的传播途径        数字视频节目视频服务器光盘制作地面无线(DVB-T)卫星(DVB-S)CATV (DVB-C)InternetVCDDVD解码器电视机PC机 VOD系统的分类•按系统规模:–小型视频点播系统:100个用户以内–中型视频点播系统:100~300之间–大型视频点播系统:300户以上•按响应方式:–True VOD –Near VOD•按交互性:–节目内交互(intraprogram)—— 全交互电视–节目间交互(interprogram)8/15/202492 VOD系统的组成•包括:服务器,网络和客户端3大组成部分,•客户/服务器模式,连续媒体数据,•只读型的(Read-Only)、非对称的通信方式。

      用  户接入网宽  带广域网交换器LAN家庭用户)单位用户视频服务器28.8-128 kb/s 10-100Mb/s分配服务器和/或智能部件网管工作站节目制作中心8/15/202493 谢  谢 !8/15/202494 附:数字媒体的抽象与符号化声音景物自然自然形式形式言语音乐图像数字化数字化取样取样表示表示文本乐谱符号符号表示表示抽象抽象结构描述语义描述图形8/15/202495 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.