
多媒体数据库及基于内容检索.doc
6页第九章多媒体数据库及基于内容检索9.1多媒体数据的管理问题9.1.1 老式的数据管理¨ 层次型¨ 网络型¨ 关系型– 采用关系框架来描述数据之间的关系,通过把数据抽象成不同的属性和互相的关系,建立起数据的管理机制– 在数据库市场上占有明显的主导地位9.1.2 多媒体带来的问题¨ 数据量巨大且媒体之间量的差别也极大,从而影响数据库的组织和存储措施¨ 媒体种类的增多增长了数据解决的困难¨ 数据库的多解查询,非精确匹配和相似性查询将占相称大的比重¨ 顾客接口的支持9.1.2 多媒体带来的问题¨ 多媒体信息的分布对多媒体数据库体系带来了巨大的影响¨ 短事务解决与长事务解决¨ 服务质量的规定¨ 多媒体数据管理尚有考虑版本控制的问题9.1.3 多媒体数据与数据库管理¨ 在数据库中,一般常用的多媒体数据有字符、数值、文本、图像、图形一类的静态数据,也有像声音、视频、动画等基于时间的媒体类型¨ 字符数值¨ 文本数据– 核心字检索– 全文检索¨ 声音数据– MIDI、波形9.1.3 多媒体数据与数据库管理¨ 图形数据– 描述图形数据的核心是要有可以描述层次构造的数据模型– 图形数据可以分解为点、线、弧等基本图形元素¨ 图像数据– 图像数据库较早就有研究,已提出许多措施,涉及属性描述法、特性提取、分割、纹理辨认、颜色检索等。
¨ 视频数据– 对视频的管理还要在时间空间上进行检索和查询的内容可以涉及镜头、场景、内容等许多方面,9.2多媒体数据库体系构造9.2.1 多媒体数据库的一般构造形式¨ 联邦型构造– 针对多种媒体单独建立数据库,每一种媒体的数据库均有自己独立的数据库管理系统虽然它们是互相独立的,但可以通过互相通信来进行协调和执行相应的操作9.2.1 多媒体数据库的一般构造形式¨ 联邦型构造9.2.1 多媒体数据库的一般构造形式¨ 集中统一型构造– 只存在一种单一的多媒体数据库和单一的多媒体数据库管理系统;– 多种媒体被统一地建模;– 对多种媒体的管理与操纵被集中到一种数据库管理系统之中;– 多种顾客的需求被统一到一种多媒体顾客接口上;– 多媒体的查询检索成果可以统一地体现9.2.1 多媒体数据库的一般构造形式¨ 集中统一型构造9.2.1 多媒体数据库的一般构造形式¨ 客户/服务型构造– 多种单媒体数据仍然相对独立,系统将每一种媒体的管理与操纵各用一种服务器来实现;– 所有服务器的综合和操纵也用一种服务器完毕;– 与顾客的接口采用客户进程实现;– 客户与服务器之间通过特定的中件系统连接9.2.1 多媒体数据库的一般构造形式¨ 客户/服务型构造9.2.1 多媒体数据库的一般构造形式¨ 超媒体型构造– 这种多媒体数据库体系构造强调对数据时空索引的组织,在它看来世界上所有的计算机中的信息和其他系统中的信息都应当连接一体,并且信息也要可以随意扩展和访问。
– 不必建立一种统一的多媒体数据库系统,而是把数据库分散到网络上,把它当作为一种信息空间,只要设计好访问工具就可以访问和使用这些信息9.2.2 多媒体数据库的层次构造¨ 多媒体数据库可划分为四个层次9.2.2 多媒体数据库的层次构造¨ 多媒体数据库可划分为四个层次– 媒体支持层• 针对多种媒体的特殊性质,在该层中要对媒体进行相应的分割、辨认、变换等操作,并拟定物理存储的位置和措施,以实现对多种媒体的最基本数据的管理和操纵– 存取与存储数据模型层• 完毕多媒体数据的逻辑存储与存取• 在该层中,多种媒体数据的逻辑位置安排、互相的内容关联、特性与数据的关系以及超链的建立等都需要通过合适的存取与存储数据模型进行描述9.2.2 多媒体数据库的层次构造¨ 多媒体数据库可划分为四个层次– 概念数据模型层• 对现实世界用多媒体数据信息进行的描述,也是多媒体数据库中在全局概念下的一种整体视图• 在该层中,通过概念数据模型为上层的顾客接口、下层的多媒体数据存储和存取建立起一种在逻辑上统一的通道– 存取与存储数据模型层和概念数据模型层也可以通称为数据模型层9.2.2 多媒体数据库的层次构造¨ 多媒体数据库可划分为四个层次– 多媒体顾客接口层• 完毕顾客对多媒体信息的查询描述和得到多媒体信息的查询成果。
• 顾客一方面要可以把她的思想通过恰当的措施描述出来,并能使多媒体系统所接受• 次之,查询和检索到的成果需要按顾客的需求进行多媒体化的体现,甚至构造出“叙事”效果9.3 多媒体数据模型概述¨ 数据模型由三种基本要素构成:– 数据对象类型的集合• 描述了数据库的构造– 操作的集合– 通用完整性规则的集合• 通用完整性规则给出了一般性的语义约束¨ 这里仅简介部分的数据模型,相称于多媒体数据库系统层次构造的第二和第三层9.3.1 NF2数据模型¨ 所有的关系数据库中的关系必须满足最低的规定,这个规定就是第一范式,简称1NF¨ 满足在表中不能有表¨ 但由于多媒体数据库中具有多种各样的媒体数据,这些媒体数据又要统一地在关系表中加以体现和解决,就不能不打破关系数据库中有关范式的规定,要容许在表中可以有表,这就是所谓的NF2(Non First Normal Form)措施9.3.1 NF2数据模型¨ NF2数据模型是在关系数据库中引入抽象数据类型,使得顾客可以定义和表达多媒体信息对象¨ FoxPro的General字段,Paradox for Windows的动态注释、格式注释、图形和大二进制对象(BLOB)等。
¨ 具有很大的局限性重要是建模能力不够强9.3.2 面向对象数据模型¨ 面向对象措施论的某些基本概念– 对象:现实世界中所有概念实体被模型化为对象– 属性:构成对象的数据– 措施:定义在对象属性上的一组操作– 消息:对象间的通讯和祈求对象完毕某种解决工作是通过消息传递的– 对象类:类似的对象组合在一起形成对象类– 类层次:具有概括关系的对象类型成一种层次构造– 继承性:子类可以继承超类的部分或所有属性9.3.2 面向对象数据模型¨ 语义关联的描述– 汇集关联(Aggregation association,简称A关联):• 定义一种实体类的一组属性,这些属性的域既可以是实体类也可以是域类– 概括关联(Generalization association,简称G关联):• 表达实体之间的子类与超类的继承性关系– 互相作用关联(Interaction association,简称I关联):• 类似于E—R模型中的实体间的relation关系,用来表达两个实体类之间的互相作用或关系– 示例关联(Instance association):– has_method和has_rule关联:9.3.2 面向对象数据模型¨ 运算体系– 在数据库系统中运算基本上有三种:定义、查询和操纵。
– 定义涉及类的创立和对象的创立两部分– 查询涉及通过类名查询类构造、通过对象名或对象标记查询对象或对象的属性值、通过类名查询该类中满足某些约束条件的对象或对象的属性、对对象操作的查询等– 操纵运算涉及插入、删除和修改,其中每种均有类和对象两个操纵对象9.3.3 其他数据模型¨ 超媒体数据模型¨ 文献模型– 文献模型的基本构造是层次状的,其主构造是树形的¨ 专有媒体数据模型– 象图像数据库、视频数据库、全文数据库等针对特定领域的数据库,往往根据自己的需要建立符合自己特性的体系构造和数据模型,以完毕特定的任务9.3.3 其他数据模型¨ 专有媒体数据模型9.4 多媒体数据库基于内容检索9.4.1 什么是基于内容检索¨ 所谓基于内容检索,就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特性的媒体数据出来9.4.2基于内容检索系统的体系构造¨ 插入子系统– 该子系统负责将媒体输入到系统之中,同步根据需要为顾客提供一种工具,以全自动或半自动(即需顾客部分干预)的方式对媒体进行分割或节段化,标记出需要的对象或内容核心点,以便有针对性的对目的进行特性提取。
¨ 特性提取子系统– 对顾客或系统标明的媒体对象进行特性提取解决在提取特性时,往往需要知识解决模块的辅助,由知识库提供有关的领域知识9.4.2基于内容检索系统的体系构造¨ 数据库– 媒体数据和插入时得到的特性数据分别存入媒体数据库和特性数据库– 媒体库涉及多种媒体数据,如图像、视频、音频、文本等– 特性库涉及这种媒体顾客输入的特性和预解决自动提取的特性¨ 查询子系统– 重要以示例查询的方式向顾客提供检索接口9.4.2基于内容检索系统的体系构造9.4.2基于内容检索系统的体系构造¨ 检索过程· 初始检索阐明:顾客开始检索时,要形成一种检索的格式,最初可以用QBE或特定的查询语言来形成· 相似性匹配:将特性与特性库中的特性按照一定的匹配算法进行匹配· 特性调节:顾客对系统返回的一组满足初始特性的检索成果进行浏览,挑选出满意的成果,检索过程完毕;或者从候选成果中选择一种最接近的示例,进行特性调节,然后形成一种新的查询· 重新检索:逐渐缩小查询范畴,重新开始该过程直到顾客放弃或得到满意的查询成果时为止。
