国家自然基金标书-海量信息可用性基础理论与关键技术研究
86页1、项目名称:海量信息可用性基础理论与关键技术研究首席科学家:李建中 哈尔滨工业大学起止年限:2012.1-2016.8依托部门:信息产业部一、关键科学问题及研究内容2.1 关键科学问题为了适应海量信息管理基础设施建设的需要,针对国内外海量信息可用性管理的研究现状和发展趋势,本项目将围绕多种类型(不仅仅是关系数据库中存储的关系型)和以多种方式存储(不仅仅是集中式存储)的海量信息,以信息一致性、精确性、完整性、时效性和实体同一性为核心,针对前面提出的五大挑战,以保障信息可用性以及源于信息的知识的可用性为目标,拟解决“量质融合管理”、“劣质容忍原理”、“深度演化机理”三个关键科学问题,创建一套完整的海量信息可用性理论、方法学和技术体系。下边定义拟解决的三个科学问题。1. 量质融合管理量质融合管理是指数据、信息和知识三个层面上的量与质的融合管理机制。现有的海量信息基础设施只关注信息的规模、系统的处理能力和可扩展性,重在“量”的管理,忽视了信息“质量”(简称“质”)的管理。目前,劣质信息普遍存在,已经在实际应用中产生了严重后果,造成了巨大损失。信息质量的管理已经成为目前的巨大挑战问题。为此,我们必
2、须研究信息“质”的管理问题,将信息管理从“量”的管理拓展到“质”的管理,最终实现“量”与“质”的融合管理。信息来源于数据,知识来源于信息。数据的质量决定了信息的可用性,信息的可用性影响知识的可用性。为了彻底实现量质融合管理,我们必须在数据、信息、知识三个层面研究量质融合管理问题,提出完整的理论体系,解决关键技术问题。2. 劣质容忍原理劣质容忍原理是指在包含错误的信息和知识上完成正确或近似计算和推理的原理。数据、信息和知识的错误几乎无处不在已成为不争的事实。“劣质容忍”是指在信息和知识存在错误的情况下,如何完成正确或相对正确的计算。为了实现劣质容忍,我们必须完成如下两个挑战性任务:第一,自动发现并修正信息和知识的错误,将可校正的劣质信息和知识修复为完全正确的可用信息和知识,支持正确的计算和推理。第二,很多信息和知识的错误无法完全修复,经过部分错误的修复后,这些信息成为部分正确的弱可用信息和知识。在这种情况下,我们必须解决如何在弱可用信息和知识上完成满足应用精度要求的近似计算和近似推理,取得满足用户质量要求的相对正确结果。3. 深度演化机理深度演化机理是指信息和知识的多维度、全方位演化的内
3、在机理。信息不是一成不变的,它会随着时间和物理世界的变化而发生演化。源于信息的知识会随着信息的演化而进化。现有海量信息和知识管理在演化方面只关注完全正确的信息和知识,并仅限于探索随时间演化的过程。实际应用要求我们探索信息和知识的深度演化机理,即以可用性为核心的多维度、全方位、趋利、竞合演化机理。在信息的深度演化方面,我们需要研究多源信息在时间、空间、形态、粒度等多个维度上正向协同的演化机理。在知识的深度演化方面,我们需要研究由原始物理数据到有简单语义的信息、再到有丰富语义的知识的纵向演化机理以及知识被不断发现、聚合、更新的横向演化机理。2.2 主要研究内容本项目将围绕“量质融合管理”、“劣质容忍原理”、“深度演化机理”这三个关键科学问题,针对各种类型和不同形式存储的海量信息,以一致性、精确性、完整性、时效性和实体同一性为核心,沿着“数据信息知识应用”的路线,深入系统地研究多模态海量数据高质量获取与整合的理论和技术、海量信息可用性与量质融合管理的基础理论、海量信息错误自动检测与修复的理论和技术、海量弱可用信息上的近似计算的理论和算法、海量弱可用信息上知识发现、演化与服务的理论和技术,提出
4、完整的海量信息可用性的基础理论和关键技术,并将基础研究成果转换为有效的实用技术和算法,研制确保可用性的海量信息与知识的量质融合管理原型系统,以中国数字海洋(国务院908专项)和社保与经济普查信息为对象,建立复杂物理信息和管理信息两类主要信息的可用性保障应用示范,验证基础研究结果的可用性和有效性。本项目的具体研究内容如下。2.2.1高质量多源多模态海量数据的获取与整合的理论与方法研究由于信息源于数据,本课题将在数据层面围绕数据的“量质融合管理”、“劣质容忍原理”与“深度演化机理”这三个科学问题,针对数据的多源性和多模态性,以最大化数据质量为目标,以多模态数据融合计算为核心,研究高质量多源多模态海量数据的获取与整合的理论与方法,实现高质量的数据到信息的整合,在信息和知识的源头设置质量关,继而研究信息演化的机理。具体研究内容如下。1. 高质量多源多模态数据获取的多模态数据融合计算的理论与方法首先,研究数据源的质量评估模型理论,包括物理信息系统等多数据源的综合质量评估、高质量数据源的选择方法等。然后,研究多模态数据的质量评估模型理论,包括一致性、精确性、完整性、时效性、实体同一性等单指标质量评
《国家自然基金标书-海量信息可用性基础理论与关键技术研究》由会员d****y分享,可在线阅读,更多相关《国家自然基金标书-海量信息可用性基础理论与关键技术研究》请在金锄头文库上搜索。
工科大学化学 配套课件
跨境电商客户服务 第2版 习题答案
跨境电商客户服务 第2版 配套课件
跨境电商客户服务 试卷
高考一轮复习古代诗歌阅读专题:语言特色
高考一轮复习古代诗歌阅读专题:评价观点态度
高考一轮复习古代诗歌阅读专题:表达技巧
读懂高考古代诗歌 课件
多个关键词材料的审题立意
古代诗歌鉴赏专题:分析思想情感
高一语文统编版 致云雀课件
湖南省长沙市天心区2022-2023学年高三上学期9月入学检测语文试题(解析版)
AutoCAD实例教程 教学教案
湖北省高中名校联盟2023届新高三第一次联合测评(含答案)
机器视觉检测技术及应用 配套课件
音乐鉴赏 配套课件
Python网络爬虫基础教程 第8章 验证码识别
通信系统与技术基础 第5章 移动通信技术
机器视觉技术与应用实战 第九章 视觉定位与对位
机器视觉技术与应用实战 第十章 机器人视觉引导
2024-02-23 134页
2024-02-20 32页
2024-02-20 18页
2024-02-20 36页
2024-02-20 1页
2024-02-20 26页
2024-02-20 21页
2024-02-20 1页
2024-02-20 3页
2024-02-20 18页