电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

基于云计算的信息检索

  • 资源ID:459289645       资源大小:83KB        全文页数:8页
  • 资源格式: DOC        下载积分:15金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要15金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

基于云计算的信息检索

基于云计算的信息检索技术一.概念介绍1. 云计算(1) .云计算的定义目前,云计算没有统一的定义,当前云计算的定义主要包括如下几种。1) 维基白科:云计算将IT相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过 Internet获取需要的服务。2) 中国云计算网:云计算是分布式计算 (Distributed Computing) 、并行计 算(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些科 学概念的商业实现。3) 云是一个包含大量可用虚拟资源(例如硬件、开发平台以及I /0艮务)的资源池。这些虚拟资源可以根据不同的负载动态地重新配置,以达到更优化的资源利用率。这种资源池通常由基础设施提供商按照服务等级协议(ServiceLevelAgreement, SLA沫用用时付费(Pay-Per-Use , PPU*勺模式开发管理。对比上述 定义,可以发现,文献6和文献8中给出的定义的相似之处在于它们都提到了 云计算提供服务。从云计算用户的角度给出定义:即用户在不了解具体实现的情况下通过 Internet获取服务。(2) 云计算技术具有以下特点。1) 云计算系统提供的是服务。服务的实现机制对用户透明,用户无需了解云 计算的具体机制,就可以获得需要的服务。2) 用冗余方式提供可靠性。云计算系统由大量商用计算机组成集群向用户提 供数据处理服务。随着计算机数量的增加,系统出现错误的概率大大增加。 在没 有专用的硬件可靠性部件的支持下, 采用软件的方式,即数据冗余和分布式存储 来保证数据的可靠性。3) 高可用性。通过集成海量存储和高性能的计算能力,云能提供较高的服务质量。云计算系统可以自动检测失效节点,并将失效节点排除,不影响系统的正常运行4) 高层次的编程模型。云计算系统提供高层次的编程模型。用户通过简单学 习,就可以编写自己的云计算程序,在“云”系统上执行,满足自己的需求。现在云计算系统主要采用Ma广Reduct莫型.5) 经济性。组建一个采用大量的商业机组成的集群相对于同样性能的超级计 算机花费的资金要少很多。6) 服务多样性。用户可以支付不同的费用,以获得不同级别的服务等。(3) 结论:为了更好地定义云计算,必须从云计算的服务使用者,服务提供者,组织方 式,内部实现机制等方面同时定义。根据现有定义的不足,本文定义云计算为:“云计算是由网格计算发展而来的,前台采用用时付费的方式通过Internet向用 户提供服务。云系统后台由大量的集群使用虚拟机的方式,通过高速互联网络互连,组成大型的虚拟资源池。这些虚拟资源可自主管理和配置。用数据冗余的方 式保证虚拟资源的高可用性。并具有分布式存储和计算、高扩展性、高可用性、 用户友好性等特征。”(4) 云计算基本模型在图1中的基本模型中,用户通过用户接口从云计算服务目录中选择一项自 己需要的服务,请求被送给系统管理单元,并查找提高服务所需要的资源,然后 调用Provisioning Tool从“云”中提取出所需的资源,雕刻出一朵特定的“云朵”来提供服务。其中Monitoring and metering 为可选单元,监视“云”的使 用情况,保存资源与特定用户的归届关系,Servers “云”里面是由服务器互连 构成的一张大网,由系统管理工具进行管理,可进行并行计算,通过虚拟技术实 现最大化资源的利用并提供服务给用户。2 .基丁云计算的检索1. 介绍与原理云计算作为商业服务模式不仅影响了整个IT行业。同时给信息检索带来了巨 大的影响,通过云计算平台,将本来的一个单个的服务器连成了一个云,每个服务器变成了云中一个个节点。从而组成了一个检索成本低、信息资源利用率高、 速度快的信息检索系统。云计算技术给信息检索带来的影响主要表现在以下几个 方面。(1)存储方式云计算采用的是一种叫做云存储的存储模式,云存储将网络中各类存储设备 通过应用软件集合起来协同工作,对外提供数据存储和业务访问功能的一个系统。 云存储主要是由4层组成:存储层、基础管理层、应用接口层、访问层。云存储 改变了过去的存储模式,由过去独自存储模式转变为由数据中心集中管理。过去的数据大多存放在各个数据信息提供者自己的服务器上,而云存储提供商采用集中的数据中心向用户提供数据存储服务。由一朵朵的存储云连成了成片的存储云 群,用户可以通过终端软件对数据进行访问使用,而不用知道这些数据是如何进行存储,存储到哪,这也构成了数据源异构的现象, 将使得信息检索系统在对数 据检索的时候出现迷路的现象。(2)检索模式传统的信息检索多采用的是集中申行式检索,使得检索系统的覆盖面限.只能完成某一个领域或某一方面的信息检索. 采用的申行检索也使得检索效率低下, 一旦检索过程中某一环节出错,将影响整个检索过程。云将全球的数据集中放人 了存在于云中的各个服务器中.如云数据中心、云存储。信息检索不再是单个的 服务器或在单机上进行检索,而是需要面对多个存储服务器。 是一朵朵的云。这 就不能再采用传统的集中申行检索,而需要对以前的检索模式进行相应的改进。 云计算采用的是分布式并行计算方式, 这种分布式系统是由地域上分散、 相对独 立但相互联系和制约的种部分(子系统),通过网络互联构成的完成特定功能的整 体,是一种松耦合的MIM弟统在分布环境下的一种形式。系统中每一个分布节点 都可以是一台并行的计算机.这些计算机没有主次之分,处于同一平等地位。是 一种异构结构。并行计算是同一时间调用多个处理器来并发执行计算,解决了目前中央处理器(CPU)运行速度接近上限的问题,大大提高了运算的速度。能对大 规模的海量数据进行运算处理。基于云计算的信息检索系统中,当用户提出查询 要求,并将提问式提交给检索代理,检索代理将检索提问式发送给了存在于云中 的各个服务器,并对各个节点上的存储服务器中的数据信息进行分析排序.得出相关度排在前列的服务器.并对这些存储服务器进行并行分布式检索, 将检索结 果重新整合按相关度进行排序后传到用户检索界面呈现在用户面前.大大提高了检索能力和检索速度。2. 基于云计算的信息检索的特点(1) 成本低廉。基于云计算的信息检索系统将数据管理的任务都交给了专门 的数据管理中心集中管理,减少了硬件软件的投入,降低了相应的投入成本。(2) 可利用资源多。由于各个检索提供者可能将数据都放到了统一的数据中心。通过相互问的合作可以进行资源共享, 使检索的数据源成倍地增加,可以利 用的资源也相应增多。(3) 检索速度快。由于云计算采用的是分布式和并行技术,新技术解决了由 于计算机中央处理器(CPU)速度提高的瓶颈,大大提高了信息检索的速度。二.技术1.现有技术的研究1.云存储的加密问题大规模高性能存储系统安全需求,特别是云存储应用中,可扩展和高性能的 存储安全技术,是推动网络环境下的存储应用(如云存储应用)最根本的保证,已 经成为当前网络存储领域的研究热点。云存储应用中的存储安全包括认证服务、 数据加密存储、安全管理、安全日志和审计。(1)访问控制服务实现用户身份认证、授权,防止非法访问和越权访问。 主要功能包括:用户只能对经管理员或文件所有者授权的许可文件进行被许可的 操作;管理员只能进行必要的管理操作,如用户管理、数据备份、热点对象迁移, 而不能访问用户加密了的私有数据。(2) 加密存储是对指定的目录和文件进行加密后保存,实现敏感数据存储和传送过程中的机密性保护。(3) 安全管理主要功能是用户信息和权限的维护。如用户帐户注册和注销等, 授权用户、紧急情况下对用户权限回收等。(4) 安全日志和审计是记录用户和系统与安全相关的主要活动事件,为系统 管理员监控系统和活动用户提供必要的审计信息。对用户来说,在上述4类存储安全服务中,存储加密服务尤为重要。加密存储 是保证用户私有数据在共享存储平台的机密性核心技术。随着存储系统和存储设备越来越网络化,存储系统在保证敏感数据机密性的同时, 必须提供相应的加密 数据共享技术。保护用户隐私性要求存储安全建立在对存储系统的信任基础之上。 必须研究适用于网络存储系统的加密存储技术,提供端到端加密存储技术及密钥 长期存储和共享机制,以确保用户数据的机密性和隐私性,提高密钥存储的安全 性、分发的高效性及加密策略的灵活性。在海量的加密信息存储中,加密检索是 实现信息共享的主要手段,是加密存储中必须解决的问题之一。2加密信息检索技术对加密信息检索的研究始于200洗,Song人提出加密数据搜索的实用算法,Song人提出基于关键词的公钥加密算法,Park等人提出安全索引搜索算法。(1) 线性搜索算法在线性搜索算法中,首先用对称加密算法对明文信息加密。对于每个关键词 对应的密文信息,生成一申长度小于密文信息长度的伪随机序列, 并生成一由伪 随机序列及密文信息确定的校验序列。伪随机序列的长度与检验序列长度之和等 于密文信息的长度。伪随机序列及检验序列对密文信息再次加密。 在搜索过程中, 用户提交明文信息对应的密文信息序列。在服务器端,密文信息序列被线性地同 每一段序列模2加。如果得到的结果满足校验关系,那么说明密文信息序列出现, 否则,说明密文信息不存在。线性搜索方法是一种一次一密的加密信息检索算法, 因此有极强抵抗统计分析的能力。但其有一个致命的缺点,即逐次匹配密文信息, 这使得这种检索方法在大数据集的情况下难以应用。(2) 基于关键词的公钥搜索基于关键词的公钥加密搜索算法由BoneK人提出,其目的是可以在用户端 存储、计算资源不足的情况下,通过访问远端数据库获取数据信息。 存储、计算 资源分布具有不对称性,即用户的计算存储能力不能实时满足其需求。另一方面 用户在移动情况下存储、索引数据的需求也有增加,比如 Email服务等。在这种 特定情况下,需要保护用户的数据隐私。加密数据有多个不同来源,针对这一问 题的解决方法是加密算法使用公钥加密。算法的过程如下,首先生成公钥、私钥,然后对待存储的明文关键词用公钥 进行加密,生成可搜索的密文信息。(3) 安全索引安全索引由Park等人提出,解决了简单索引方式易受统计攻击的问题。 其机 制是每次加密所用的密钥是事先生成的一组逆 Hasrff列,加密后的索引被放入布 隆过滤器中。当检索的时候,首先用逆Hashff列密钥生成多个陷门,然后进行布 隆检测。对返回的密文文档解密即可得到所需检索的文档。针对有新用户加入、 旧用户退出的多用户加密信息检索, 这是一种解决方法。但其存在的缺陷是需要 生成大量的密钥序列,随着检索次数的增加,每多进行一次检索,其计算复杂度 均线性增加。这在实际应用中很难被接受。在以上提到的多种加密信息检索算法中, 所用的检索模型都是布尔模型,因 而无法根据查询与待检索文档的相关度进行排序操作。 在实际情况中,尤其是在 数据规模较大的云存储应用中,包含某一查询关键词的文档可能有很多个, 如何 在多个可能相关的文档中找出最相关的一个或若十个文档是需要解决的问题。 对 加密的文档,是否可以应用成熟的向量空间模型, 进而进行相关排序,是一个开 放的问题。(4) 弓I入相关排序的加密搜索算法Swaminathan人提出了保护隐私的排序搜索算法。在这一算法中,每一文 档中关键词的词频都被保序加密算法加密。加密文档被提交查询给服务器端后, 首先计算检索出含有关键词密文的加密文档;然后对用保序算法加密的词频对应 的密文信息进行排序处理;最后把评价值高的加密文档返回给用户,由用户对其 进行解密。这一种方法可以在给定多个可能相关文档的情况下对加密文档进行排

注意事项

本文(基于云计算的信息检索)为本站会员(博****1)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.