电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

毕业论文-基于XML检索的词典软件的设计与实现

56页
  • 卖家[上传人]:桔****
  • 文档编号:480073322
  • 上传时间:2023-07-26
  • 文档格式:DOCX
  • 文档大小:899.20KB
  • / 56 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、基于XML检索的词典软件的设计与实现大连理工大学本科毕业设计(论文)基于XML检索的词典软件的设计与实现Design and Implement of XML Searching Based dictionary software学 院(系): 软件学院 专 业: 软件工程(日语强化)学 生 姓 名: 评 阅 教 师: 完 成 日 期: 2013/5/22 大连理工大学Dalian University of Technology摘 要随着词典数据的海量化,词典功能的多样化,简单搜索技术已不能满足需要。调查发现,主流词典软件以数据库和独立开发的存储磁盘为后台词库。而二维关系数据库又难以表达词条结构的层次关系,难以更新词库。鉴于此,本文提出了针对词库的存储和搜索的新方法-以XML为基础的词典搜索。XML的树形模式能够很好地体现词条结构的层次管辖关系,可以方便地描述不定量重复出现的词条属性。另外还能动态地为XML 补充子树实现词库更新。本文基于对词典搜索的改进算法,实现了一个基于XML的词典软件。首先比较了传统数据库技术与XML数据管理系统的优缺点,并着重讨论了XML的解析模型。基于XML

      2、方法和技术,在深入分析不同词条结构后,设计了词条存储结构并以此结构为基础设计实现了多种查询方式。独创性地提出分割文档索引方法和将属性值列入索引的方法。最后依据词典用户日益增长的新需求,本文还设计实现了模糊搜索、音位搜索和语音功能。其中音位搜索是词典搜索模式的重大突破,为用户提供了只需要根据发音就能搜索出所有相近词的功能。为即时翻译开辟了新路。最后,通过对软件的功能及性能测试,证实了XML词典搜索的高效性和优越性。关键词:XML 解析;词典二级存储;模糊搜索;音位搜索;语音合成IDesign and Implement of XML Searching Based dictionary softwareAbstract With the quantity of dictionary data grows, and the diversification of dictionary function, a simple search technology cannt meet the need. The survey found that mainstream dictionary sof

      3、tware developed independently by the database and storage disks for the background thesaurus. The two-dimensional relational database structure is difficult to express terms of hierarchical relationships, and update of it. Now, we propose a new way to store and search - XML-based dictionary. XML tree model can well reflect the entry level of the structure, and can easily governing repeated description relationship. Also can dynamically add XML sub-tree to achieve thesaurus updates.This article i

      4、s based on dictionary search algorithm to achieve an XML-based dictionary software. At first we compared the traditional database technology and XML data management system, and focused on XML parsing model. XML-based methods and techniques, after analysis the structure of different storage structure entry, we designed a storage structure and achieve a variety of ways to search. Put forward an innovative method of indexing- segment the document the attribute values are included as index.Finally,

      5、according to the new demands of the growing dictionary user, this paper also designed and implemented a fuzzy search, phonemic search and speech function. Among which phoneme dictionary search is a major breakthrough in the search mode field, it provides users only need to be able to pronounce the word and can search out all the possible words. Opened a new way for the instant translation. Finally, through the software functionality and performance testing, we confirmed the XML dictionary search

      6、s efficiency and superiority.Key Words:XML parsing; Two-level dictionary storage; Fuzzy search; Phoneme search; Speech synthesis目录摘 要IIAbstractIII1 文献综述11.1 背景介绍11.2 创新实践11.3 论文结构22 预备知识32.1 XML定义32.2 XML在词典编纂中的应用32.3 XML关键字搜索的特性42.4 XML的解析模型42.4.1推模型和拉模型52.4.2 DOM52.4.3 SAX62.4.4 XmlTextReader72.4.5 解析模型的选择82.5 强名称92.6 编码格式93 基于XML词典的设计113.1 需求分析113.1.1 功能性需求113.1.2 非功能性需求123.2 系统设计133.3 模块设计143.4 流程设计144 基于XML词典的实现174.1 用户界面174.2 显示控制184.3 二级存储结构184.4 XML存储形式194.5 制作词典文件194.5.1 以XML片段为基础制作词典文件

      7、204.5.2 以文本文档为基础制作词典文件204.5.3 词典编码224.6 生成索引224.6.1 分割文档224.6.2 碎片问题234.7 XML搜索244.7.1 文档检索244.7.2 搜索模式254.7.3 搜索算法254.7.4 音位搜索284.7.5 音位转换规则294.8 语音功能314.8.1 SAPI简介314.8.2 开发准备324.8.3 加强名称324.8.4 合成语音334.8.5 跟随朗读344.8.6 跟读算法354.9 其他问题364.9.1 音标及字体文件364.9.2 正则表达式匹配375 测试385.1 测试目标385.2 功能测试目标385.3 功能测试用例385.4 性能测试目标445.5 性能测试用例45结 论48参考文献49致 谢501 文献综述1.1 背景介绍在近几年的大学生纸质词典和电子词典使用情况的调查中72%的大学生使用电子词典,其中57%的大学生使用袖珍电子词典,10%的大学生使用个人电脑词典,5%的大学生使用在线词典。另据新华社消息,牛津大学出版社高级管理人员2010年8月29日说,鉴于对网络版的需求远远超过印刷版,牛津英

      8、文词典第三版将来可能不再印刷。牛津大学出版社行政总裁奈杰尔波特伍德告诉英国星期日泰晤士报记者,受互联网影响, 牛津英文词典将来可能仅以电子版形式出现。他说,“印刷版词典市场正在消失,每年缩水10%”。波特伍德预计,随着电子图书和类似美国苹果公司平板电脑iPad等工具的普及,印刷版词典可能还有大约30年“货架寿命”1。而使用XML作为存储结构和搜索结构恰能很好得显示XML灵活,快速的优势,为电子词典的实现提供了一条新的解决方案。在不影响搜索效率的前提下,避免了大量的数据库操作或网络传输资源消耗,带来更优的用户体验。1.2 创新实践本文在研究了当今流行的词典软件和用户新需求之后,提出了几点创新研究方法并将其实现。主要有以下几个方面。(1) 词库以XML文档替代庞大的数据库。不需要网络连接的离线词典。(2) 模糊搜索和交叉搜索。当今主流词典已经实现了跨词典跨语言的交叉搜索,作者在此基础上依据用户可能需要以不完整信息进行搜索的需求,实现了模糊搜索。(3) 音位搜索。在用户只会读不会写和验证拼写正确性的情况下使用。能搜索到与输入字母组合发音相近的所有单词。为语音转换提供可能。(4) 多语音选择。

      9、用户可根据喜好选择不同声音来朗读。(5) 跟随式朗读。提示用户现在正在朗读的文本以加深印象。(6) 保存音频到本地。用户可以转换任何英文汉字组合为音频。这些音频文件可随移动设备在任何地点被使用。可作为背诵单词、听小说、语音备忘提醒的方式等。1.3 论文结构本文共分为六章。第一章文献综述是对论文产生的背景和创新点的概述。第二章预备知识介绍了设计和实现部分需要掌握的专业知识。主要有XML定义及不同解析模型分析。此外,还有.NET强名称问题和编码格式介绍。第三章通过需求分析、系统设计、模块设计和流程设计详细阐述了设计过程、设计依据。为词典软件的实现做铺垫工作。第四章详细解释实现过程及遇到的问题和解决问题的方法。阐述顺序是依据具体软件开发的实际过程而定的。首先根据需求分析设计用户界面。第二步,研究并确定词典文件的存储形式。第三步,根据存储形式和索引设计实现XML搜索算法。此后,对于音位的搜索建立在单词搜索的基础上,再调用了音位生成算法,实现了根据任意英文字母组合智能搜索出与之发音相同的单词。第四步,详细介绍了文本转换语音并跟随朗读或保存音频的实现过程。最后介绍了开发过程中遇到的一些其他问题。第五章根据前文提出的算法及实现进行了详细测试并给出了测试结果分析。2 预备知识2.1 XML定义XML(Extensible Markup Language)是一套定义语义标记的规范,这

      《毕业论文-基于XML检索的词典软件的设计与实现》由会员桔****分享,可在线阅读,更多相关《毕业论文-基于XML检索的词典软件的设计与实现》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.