电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

文件、外部排序与外部搜索

135页
  • 卖家[上传人]:nt****6
  • 文档编号:438143
  • 上传时间:2017-02-24
  • 文档格式:PPT
  • 文档大小:2.84MB
  • / 135 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第十章 文件、外部排序 与外部搜索 主存储器和外存储器 文件组织 多级索引结构 外排序 1 主存储器与外存储器 主存储器 又叫 内存储器, 简称为 内存;外存储器 简称为 外存。 外存储器 与 内存储器 相比,优点是: 价格较低 永久的存储能力 缺点: 访问 外存 储器上的数据比访问 内存 要慢 56个数量级 要求我们在开发系统时必须考虑如何 使外存访问次数达到最少 。 2 磁带( 磁带是一种 顺序存取 设备。 磁带主要用于备份、存储不经常使用的数据,以及作为将数据从一个系统转移到另一个系统的脱机介质。 3 读出头 写入头 磁带 送带盘 卷带盘 磁带卷在一个卷盘上,运行时磁带经过读写磁头,把磁带上的信息读入计算机,或者把计算机中的信息写到磁带上去。 数据记录在磁带带面上。在带面上并列存放有 9 个磁道的信息,即 每一横排有 9 位二进制信息 : 8 位数据加 1 位奇偶校验位。 磁带的存储密度用 为单位,典型的存储密度有 3 种: 6250=246排/ 1600=64排 / 80032排 /正常走带速度为 3 5m/设备而异。 4 数据的传送速度 = 存储密度 走带速度 。 在应用中使

      2、用文件进行数据处理的基本单位叫做 逻辑记录 ,简称为记录;在磁带上物理地存储的记录叫做 物理记录 。 在使用磁带或磁盘存放逻辑记录时,常常把 若干个逻辑记录打包 进行存放,把这个过程叫做“块化”( 经过块化处理的物理记录叫做 块化记录 。 磁带设备是一种启停设备。磁带每次启停都有一个加速与减速的过程,在这段时间内走带不 5 稳定,只能走空带,这段空带叫做 记录间间隙者 块间间隙 其长度因设备而异。 6 磁带速度 75秒 传输速度 7000秒 速 加速 减速 物理记录 启动位置 停止位置 传输开始 传输完成 经过时间 如果每个逻辑记录是 80个字符 , 则对存储密度为 1600磁带,一个逻辑记录仅占 80/1600 = 每传输一个逻辑记录磁带走过 接着磁带要走过一个 结果大部分时间都花费在走空带上, 存储利用率只有 1/16。 如果将若干逻辑记录存放于一个块,将 以提高存储利用率。例如,将 50个有 80个字符的逻辑记录放在一个块内,此块的长度将达到 5080/1600 = 储利用率达到 此在磁带上采用 按块读写 。 7 在磁带设备上读写一块信息所用时间 其中, 延迟时间 ,即读写磁头到

      3、达待读写块开始位置所需花费的时间,它与当前读写磁头所在位置有关。 写所用时间 ,它等于数据传输时间加上 磁带设备只能用于处理变化少,只进行 顺序存取 的大量数据。 8 磁盘( 磁盘存储器通常称为 直接存取设备 ,或 随机存取设备 ,它访问外存上文件的任一记录的时间几乎相同。 磁盘存储器可以 顺序存取 ,也可以 随机存取 。 目前使用较多的是 活动臂硬盘组 :若干盘片构成磁盘组,它们安装在主轴上,在驱动装置的控制下高速旋转。除了最上面一个盘片和最下面一个盘片的外侧盘面不用以外,其他每个盘片上下两面都可存放数据。将这些可存放数据的盘面称为 记录盘面 。 9 10 主轴 盘片 活动臂 (回转臂) 读写磁头 磁道 柱面 每个记录盘面上有很多 磁道 ,数据就存放在这些磁道上。它们在记录盘面上形成一个个同心圆。 每个记录盘面都有一个读写磁头。所有记录盘面的读写磁头都安装在同一个动臂上,随动臂向内或向外做径向移动,从一个磁道移到另一个磁道。 任一时刻,所有记录盘面的读写磁头停留在各个记录盘面的 半径相同 的磁道上。运行时,由于盘面做高速旋转,磁头所在的磁道上的数据相继在磁头下,从而可以读写数据 。

      4、11 各个记录盘面上半径相同的磁道合在一起称为 柱面 。动臂的移动实际上是将磁头从一个柱面移动到另一个柱面上。 一个 磁道 可以划分为若干段,称为 扇区 ,一个扇区就是一次读写的最小数据量。这样,对磁盘存储器来说,从大到小的存储单位是:盘片组、柱面、磁道和扇区 。 对磁盘存储器进行 一次存取所需时间 : 1. 当有多个盘片组时,要选定某个盘片组。这是由电子线路实现的,速度很快。 12 2. 选定盘片组后再选定某个柱面,并移动动臂把磁头移到此柱面上。这是 机械动作 ,速度较慢。这称为“ 寻查 ( 。 3. 选定柱面后,要进一步确定磁道,即确定由哪个读写磁头读写,由电子线路实现。 4. 确定磁道后,还要确定所要读写数据在磁盘上的位置(如在哪一个扇区)。这实际上就是在等待要读写的扇区转到读写磁头下面。这是 机械动作 。这段时间一般称为旋转延迟( 间 。 5. 真正进行读写时间。 13 在磁盘组上一次读写的时间主要为: 其中, 均寻查时间 ,是把磁头定位到要求柱面所需时间,这个时间的长短取决于磁头移过的柱面数。 均等待时间 ,是将磁头定位到指定块所需时间。 在 个扇区集结成组,称为簇 。簇是文

      5、件分配的最小单位,其大小由操作系统决定。在 件分配的最小单位和读写的最小单位是一个扇区,称为一个 块 ( 14 缓冲区( 磁盘一次读写操作访问一个扇区,称为访问“一页”( “一块”( 又称为“一次访外”。 为了实施磁盘读写操作,在 内存中 需要开辟一些区域,用以存放需要从磁盘读入的信息,或存放需要写出的信息。这些内存区域称为 缓冲区 。 多数操作系统至少设置两个缓冲区,一个为 输入缓冲区 ,一个为 输出缓冲区 。 15 例如,在从磁盘向内存读入一个扇区的数据时,数据被存放到输入缓冲区,如果下次需要读入同一个扇区的数据,就可以直接从缓冲区中读取数据,不需要重新读盘。 缓冲区大小应 与操作系统一次读写的块 的 大小相适应 ,这样可以通过操作系统一次读写把信息全部存入缓冲区中,或把缓冲区中的信息全部写出到磁盘。 如果缓冲区大小与磁盘上的块大小不适配,就会造成存储空间的浪费。 缓冲区的构造可以看作一个先进先出的 队列 。 16 缓冲区的定义及其操作 # 2048; T * /缓冲区数组 , 缓冲区容量 : ) = 17 T x); /缓冲区输出 T& x); /缓冲区输入 ; T x) = i

      6、 = 0; i T& x) i; 0; ; 19 文件组织 什么是文件 文件是存储在外存上的数据结构,一般是在逻辑上具有完整意义的一组相关信息项的有序序列。 文件分操作系统文件和数据库文件 操作系统中的文件是流式文件:是没有结构的字符流 数据库文件是具有结构的数据集合 数据结构中讨论的是数据库文件。 操作系统对文件是按 物理记录 读写的,在数据库中文件按 页块 存储和读写。 20 文件的基本概念 文件的组成 文件 由 记录 组成; 记录 由若干 数据项 组成。 记录是文件存取的基本单位,数据项是文件可使用的最小单位。 从不同的观点,文件记录分为 逻辑记录 和 物理记录 。前者是面向用户的基本存取单位,后者是面向外设的基本存取单位。 能够唯一标识一个记录的数据项或数据项集称为 主关键码项 ,其值称为 主关键码 ; 不唯一标识一个记录的数据项或数据项集称为次关键码项 ,其值称为 次关键码 。 21 文件结构包括文件的 逻辑结构 、文件的 存储结构 和文件的 操作 。 文件的逻辑结构是 线性结构 ,各个记录以线性方式排列。 文件的 存储结构 是指文件在外存上的组织方式,它与文件特性有关。 顺

      7、序组织 直接存取组织(散列组织) 索引组织 文件的操作是 定义在逻辑结构上 的,但操作的具体实现 要在 存储结构 上进行。 22 评价一个文件组织的效率 执行文件操作所花费的时间 文件组织所需要的空间。 23 文件的操作 检索 维护 简单查询 范围查询 函数查询 布尔查询 插入 删除 修改 重构 恢复 顺序文件 ( 顺序文件中的记录按它们进入文件的先后顺序存放,其 逻辑顺序与物理顺序一致 。 如果文件的记录按主关键码有序,则称其为 顺序有序文件 ,否则称其为 顺序无序文件 。 顺序文件通常存放在顺序存取设备(如磁带)上或直接存取设备(如磁盘)上。 当存放在顺序存取设备上时只能按顺序搜索法存取;当存放在直接存取设备上时,可以使用顺序搜索法、折半搜索法等存取。 24 顺序文件的存储方式 1. 连续文件 :文件的全部记录顺序地存放于外存的一个连续的区域中。优点是存取速度快、存储利用率高、处理简单。缺点是区域大小需事先定义,不能扩充。 2. 串联文件 :文件记录成块存放于外存中,在块中记录顺序连续存放,但 块与块之间可以不连续 ,通过块链指针顺序链接。优点是文件可以扩充、存储利用率高。缺点是影响了存取 和修改的效率。 25 直接存取文件 ( 又叫 散列文件。 利用散列技术组织文件。处理类似散列法,但它是存储在外存上的。 文件记录的 逻辑顺序与物理顺序不一定相同 。通过记录的 关键码 可直接确定该记录的地址。 使用 散列函数 把关键码集合映射到地址

      《文件、外部排序与外部搜索》由会员nt****6分享,可在线阅读,更多相关《文件、外部排序与外部搜索》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.