磁盘可靠性测试技术
15页1、磁盘可靠性测试技术磁盘可靠性测试技术 0. 前言前言-磁盘故障概率几何?磁盘故障概率几何? 在实际的使用场景中,磁盘的故障概率远远高于其他的模块 在网上收集到的数据显示,EMC 等公司的存储,HDD 的年故障率是 5%,据说 xio 是可 以达到 0.06%,另外 SSD 的年故障率是 1.5%,另外根据硬盘公司的相关数据显示,硬盘的故 障率一般在 2%-5% 磁盘替换率与其它硬件替换率的比较磁盘替换率与其它硬件替换率的比较 在HPC1、COM1和COM2中十种最频繁替换的组件的相对频率。缩写词直接来源于数据,并 不清楚在不同的数据集它们是否有同样的定义 1. 磁盘的故障类型磁盘的故障类型 在线备份服务提供商 Backblaze 已经得到了新一批的磁盘可靠性数据,其来自于该公司所 拥有的近 40000 块机械硬盘。Backblaze 深入分析 SMART 状态信息,以挖掘出与预测磁盘可 靠性最有关联的数据。事实证明,仅有极少数的属性与硬盘的阵亡密切相关。 S.M.A.R.T,全称叫,全称叫 Self-Monitoring, Analysis, and Reporting Technol
2、ogy 自我监测,分析和自我监测,分析和 报告技术报告技术。可以用来预测分析硬盘的潜在问题。可以用来预测分析硬盘的潜在问题。 Backblaze 在研究后指出,五年内的硬盘故障,主要集中在如下 5 个方面: SMART 5 - Reallocated_Sector_Count 重映射扇区计数 SMART 187 - Reported_Uncorrectable_Errors 不可修复错误计数 SMART 188 - Command_Timeout 指令超时计数 SMART 197 - Current_Pending_Sector_Count 当前待映射扇区计数 SMART 198 - Offline_Uncorrectable 自检时发现的不可修复错误 Reallocated Sector Count, “重映射扇区计数重映射扇区计数” 每块硬盘都有一定数量的备用扇区,用来在正常扇区出现读写错误的时候替换该扇区以保持硬 盘和数据的稳定性。硬盘出现扇区读写错误,如果以计入“重映射扇区数” ,无法用现有任何 软件修复,也就是说,这个损坏时永久的。一般来说重映射扇区数到达“Threshold
3、” (阈值, 临界值)之前,硬盘厂商都建议要做好数据备份工作,以免因为硬盘物理损坏造成数据丢失。 全新的硬盘,Reallocated Sector Count Data 值是 0,以后会逐渐增加,不会减少。如果全新硬 盘在较短时间内连续出现重映射扇区数增加的现象,则说明此硬盘品质较低,稳定性存在隐患。 Reported Uncorrectable Errors 无法校正的错误无法校正的错误 报告给操作系统的无法通过硬件 ECC 校正的错误。如果数据值不为零,就应该备份硬盘 上的数据了。 报告给操作系统的在所有存取命令中出现的无法校正的 RAISE(URAISE)错 误。 Command Timeout 命令超时命令超时 由于硬盘超时导致操作终止的次数。通常数据值应为 0,如果远大于零,最有可能出现的 是电源供电问题或者数据线氧化致使接触不良,也可能是硬盘出现严重问题。 Current Pending Sector Count 当前待映射扇区计数当前待映射扇区计数 数据应为 0,当前值应远大于临界值。 这个参数的数据表示了“不稳定的”扇区数,即等待被映射的扇区(也称“被挂起的扇区” )数
4、量。如果不稳定的扇区随后被读写成功,该扇区就不再列入等待范围,数据值就会下降。 仅仅读取时出错的扇区并不会导致重映射,只是被列入“等待” ,也许以后读取就没有问 题。所以只有在写入失败时才会发生重映射。下次对该扇区写入时如果继续出错,就会产生一 次重映射操作,此时重映射扇区计数(05)与重映射事件计数(C4)的数据值增加,此参数 的数据值下降。 Offline Uncorrectable Sector Count 脱机无法校正的扇区计数脱机无法校正的扇区计数 数据应为 0,当前值应远大于临界值。 这个参数的数据累计了读写扇区时发生的无法校正的错误总数。数据值上升表明盘片表面 介质或机械子系统出现问题,有些扇区肯定已经不能读取,如果有文件正在使用这些扇区,操 作系统会返回读盘错误的信息。下一次写操作时会对该扇区执行重映射。 而下面则是与年故障率相关的“不可纠正错误”的统计数据: Backblaze 为你揭示 SMART 信息与磁盘故障率之间的联系 当然,在这些相对重要的数据类别中, “重置扇区计数”(reallocated sector count)是最危险的 坏掉的扇区越多,硬盘的故障
5、率就越高。 详细的故障分析报告 https:/ 2. 磁盘检查工具磁盘检查工具 Smartctl 检查检查 smartmontools 是一款开源的磁盘控制,监视工具,利用它可以测试硬盘的健康状况,并在发 生故障前进行预警。 使用说明 在开始测试或监控之前,先检查一下目标硬盘是否支持 S.M.A.R.T,这里的参数-i 指出显示设 备信息,-d 指出设备类型,这里指定的设备类型为 ata,当然,如果是 SCSI 硬盘,就指定 scsi 了,最后的/dev/sda 就是设备 执行命令:smartctl -i -d ata /dev/sda smartctl 6.3 2014-07-26 r3976 x86_64-linux-3.10.0 (local build) Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org = START OF INFORMATION SECTION = Model Family: Western Digital Caviar Green (AF, SATA 6G
《磁盘可靠性测试技术》由会员添***分享,可在线阅读,更多相关《磁盘可靠性测试技术》请在金锄头文库上搜索。
房地产培训 -房地产策划流程常识介绍1
房地产市场报告-2021年重庆中心城区国庆市场总结
房地产市场报告 -2021年重庆商办公寓市场报告(8月)
房地产施工管理 -CL保温施工甲方经验总结
房地产活动策划 - 2021重阳节系列暖场“不负美意”活动策划方案
房地产培训-碧桂园【江中区域】拓客技巧
房地产市场报告 - 2021年08月天津二手房市场监测报告
房地产市场报告 - 2021年第三季度北京房地产市场监测报告-新房市场
“5G+工业互联网”典型应用场景和重点行业实践 (第二批)
房地产培训 - 豪宅价值标准以及客户分析
房地产活动策划 - 国际城邻里中心开业盛典(盛世国潮·荣耀开放)活动策划方案
房地产活动策划 -大嘉汇康养主题酒店试营业开业活动提报方案
房地产活动策划 -吾悦广场双十一AI+未来游乐园活动策划方案
房地产活动策划-2020购物中心圣诞季营销“重大圣诞节”活动策划方案
房地产活动策划 -商业广场圣诞新年欢乐趴“鬼马双旦玩FUN下”活动策划方案
房地产活动策划 -2020戴德粱行新春拉斯维加斯之夜活动策划方案
房地产活动策划 -2021地产项目金秋游园会暖场蓄客“元气生活节”活动策划方案
2021投融资策略与方法:企业资金困局破解之法
5G整体情况介绍
房地产活动策划 -商业广场元旦跨年盛典(中国范国潮风主题)活动策划方案
2022-04-02 14页
2022-03-31 48页
2021-08-08 2页
2021-08-07 14页
2021-08-07 3页
2021-08-07 35页
2021-08-07 11页
2021-08-07 5页
2021-08-07 9页
2021-08-07 5页