好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

2022产业数据仓 数据分类分级规范.docx

20页
  • 卖家[上传人]:职**
  • 文档编号:343016738
  • 上传时间:2023-01-29
  • 文档格式:DOCX
  • 文档大小:140.21KB
  • 文本预览
  • 下载提示
  • 常见问题
    • 产业数据仓 数据分类分级规范2022目  次前  言 II引  言 III1 范围 42 规范性引用文件 43 术语和定义 44 数据的分类 54.1 分类要求 54.2 分类原则 64.3 分类维度 64.4 分类方法 104.5 分类流程 105 数据的分级 115.1 分级要求 115.2 分级原则 125.3 分级维度 125.4 分级方法 145.5 分级流程 145.6 数据级别变更 15附 录 A (资料性) 企业数据分类分级示例 16参 考 文 献 21I产业数据仓 数据分类分级规范1 范围本文件规定了产业数据仓数据分类分级的定义、原则、维度、方法和流程 本文件适用于指导产业数据仓中编目、归集的产业数据的分类分级工作2 规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件GB/T 35295-2017 信息技术 大数据 术语GB/T 38667-2020 信息技术 大数据 数据分类指南GB/T 4754-2017 国民经济行业分类DB33/T 2351-2021 数字化改革 公共数据分类分级指南3 术语和定义下列术语和定义适用于本标准。

      3.1 数据 data信息的可再解释的形式化表示,能够被计算机识别、存储和加工处理 [来源:GB/T 35295-2017,定义 2.2.1,有修改]3.2 产业数据 industry data产业数据,是指有效开展各种经济活动的实体,在组织生产、经营或业务活动过程中依法收集、产 生的数据3.3 产业数据仓 industry data warehouse是有效开展各种经济活动的实体,在组织生产、经营或业务活动的过程中依法收集、产生的数据汇 集、融合形成的数据资源池3.4 行业 industry从事相同性质的经济活动的所有单位的集合[来源:GB/T 4754-2017,定义 2.1]213.5 数据类目 data category关于给定数据字段的类型说明3.6 数据生命周期 data life cycle数据从数据的收集、存储、使用、加工、传输、提供、公开、删除等各种生存形态的演变过程3.7 分类主体 classification subject数据收集、存储、使用、分发、删除等过程中对数据进行梳理归类的组织或个人[GB/T 38667-2020,定义 3.4,有修改]3.8 分级主体 grading subject数据汇总、聚合、分析、加工、共享等过程中对数据进行梳理定级的组织或个人。

      3.9 数据分类 data classification按照数据具有的某种共同属性或特征,根据数据对象、数据来源、重要程度、共享属性、开放属性、 应用场景等,采用一定的原则和方法进行分类梳理和标识,以便于管理和使用[DB33/T 2351—2021,定义 3.2,有修改]3.10 数据分级 data grading根据数据的敏感程度和数据遭篡改、破坏、泄露或非法利用后对受侵害客体的影响程度,按照一定 的分级原则对分类后的数据进行定级,从而为数据全生命周期管理的安全策略制定提供支撑[DB33/T 2351—2021,定义 3.3,有修改]3.11 分类维度 classification dimension用于实现数据分类的某个或某些共同特征[GB/T 38667-2020,定义 3.6]3.12 分级维度 grading dimension用于实现数据分级的某个或某些共同特征4 数据的分类4.1 分类要求4.1.1 与国家、地方、行业法律法规关于数据分类分级的标准和要求相一致4.1.2 按照产业数据仓数据的多维特征及其相互间存在的逻辑关联进行科学、系统的分类4.1.3 使用的词语或短语应能准确表达数据类目的实际内容、内涵和外延,相同概念的用语应保持一致。

      4.1.4 应结合现实需求,符合用户对产业数据仓中的数据区分和归类的普遍认知4.1.5 同一分类维度内,同一条公共数据只分入一个类别4.1.6 定期评估分类维度、方法、结果的合理性,并进行动态调整4.1.7 实际分类维度的选择应根据各分类主体对象数据资源的特点加以确定4.2 分类原则4.2.1 科学性按照产业数据仓数据的多维特征及其相互间客观存在的逻辑关联进行科学和系统化的分类4.2.2 稳定性产业数据仓数据的分类应以产业数据仓数据目录中的各种数据分类方法为基础,并以产业数据仓中 数据最稳定的特征和属性为依据制定分类方案4.2.3 规范性所使用的词语或短语能确切表达数据类目的实际内容范围,内涵、外延清楚;在表达相同的概念时, 保证用语一致性;在不影响数据类目涵义表达的情况下,保证用语简洁在已有标准数据用语的情况下, 使用标准数据用语4.2.4 实用性产业数据仓数据分类要确保每个类目下要有数据,不设没有意义的类目,数据类目划分要符合用户 对产业数据仓数据分类的普遍认识4.2.5 扩展性产业数据仓数据分类方案在总体上应具有概括性和包容性,能够实现各种类型产业数据仓数据的分 类,以及满足将来可能出现的数据类型。

      4.3 分类维度4.3.1 数据管理维度从元数据角度对产业数据仓数据资源目录中的数据进行数据管理维度分类,主要包括:--按数据产生方式分类;--按数据结构化特征分类;--按数据内容分类4.3.1.1 按数据产生方式按照产业数据仓数据的产生方式和存在形态进行划分,包括:a) 原始数据:主要指由数据源产生,且未经过加工的数据;b) 衍生数据:主要指对原始数据敏感信息进行脱敏处理后的数据;c) 融合数据:主要指经分析加工后,各种数据融合产生的新数据4.3.1.2 按数据类型分类依据数据类型,可将产业数据仓数据分为下列三类a) 结构化数据:1) 由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理;2) 在技术上,结构化数据能满足高速数据读写需求、数据备份需求、数据供需需求和数据容灾需求b) 非结构化数据:1) 数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等;2) 在技术上,非结构化数据比结构化数据更难标准化和理解,所以存储、检索、发布和利用这类数据需要更加智能化的 IT 技术(例如海量存储、智能检索、知识挖掘等)。

      c) 半结构化数据:1) 介于结构化数据和非结构化数据两者之间的数据,从逻辑上它是结构化数据,但是它的结构变化很大,不能够简单地用二维表来存储和管理;2) 半结构化数据可以通过灵活的键值调整获取相应信息,且数据的格式不固定,如 json,同一键值下存储的信息可能是数值型的,可能是文本型的,也可能是字典或者列表;3) 半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要;4) 常见的半结构数据有 XML 和 JSON4.3.1.3 按数据内容分类产业数据仓数据按照数据内容分类,可包括但不限于以下几类: a)政策法规;b)行业规划; c)经济运行; d)发展战略; e)投资管理; f)数字经济; g)技术创新; h)信息安全4.3.2 业务应用维度对产业数据仓数据资源目录中的数据进行业务应用维度分类, 主要包括:--按数据所属行业分类;--按数据业务主题分类;--按数据产生来源分类;--按数据开放属性分类;--按数据共享属性分类;4.3.2.1 按数据所属行业分类根据产业数据仓数据所涉及的行业领域范畴,采用 GB/T 4754-2017 规范的国民经济行业分类,将其划分的四级类目的前三级(即门类、大类、中类)对应本标准中数据分类的大类、中类、小类。

      a) 按行业将产业数据仓中的数据分为以下大类:农、林、牧、渔业;采矿业;制造业;电力、热力、燃气及水生产和供应业;建筑业;批发和零售业;交通运输、仓储和邮政业;住宿和餐饮业;信息传输、软件和信息技术服务业;金融业;房地产业;租赁和商务服务业;科学研究和技术服务业;水利、 环境和公共设施管理业;居民服务、修理和其他服务业;教育;卫生和社会工作;文化、体育和娱乐业; 公共管理、社会保障和社会组织;国际组织b) 对于每一个大类数据,按照线分类法将数据划分为中类c)对于每一个中类数据,按照线分类法将数据划分为小类4.3.2.2 按数据业务应用分类产业数据仓数据业务应用,可分为下列六类:a) 按生产类业务应用将产业数据仓数据进行分类; b)按分配类业务应用将产业数据仓数据进行分类; c)按流通类业务应用将产业数据仓数据进行分类; d)按消费类业务应用将产业数据仓数据进行分类; e)按要素类业务应用将产业数据仓数据进行分类; f)按服务类业务应用将产业数据仓数据进行分类4.3.2.3 按数据产生来源分类产业数据仓数据按数据来源分类,可分为政府数据资源和企业数据资源政府数据资源,主要来自省级部门业务数据和服务数据、各地市部门业务数据和服务数据:a) 省经信厅、省发展改革委、省科技厅、省财政厅、省人力社保厅、省商务厅、省市场监管局、省地方金融监管局、省统计局、浙江省税务局、人行杭州中心支行、浙江银保监局、省电力公司等部门 的业务数据和服务数据;b) 各地市的业务数据和服务数据。

      企业数据资源,主要来自工厂、企业、工业互联网平台、第三方服务商等,包括:a) 主动公开数据:如企业网站发布的企业新闻、产品与服务,以及企业发布的年报数据等;b) 依法报送数据:如企业登记、纳税申报、社保公积金缴纳、统计上报等数据,一级依法配合主管部门监管所提供的环保、能耗、安全生产等数据;c) 业务申报数据:如企业进行工作申报、奖励申报、项目申报等业务活动向有关部门提供的数据;d) 授权使用数据:企业在获得第三方服务过程中,所需提供的数据,如申请融资过程中授权金融机构等第三方使用的数据;e) 工业互联网数据:在使用工业互联网平台时,企业授权平台所沉淀的数据和通过接口使用的数据等;f) 日常经营数据:企业授权提供的招聘、投融资、采购、生产、库存、销售、检验检测等部分经营数据;g) 第三方权威机构发布的数据:如知识产权,法院裁判文书、行业研报等;h) 其他数据:如新闻媒体公开报道、政府招标合同公示、行业评价排行、舆情等数据4.3.2.4 按数据开放属性分类根据数据开放属性分类形成无条件开放类、受限开放类和禁止开放类数据a) 无条件开放类:无条件开放类数据是指法律、法规明确可以开放,以及除受限开放类和禁止开放类之外的数据。

      b) 受限开放类:受限开放类数据指涉及公民、法人和非法人组织,经过脱敏、授权后可以开放的数据,或无条件开放将严。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.