
数据价值化与数据要素市场发展专题研究报告.docx
19页2021年数据价值化与数据要素市场发展专题研究报告 一、数据价值化与数据要素市场的概念内涵我们认为:数据是对客观事物(如事实、事件、事物、过程或思 想)的数字化记录或描述,是无序的、未经加工处理的原始素材数 据可以是连续的值,比如声音、图像,也可以是离散的,如符号、文 字数据资源是能够参与社会生产经营活动、可以为使用者或所有者 带来经济效益、以电子方式记录的数据区别数据与数据资源的依据 主要在于数据是否具有使用价值数据要素是参与到社会生产经营活 动、为使用者或所有者带来经济效益、以电子方式记录的数据资源 区别数据资源与数据要素的依据主要在于其是否产生了经济效益一)数据价值化概念内涵数据价值化是指以数据资源化为起点,经历数据资产化、数据资 本化阶段,实现数据价值化的经济过程数据价值化重构生产要素体 系,是数字经济发展的基础生产要素是经济社会生产经营所需的各 种资源数据作为数字经济全新的、关键的生产要素,贯穿于数字经济发展的 全部流程,与其他生产要素不断组合迭代,加速交叉融合,引发生产 要素多领域、多维度、系统性、革命性群体突破数据资源化是使无序、混乱的原始数据成为有序、有使用价值的 数据资源。
数据资源化阶段包括通过数据采集、整理、聚合、分析等, 形成可采、可见、标准、互通、可信的高质量数据资源数据资源化是激发数据价值的基础,其本质是提升数据质量、形成数据使用价值 的过程数据资产化是数据通过流通交易给使用者或所有者带来经济 利益的过程数据资产化是实现数据价值的核心,其本质是形成数据 交换价值,初步实现数据价值的过程数据资本化主要包括两种方式, 数据信贷融资与数据证券化数据资本化是拓展数据价值的途径,其 本质是实现数据要素的社会化配置二)数据要素市场概念内涵数据要素市场是数据要素在交换或流通过程中形成的市场要素 是指构成事物的必要因素或系统的组成部分,生产要素是生产系统的 组成部分,是维持企业生产经营活动所必须具备的基本因素,市场则 包含两种含义,其一是交易场所,其二为交易行为的总称深化数据要素市场化配置改革, 促进数据要素自主有序流动,破除阻碍数据要素自由流动的体制机制 障碍,推动数据要素配置依据市场规则、市场价格、市场竞争实现效 益最大化和效率最优化,有利于进一步激发市场创造力和活力,贯彻 新发展理念,最终形成数据要素价格市场决定、数据流动自主有序、 数据资源配置高效公平的数据要素市场,推动数字经济发展质量变革、 效率变革、动力变革。
二、数据价值化的现状和进展(一)数据资源化方兴未艾数据资源化是数据价值化的首要阶段,包括数据采集、数据整理、 数据聚合、数据分析等数据采集是根据需要收集数据的过程,数据 整理包括数据标注、清洗、脱敏、脱密、标准化、质量监控等,数据 聚合包括数据传输、数据存储、数据集成汇聚等,数据分析是为各种 决策提供支撑而对数据加以详细研究和概括总结的过程全球蕴含海量数据资源新一代信息技术的迅速发展与普 及、全球数据的“井喷式”生产、数据收集存储和处理成本的大幅下 降、机器计算能力的大幅提高,为数据资源化奠定了基础全球已初步形成较为完整的数据资源供应链,数据采集、数据标 注、时序数据库管理、数据存储、商业智能处理、数据挖掘和分析、 数据交换等技术领域迅速成长发展全球看,即使欧美日韩等发达国 家,仍处于数据资源化的初级阶段1.数据采集产业现状数据采集是数据资源化的首要环节,是数据标注、数据清洗、数 据存储、数据分析等的基础数据采集行业主体主要包括采集设备提供商、数据采集解决方案提供商两类数据采集设备提供商为数据采集提供传感器、采集器等专用采集 设备和智能设备数据采集解决方案提供商通过人工采集服务、系统日志采集系统、 网络数据采集系统等方式为客户提供解决方案。
人工采集对象主要包括语音数据、图像数据、视频数据等语音 采集通过采集不同人群的普通话、方言、英文和小语种等各类语音音 频,可应用于智能家居、智能设备、智能客服、智慧门店等场景落地 图像采集通过人工拍摄包括人像、商品、汽车、风景等各类真实生活 中的图像,助力图像识别模型的训练,可应用于智慧零售、智能设备 等场景视频采集通过人工拍摄指定的物体、人脸、安防等场景的视 频,满足多角度、多光线、多场景的多样化采集要求,可在智能安防、 智能设备、智慧金融等视觉场景落地系统日志是记录系统中硬件、软件和系统问题的信息,同时还可 以监视系统中发生的事件,用户通过分析系统日志来检查错误发生的原因或者寻找设备受到攻击时攻击者所留下的痕迹互联网公司每天 都会产生大量的日志,这些日志一般为流型数据,比如搜索引擎的页 面浏览量、查询量,数据量非常庞大网络数据采集包括通过网络爬虫等方式获取数据,对象主要是各 类网站,包括新闻类、社交类、购物类以及相应的一些 API、用户接 口和一些流型数据网站 Website、API、流型数据是目前网络爬虫主 要爬取的三大类对象,其中 Website 网站数据是网络爬虫的首要对象2.数据标注产业现状中国企业在2005年以后逐步涉足标注产业,尤其是2010年以后, 随着人工智能巨头的崛起,数据标注和采集需求激增,数据标注市场 逐渐形成,其提供的数据标注服务中,文本标注较为基础,多以语音标注、计算机视觉标注为主。
从运营模式来看,数据标注企业通过三类模式提供标注服务众包模式通过搭建众包平台,汇聚数据标注兼职人员力量,成为数据需 求方和兼职数据标注员的中介众包模式有利于节省企业运营成本,但公司对兼职人员管理较为困难,质量难以把控,现有发展较好的众 包企业有蚂蚁众包、阿里众包等自建模式通过自建标注工厂或基地, 提供数据标注服务自建模式有稳定的数据标注员,可以保障专业性 和数据质量组合模式将 众包模式与自建模式相结合一方面是互联网公司加入数据标注市场, 由于其资本雄厚、自身数据需求强、用户基数大,可凭借自建的标注 基地、科学的众包任务分发模式、智能化的数据采集与标注工具,实 现规模效应和高效作业另一方面,随专注数据 运营的企业规模扩大,可根据项目大小和客户保密要求灵活部署,将众包和自建模式相结合从垂直市场来看,数据标注市场可大致分成智能驾驶、智慧家居、 医疗卫生、金融服务、新零售、安防和其他领域数据标注有助于获得支持人工智能技术发展的 准确数据,其质量直接影响人工智能应用中算法的准确性和有效性, 有望推动医疗卫生行业的智能化发展,同时也意味着未来数据标注市场的门槛会逐步提高,数据标注将由简单标注到复杂标注升级。
从区域分布来看,数据标注已形成以北京为增长极辐射带动三大 产业增长带的区域格局未来,在垂直市场需 求不断精细化趋势下,数据标注产业将催生处更加专业化集聚化的产 业集群,数据标注质量和精度也会越来越高二)数据资产化加速推进数据资源化使种类丰富且内容庞杂的数据拥有了使用价值,发展 潜力十分巨大数据资产化,使具有使用价值的数据成为一种资产, 在市场上进行流通交易,给拥有者或使用者带来经济利益数据资产 化是构建数据要素市场的关键与核心,包括数据权属的确定、数据资 产的定价、数据的交易流通1.全球数据权属探索现状针对数据确权,全球各国在法律制度上进行了不同探索欧盟最早进行体系性构建,通过《一般数据保护条例》(GDPR)和《非个 人数据在欧盟境内自由流动框架条例》,确立了“个人数据”和“非个 人数据”的二元架构美国依托现有制度,加大对数据隐私的保护美国并无针对数据 的综合立法,而是将个人数据置于传统隐私权的架构下,利用“信息 隐私权”来化解互联网对私人信息的威胁日本严格界定数据保护范围,并不主张对数据本身另行设定新的 排他性私权经过学界、产业界以及政府部门的多方探讨,目前日本 对数据权属问题的处理规则已经比较明确。
概括来说,对数据权属以 自由流通为原则,特殊保护为例外俄罗斯规定的数据主体的权利与其他国家落脚点不同,多相对于 处理人而言所谓处理人,是指独立或与其他单位合作而处理个人数 据,并能确定个人数据的处理的目的、范围的国家机关、主管机关、 法人或个人印度《2018 年个人数据保护法案(草案)》将数据视为“信托” 问题,将每一个决定处理个人数据目的和方法的实体定义为“数据受 托人”,并要求其承担主要责任国内看,中央及地方积极探索数据确权,部分地区出台相关文件, 建立相关平台,筹划数据确权发展但整体来看,数据确权尚处于起 步阶段广东省率先发布较为详细的数权政策文件以深圳为代表发布 《深圳经济特区数据条例》,提出探索完善数据产权,着力解决数据 要素产权配置问题创设数据权,明确数据权的财产权属性与数据权 的内容,明晰个人数据权属、公共数据权属各地也积极进行了数据确权的实践探索2019 年 9 月工信部开通了我国首家数据确权平台“人民数据资产服务平台”,主要是对数据 的合法合规性进行审核,对数据生产加工服务主体、数据流通过程、 数据流通应用规则的一系列审核及登记认证2.不完全市场下的数据定价策略不完全市场下的数据定价实践,数据的价格受多因素影响,包括 数据量、数据种类、数据深度、数据完整性和数据实时性等。
因此平 台多通过采取不同定价策略,提高数据供给方参与积极性,满足数据 需求方的差异性需求,实现供需双方效益最大化总体来看,数据定 价策略采用了静态定价策略与动态定价策略相结合的方式静态定价策略包括固定定价、差别定价、拉姆齐价格固定定价是指数据卖方和交易平台根据数据商品的成本和效用, 结合市场供需情况,设定一个固定价格在交易平台上出售,最终成交 价即为该固定价格固定定价的优势在于价格固定,节省撮合协调的 时间成本和沟通成本;其局限在于适用范围较为狭窄,仅限于批量廉 价的数据交易差别定价是指以两种或两种以上不同反映成本费用的比例差异 的价格来销售一种数据产品或服务这种差别定价是基于不同的消费 者获取数据的愿望不同而实现的拉姆齐价格是一种高于边际成本的定价,此价格下净收益与净损 失的差值最大这种定价策略主要是针对公共数据服务,它们经济效 益不高却极具社会效益, 通过设置拉姆齐价格有利于提高效率政府 作为公共部门,其以“福利最大化为目标”是较为理性的动态定价策略包括自动计价、协商定价、拍卖式定价自动计价是指交易所针对每一个数据品种设计自动计价公式,卖 方和买方在交易系统的自动撮合下成交根据成交方式,最终成交价 分为三种形式:一是自动成交价格。
当买方应约价大于或等于卖方挂 牌价时,交易系统自动撮合成交,最终成交价为买方应约价二是卖 方选择成交价格对于不能直接成交的应约,卖方可选择能接受的应 约价与其成交,成交价为买方应约价三是数据分拆成交当买方仅 需要部分数据时,平台将对数据设定拆分原则,系统自动报价,而后 自动撮合双方成交其优势和特点在于定价方式的自动性,即依靠数 据交易平台设定的交易系统,完成数据的自动撮合成交但交易系统 的建设成本高,过程复杂,对数据交易平台有极高要求当交易双方对大数据价值的评估不一致时,买方和卖方可以直接通过协商定价达成对数据商品价值的一致认可协商定价的基础是各 方对数据价值的认可,只是对价值大小的认知程度不一,协商的作用 就是尽可能的取得双方对大数据价值的一致性拍卖定价属于需求导向定价,适用于一个卖方和多个买方交易的 情形基于诚信的拍卖定价不仅能够使买卖双方就价格达成一致,还 能实现数据的商品价值最大化,有利于促进数据交易流通不完全市场条件下,尽管国内外已经探索出许多数据定价方法, 但远未形成规范有序的数据定价规则,数据定价指标体系仍处于混乱无序状态一是价格影响指标尚不统一,不同的交易所对同一数据产 品的定价因价格影响指标的不同而不同,阻碍了统一市场的形。
