大数据安全与隐私保护.ppt
24页1、大数据安全与隐私保护,作者:冯登国 张敏 李昊 中国科学院软件研究所,大数据安全与隐私保护,一、大数据的现状,当今,社会信息化和 网络化的发展导致数 据的爆炸式增长,据 统计,平均每秒有 200万的用户在使用 谷歌搜索,各行业 也有大量数据在不 断产生。,缺点:安全与隐私问题是人们公认的关键问题。,二、大数据研究概述,特点,来源,大数据分析目标,大数据技术框架,三、大数据带来的安全挑战,大数据中的用户隐私保护,大数据的可信性,如何实现大数据的访问控制,大数据带来的安全挑战,大数据带来的安全挑战,用户隐私 保护,大数据的可信性,如何实现 大数据访 问控制,不仅限于个人隐私泄漏,还在于基于大数据对人们状态和行为的预 测。 目前用户数据的收集、管理 和使用缺乏监 管,主要依靠 企业自律,威胁之一是伪造或刻意制造数据, 而错误的数据往往会导致错误的结论。 威胁之二是数 据在传播中的 逐步失真。,(1)难以预设角色,实现角色划分; (2)难以预知每个角色的实际权限。,四、大数据安全与隐私保护关键技术,数据发布匿名保护技术,数据发布匿名保护技术是对大数据中结构化数据实现隐私保护的核心关键与基本技术
2、手段 典型例子:K匿名方案 k-匿名技术要求发布的数据中存在 一定数量(至少为k) 的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私,社交网络匿名保护技术,社交网络中典型的匿名保护: 1、用户标识匿名与属性匿名,在数据发布时隐藏了 用户的标识与属性信息 2、用户间关系匿名,在数据发布时隐藏了用户间的关系 常见社交网络匿名保护,数据水印技术,数据水印是指将标识信息以难以察觉的方式嵌入在数据载体内部且不影响其使用方法,多见于多媒体数据版权保护,也有针对数据库和文本文件的水印方案。 前提:数据中存在冗余信息或可容忍一定精度的误差 案例: 1、Agrawal等人基于数据库中数值型数据存在误差容忍范围,将少量水印信息嵌入到这些数据中随机选取的最不重要位上。 2、Sion等人基于数据集合统计特征,将水印信息嵌入属性数据中,防止攻击者破坏水印,数据水印技术应用:强健水印类可用于大数据起源证明,脆弱水印类可证明数据的真实性 存在的问题:当前方案多基于静态数据集,针对大数据的高速产生与更新的特性考虑不足,数据水印技术,数据溯源技术目标是帮助人们确定数据仓库中各项
《大数据安全与隐私保护.ppt》由会员F****n分享,可在线阅读,更多相关《大数据安全与隐私保护.ppt》请在金锄头文库上搜索。
2024-04-28 23页
2024-04-28 18页
2024-04-28 29页
2024-04-28 20页
2024-04-28 20页
2024-04-28 23页
2024-04-28 11页
2024-04-28 24页
2024-04-28 30页
2024-04-28 35页