
保十洁介绍更新版.pptx
24页保保 10洁洁 -互联网社区净化服务互联网社区净化服务海量信息技术有限公司 陈乐p 1999年成立于天津, 2008年总部移师北京p 互联网时代的 “ 知识创新型企业 ”p 致力于 “ 中文智能计算、互联网数据挖掘 ” 的理论研究、技术研发和服务海量信息技术有限公司海量大事记 2002年年 12月海量分词技术应用于慧聪搜索引擎月海量分词技术应用于慧聪搜索引擎 2003年年 3月起海量与月起海量与 Autonomy等国际知名知识管理系统开发商合等国际知名知识管理系统开发商合作,为其产品提供中文处理技术作,为其产品提供中文处理技术 2004年与方正翔宇合作,形成一套基于发布系统的全文检索方案年与方正翔宇合作,形成一套基于发布系统的全文检索方案 2005年年 8月智能中心发布数据挖掘引擎月智能中心发布数据挖掘引擎 2006年年 7月为世界著名搜索引擎月为世界著名搜索引擎 AskJeeves提供分词服务提供分词服务 2007年 1月公司由软件型企业向互联网服务型企业全面转型 2007年年 5月,正式推出月,正式推出 ““ 海纳互联网智能采编服务海纳互联网智能采编服务 ”” 2009年与中国移动通信合作报项目。
使用海量的行为分析技术年与中国移动通信合作报项目使用海量的行为分析技术为用户定向推送报为用户定向推送报产品发展历程功能基础件海量中文智能分词基础件海量全文检索基础件海量关键词提取基础件海量内容消重基础件海量自动分类基础件海量短文本智能检索基础件应用系统全文检索服务DESE嵌入式数据库搜索引擎相关新闻服务分布式检索系统CKM—内容知识管理系统网页锚点标注系统互联网服务海纳互联网智能采编服务佰川互联网智能发行服务保 10洁互联网社区净化服务UGC超越 PPC社区用户增长还有巨大空间政府加强监管,经营风险提高 2010年政府的相关管理行动 5月 25日:工信部已关闭或屏蔽涉黄网站 1.9万个,未备案网站 33万余个 2010年 6月 8日:国新办 《 中国互联网状况 》 白皮书发布,主张合理运用技术手段遏制互联网上违法信息传播 6月 30日: “ 网上违法有害信息集中清理行动 ” 在京正式启动 6月 22日:猫扑大杂烩、站台网被关闭整改 7月 20日: CNNIC第 26次报告:中国网站总数从 323万个减少到 279万个,减少 44万网站 网站的应对 东北多家网络媒体因 “ 先审后发 ” 致社区活跃度迅速下降 部分商业网站采取 “ 先发后审 ” 使大量违法不良信息上网 标准缺失,品质无法保证 手段简单,漏洞多,容易破解 人员流失率高,培训难,管理成本高海量信息技术有限公司人工审核关键字屏蔽 验证码 现有社区内容审核的常见方法抑制了互动牺牲了用户体验漏判、误判严重损害了用户体验经营风险高效率低下降低了用户体验增加非主营成本为什么 “ 人工 +关键词 ” 不行?字符串匹配无法应对变形,导致大量漏判 手木仓 :123456789字符串匹配不经分词,导致大量误判 买了一 立主机 最近一直失眠 半夜两 三点 就醒了再也睡不着常用词设为敏感词,导致大量误判 “ 长春 ” 曾一度被设置为敏感词,遭到网民反对后取消 64作为关键词,会把 “ 64位 处理器 ” 、 “ 64路 公交车 ” 误判社区净化 -没有规矩不成方圆 《 互联网不良信息分类标准 》 违法广告、违规广告、违约广告;低俗信息(含血腥暴力)、色情信息(含淫秽信息);灌水信息;侵犯个人隐私信息、侵犯版权信息;其他不良信息 参考了 47份法律法规文件 《 互联网信息审核服务标准 》 信息分类 39大类 审核点主题分类(大类)• 国家;党派;人物;国际组织;社会;政策法规;宗教、民族、种族、邪教;实物;事件 审核难易度:语法级、语义级、语用级和背景级保保 10洁互联网净化服务洁互联网净化服务 -业务类别业务类别 净化(保证误删率、漏删率) 广告类(违法、违规、违约) 色情类 低俗类 侵权类 灌水类 个性类 诈骗类 审核(保证召回率) 敏感类保保 10洁互联网净化服务洁互联网净化服务 -处理维度处理维度I:实时计算 L:持久计算S:语义B:行为F:版式P:个性C:共性 如:广告: SCI、 SPI、 BPL色情: SCI灌水: SCI、 BCL、 BPL…….应用算法:LSI浅层语义分析卡方 (χ 2)特征选择LSH近似文本发现贝叶斯统计模型复方分词算法…….保保 10洁互联网净化服务洁互联网净化服务 -功能特点功能特点 智能精准n 智能分析:采用语义分析、行为分析、版式分析等智能计算技术n 精准识别:识别准确率 95%以上n 自动学习:系统自学习,及时形成知识积累 全面及时n 处理全面:处理数据业务类别全面、多维度判断标准n 高效及时:实时计算,单条处理平均小于 0.003秒 配置灵活n 个性定制:支持个性化标准,可根据需求定制私有净化引擎n 个性设置:用户可自行设置知识(关键词、黑白名单)和规则n 配置灵活:可灵活选择净化类型、设置过滤尺度保保 10洁互联网社区净化服务系统逻辑洁互联网社区净化服务系统逻辑保保 10洁互联网净化服务洁互联网净化服务 -技术优势技术优势 核心引擎n S语义引擎、 B行为引擎、 F版式引擎 人本计算n 实现众多用户知识共享,交叉证认 并行标引n 基于语法、语义、语用、背景、行为、形式的多维度,多组引擎进行并行标引 柔性判定n 在并行标引的基础上,采用结构智能方法论打造柔性判定模 型,进行柔性判断保保 10洁互联网净化服务洁互联网净化服务 -服务特点服务特点 云计算服务n 用户硬件零成本、实施低成本、维护无成本 无缝连接n 提供通用接口,与用户系统实现无缝连接 专家运营n 专业团队管理维护,实时监控、随时干预、即时生效保 10洁互联网社区净化服务 --价值•提升审核工作效率 5-10倍•降低审核成本 50%以上提升效提升效率率•与国家政策同步,保障网站 安全运营降低成降低成本本•净化社区氛围,增强 用户体验规避风规避风险险增强粘增强粘度度保保 10洁互联网净化服务洁互联网净化服务应用案例:某网站使用保 10洁互联网社区净化服务 5个月后:1、 维护安全:日均 95.84%不良信息被及时删除;2、 降低成本:由最初的 15名专兼职审核人员,逐步调整为目前 的2名专职人员轮值抽查;3、提升流量:正常发布量提升 86.6%,月复合增长率达到 9.01%。
成功案例 -酷 615人左右人左右加长验证码加长验证码3万篇左右万篇左右2人人缩减验证码缩减验证码近近 50万篇万篇(使用 保 10洁 互联网社区净化服务 4个月)海量团队总裁、创始人:郝玺龙 先生毕业于吉林大学情报工程专业;国家重大信息化工程专家组成员;863课题 “ 智能信息内容分析方法研究 ” 负责人首席科学家:周富秋 博士乔治敦大学人工智能方向博士;世界级中文智能计算专家;曾任英特尔中国研究中心技术总监;智能研究中心主任:陶鹏 博士约翰霍普金斯大学模式识别方向博士;曾任美国硅谷多家高科技公司首席工程师,软件架构师;互联网净化服务,海量互联网净化服务,海量 更专业十二年的中文智能计算技术积累数百家的媒体网站客户实践近百人的净化服务专业团队中国最专业的互联网社区净化服务!海量公司用户海量公司用户www. 。












