电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

光环大数据培训_大数据应用 影响推荐系统效果的一些因素

5页
  • 卖家[上传人]:gua****an
  • 文档编号:51373809
  • 上传时间:2018-08-13
  • 文档格式:DOCX
  • 文档大小:43.65KB
  • / 5 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/光环大数据培训光环大数据培训_ _大数据应用大数据应用 影响推荐系统效果的一些因素影响推荐系统效果的一些因素在一个网站或者 app 中,推荐系统通常会和整个大系统的多个方面有交互,推 荐系统本身也有很多的组成部分,再加上整个系统所处的大环境,综合起来会 有很多因素影响着一个推荐系统最终效果的好坏,这里的效果指的是包括准确 率、召回率、多样性等等指标在内的一个整体整体效果,不做具体区分。在这 里我们试对其中一些主要的因素做一讨论。需要指出的是,这些因素里面并不 是所有的我们都可以左右,但是了解它们究竟是什么对我们开发和优化系统还 是非常有用的。用户因素用户因素与广告系统需要同时面对用户和广告主不同,推荐系统的服务对象只有一 个,那就是用户,所以用户的因素很大程度会影响系统的效果。具体来讲,系 统中新用户和老用户的比例可以说是对效果影响最大的因素之一。大家知道推 荐系统是高度依赖用户行为的,而对于无任何行为或者行为非常少的新用户, 效果肯定是不会太好的,所以整个系统中新用户的比例越高

      2、,系统的整体表现 就会越差。这就是一个典型的推荐系统本身无法左右的因素,而是需要整个系统共同 努力来解决。对于这个问题,有两种解决思路:一种是努力优化推荐系统的冷 启动算法,这种方法肯定会有效,但是其天花板也是非常低的;而另一种方法, 是努力将平台上的新用户转化为老用户,也就是说努力让他们与平台多交互, 产生行为,从而脱离冷启动的阶段。这两种方法相比,可能第二种的效果要更 好,这主要是因为冷启动算法的优化空间实在有限,而将其转为“热”用户之 后,各种优化策略就都可以派上用场了。这也是一种可以在多种场景下借鉴的 思路:将未知问题转化为已知问题,而不是创造新问题。产品设计因素产品设计因素所谓产品设计因素,指的是推荐出的物品在什么位置、以何种形式展示给 用户。如果说推荐算法是一个人的内在,那么产品设计就是一个人的脸。在现 在这个看脸的时代,长得好不好看会很大程度上影响算法能量的释放程度。最 常见的影响效果的外在因素包括但不限于:图片的质量。互联网早已进入读图时代,无论任何物品的推荐,例如商品、 资讯等,有图片的吸引力一定是大于无图片的。而对于都有图片的情况,图片 的大小和清晰度则会对用户是否

      3、感兴趣产生很大影响。除了大小和清晰度这种 基础的质量以外,图片本身传达出来的信息的质量也很关键,例如对于商品的 图片,如果不能在图片中展示出该商品的主要信息和用户关心的内容,那么用光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/户点击的概率就会大大降低,毕竟大家都很忙,点一下也是有代价的。所以对 于 C2C 市场这样以用户自己拍摄的照片为主的场景,引导用户拍出高质量的商 品图片就显得尤为重要,这个问题上 Airbnb 自费给房东拍照片的故事已经足够 证明其重要性和意义了。主题的吸引程度。除了图片以外,以文字形式描述的主题也是非常重要的, 毕竟文字还是人们获取信息的一个主要途径。在转转平台上,会有一些偷懒的 用户在文字描述中只写类似“如图,私聊”这样的信息,可想而知这样的描述 竞争力是比较弱的,同时也会让人觉得卖家对这个商品并不是很上心,所以除 非你的商品在其他方面极具竞争力,否则是很难得到转化的。主题吸引人固然重要,但是过于“头重脚轻”,只关注主题质量,而忽略 物品本身质量的话,反而会起到反作用,引起用户的反感。这里面最典型的例

      4、 子就是现在充斥屏幕的各种标题党文章了,为了吸引用户的点击而在起标题上 面大做文章,但用户点进去之后发现要么文章质量低下,要么文不对题,长期 以往下去,会对平台的信誉度产生很大的负面影响,是一种杀鸡取卵的做法。所以说,在文字内容描述方面,要尽量信息周全,但也不能背离事实,单 纯为了一时的点击率,而牺牲了平台的长远发展。关键信息是否露出。所谓关键信息,指的是能够左右或影响用户产生点击、 转化的信息,除了上面提到的图片和文字描述以外,各个业务场景下都有一些 有特点的关键信息 ,例如销量、评论数等等。一部分是因为这些信息本身就会 对用户的转化产生影响,另一方面,推荐算法在召回或排序时可能用到了这些 信息,那么将这些信息展现出来,一定程度上充当了推荐解释的功能。是否有干扰信息。这个指的是模块周围是否有影响用户注意力的其他内容, 能否让用户比较专心地浏览推荐模块。典型的如一些亮闪闪的广告或者促销/活 动 banner 之类的,放在推荐位的旁边会对用户的注意力产生不同程度的影响, 进而影响转化。如果推荐系统在你的业务中是重要的一部分,那么就应该给予 它足够专注(dedicated)的空间和位置,而

      5、尽量不要将其与其他内容混在一起。 在这个纷繁复杂的世界里,很多时候,少就是多(less is more)。数据因素数据因素推荐系统是典型算法驱动的系统,而如果说算法是系统的骨架,那么数据 就是系统的血液。如果数据质量和数量不够,那么任何算法的效果都会打折扣。 数据的数量不足是很容易理解的,而且数据量是否充足很多时候和整个网站或 APP 的发展状况有关,不是我们所能左右的,但数据质量则不同,是可以通过 人为的努力而不断加强的。所以这里就简单说一下数据质量方面常见的可能存 在的问题。光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/关键信息缺失。信息缺失是数据质量方面最大的问题之一,尤其是影响到 算法策略或排序模型的关键信息。例如曝光数据中没有具体曝光位置信息,展 现日志中没有用户停留时长的信息等等,这些信息的确实会直接导致算法效果 的下降,进而影响最终效果。类似这些问题的出现,很多时候是因为在最初的 数据系统建设时,没有算法相关的人员参与,导致没有把这些相关信息设计进 去。不过这类问题也相对好解决,只要在发现有缺失之后尽快补充进去就

      6、好了。数据设计欠佳,使用复杂。还有一种情况,就是关键信息都有,没有严重 缺失,但是数据结构或表结构设计不够合理,导致获取一个信息要 join 多张表, 或经过复杂的运算逻辑。这种情况下,虽然关键信息都可以获取到,但是由于 获取成本高,很有可能在工程实现中被不同程度地做折中,导致数据质量打折 扣,影响最终效果。这类问题的解决方法,从大的思路上来讲是要做好算法相 关的数据仓库/数据集市建设,使得数据的获取、变动和维护都尽量简单化,减 少数据建设的成本,从而提高数据的使用效率。推荐系统使用到的数据通常是整个网站的数据系统中的一个子集,所以这 部分数据质量的把控需要推荐系统的开发人员和数据系统的开发人员共同的努 力,才能保证数据的可用性和易用性。算法策略因素算法策略因素上面说了这么多,终于说到了推荐系统最核心的算法策略部分。算法策略 对效果的影响是毋庸置疑的,但是其影响也是多方面的,具体来讲,算法可能 会从以下几个方面影响效果。算法复杂度影响准确性。复杂度越高的算法整体上准确性较高,无论使用 什么具体算法,这个大趋势整体来说是正确的。例如简单的排序模型可能干不 过非线性模型,连续值特征有可能干

      7、不过离散化后的非线性特征,时序问题上 vanilla rnn 干不过 LSTM 等等。在保证数据质量的前提下,用复杂度高的模型 是一种能够确保收益的效果提升方式,当然前提是算法要与业务相契合,不能 为了复杂而复杂。算法的稳定性影响效果的稳定性。我们知道在机器学习模型中有一类模型 具有低偏差但同时也具有高方差,这里的高方差,指的是在训练出来的模型, 在不同的数据集上表现差异会比较大,这种现象还有另外一个名字就是过拟合。 如果数据量足够大的话,再加上合理的正则化手段,过拟合是比较容易避免的。 所以问题更容易出现在数据量不足的情况下,在这种情况下,应该选择例如线 性模型这样简单模型来保证结果的稳定性,甚至可以考虑使用基于规则的算法 来保证稳定性。为什么要关注结果的稳定性呢?这里的原因和我们在学习算法设计分析时要 关注算法的平均复杂度是类似的。我们虽然希望得到一个非常准确的模型,但光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/是更希望这个模型在线上运行时稳定的,是可预期的,不会今天效果好,明天 效果差。在实际使用中,无论准确率如何,都

      8、希望稳定性是有保证的。工程架构因素工程架构因素最后,我们再来简单说一下工程架构方面的因素。无论什么样的数据,什 么样的算法,最终呈献给用户之前都需要具体的工程落地,那么这个落地过程 中选择的具体工程架构也会对效果产生影响。效应耗时的影响。接口的响应速度无疑是工程架构对用户的最直接体现, 响应速度慢肯定会导致用户的不耐烦,可能就直接流失掉了。要提高速度,通 常会有几类方法,一类是对算法进行优化,减少不必要的计算;二是选择简单算 法;三是使用缓存的思路,只在在线部分进行尽量少的计算,其余的计算都放到 离线或近线层去做,减少实时计算的负担。架构设计对问题排查监控的影响。老司机们都知道,只能跑不能修的车是 肯定不能上路的。同理,推荐系统的整体架构设计要对问题的排查比较友好, 能够在出现问题或者需要验证猜想的时候能够快速在系统中进行定位,而不是 现加 debug 信息现上线,导致问题排查过程被拖长。优秀的工程师会在系统设 计的时候就给自己留好后路,而不是在出了问题时才临时抱佛脚。架构设计对迭代速度的影响。除了响应速度这种较为表面的影响以外,整 个架构的设计能否支持快速的策略迭代对效果的隐形影响也

      9、是极大的。如果整 体架构比较臃肿,模块分离不清晰,基础逻辑缺乏适当抽象同一,会导致数据 和策略的迭代无法快速进行,每迭代一次都要走很复杂的流程,而且还不能保 证正确性。这样的问题会拖累系统的发展速度,最终影响效果。总结总结除了上面提到的因素,还有很多细节会影响推荐系统的最终效果,所以说 我们在提升推荐系统效果时,眼睛不能只盯着一处,而是要具有一定的全局观, 能够从全局的角度找到当前对效果影响最大的是什么,进而进行针对性优化。 对于那些暂时不能改变的因素,也要做到心里有数,在适当的时机进行干预。为什么大家选择为什么大家选择光环大数据光环大数据!光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/大数据培训、人工智能培训、Python 培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。【报名方式、详情咨询报名方式、详情咨询】光环大数据官方网站报名:光环大数据官方网站报名:http:/ /mobile/mobile/

      《光环大数据培训_大数据应用 影响推荐系统效果的一些因素》由会员gua****an分享,可在线阅读,更多相关《光环大数据培训_大数据应用 影响推荐系统效果的一些因素》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
    点击查看更多
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.