电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

用户画像标签建模

6页
  • 卖家[上传人]:博****1
  • 文档编号:509592397
  • 上传时间:2023-10-10
  • 文档格式:DOCX
  • 文档大小:57KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、真理惟一可靠的标准就是永远自相符合。土地是以它的肥沃和收获而被估价的;才能也是土地,不过它生产的不是粮食,而是真理。如果只能滋生瞑想和幻想的话,即使再大的才能也只是砂地或盐池,那上面连小草也长不出来的。用户画像标签建模用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。动态信息数据目标分析用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。数据建模方法如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。用户标识方式效果备注(局限性)Cookie互联网使用最为广泛的方式,能够标识匿名、

      2、未注册用户,通常有一定的有效期,不易跨浏览器、设备,S99ID各家网站的用户标识,最常见的互联网会员苣理方式.用户需要投入大量推广运营成本.Email互联网早期较为常用的用户你识方式.目前依然有一定的占有率口一人有多个smail很常见口因此标识会损失些准确性微博、微信、QQ当下业内共识的第三方登录ID,提供。Auth授权机制标识准碘性,持久性上是个较好的折中方案.手机号移动前最精准的标识较港家取到,视产品激励用户填写意遍.身份证最官方的标识难获取到,视产品激曲用户期获什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。什么地点:用户接触点,TouchPoint。对于每个用户接触点。潜在包含了两层信息:网址+内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页

      3、面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。标签权重矿泉水1超市矿泉水3/火车矿泉水5/景区所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏等等。不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识+时间+行为类型+接触点(网址

      4、+内容),某用户因为在什么时间、地点、做了什么事。所以会打上*标签。用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:标签权重=衰减因子X行为权重X网址子权重如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。标签:红酒,长城时间:因为是昨天的行为,假设衰减因子为:r=0.95行为类型:浏览行为记为权重1地点:品尚红酒单品页的网址子权重记为0.9(相比京东红酒单品页的0.7)假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。则用户偏好标签是:红酒,权重是0.95*0.7*1=0.665,即,用户A:红酒0.665、长城0.665。上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。总结:本文并未涉及具体算法,更多的是阐述了一种分析思想,在计划构建用户画像时,能够给您提供一个系统性、框架性的思维指导。核心在于对用户接触点的理解,接触点内容直接决定了标签信息。内容地址、行为类型、时间衰减,

      5、决定了权重模型是关键,权重值本身的二次建模则是水到渠成的进阶。模型举例偏重电商,但其实,可以根据产品的不同,重新定义接触点。比如影视产品,我看了一部电影英雄本色,可能产生的标签是:周润发0.6、枪战0.5、港台0.3。最后,接触点本身并不一定有内容,也可以泛化理解为某种阈值,某个行为超过多少次,达到多长时间等。1.0。比如游戏产品,典型接触点可能会是,关键任务,关键指数(分数)等等。如,积分超过1万分,则标记为钻石级用户。钻石用户百分点现已全面应用用户画像技术于推荐引擎中,在对某电商客户,针对活动页新访客的应用中,依靠用户画像产生的个性化效果,对比热销榜,推荐效果有显著提升:推荐栏点击率提升27% , 订单转化1 人生的磨难是很多的,所以我们不可对于每一件轻微的伤害都过于敏感。在生活磨难面前,精神上的坚强和无动于衷是我们抵抗罪恶和人生意外的最好武器。率提升34%。标签建模用户画像标签使用模型/算法人群同性室出使用诅好用户港京度斯历虻趋势客户基本倍息用户漉失,率用户近期需求I臬迤使用频率投诉次数客户黄金11里M产福HM&a分北总时DrEMB9KEfebCdnwriibMd*pnMH4IZW*HgrOittUEKini崎I手_毕文本S法TF-JBFVi鲁加pcModei

      《用户画像标签建模》由会员博****1分享,可在线阅读,更多相关《用户画像标签建模》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.