对比学习视角:重新审视推荐系统的召回粗排模型-张俊林
43页1、 Outline什么是对比学习典型对比学习模型010203对比学习视角来看召回粗排模型 什么是对比学习:渊源与谱系度量学习:Bert:自监督正例拉近,负例推远对比学习对比学习:自监督版本的度量学习? 什么是对比学习:一个抽象的对比学习系统Loss Function:InfoNCE 什么是对比学习:一个抽象的对比学习系统关键问题:1.正例怎么构造?负例怎么构造?2.映射函数f怎么设计?3.损失函数怎么设计? 什么是对比学习:典型例子-SimCLR要做L2Norm关键问题:1.正例怎么构造?负例怎么构造?2.映射函数f怎么设计?3.损失函数怎么设计? 什么是对比学习:怎样是一个不好的对比学习系统?我要我们在一起关键问题:如何防止模型坍塌? 什么是对比学习:怎样是一个好的对比学习系统? 什么是对比学习:SimCLR怎么防止坍塌的?Loss Function:InfoNCE通过负例!注意:1.负例越多模型效果越好,请记住这个结论2.温度系数对结果影响很大,通常比较小的数值,0.010.1,为什么? Outline什么是对比学习典型对比学习模型010203对比学习视角来看召回粗排模型 图像对比学
2、习:Batch内负例-SimCLRHighLights: 双塔结构 Embedding L2 Norm 自动构造正例 In-Batch负例 图像对比学习:Batch外负例-MoCoQuestion:怎样增加负例数量?Momentum: 图像对比学习:基于负例方法谱系相互借鉴,目前的共识:1.网络结构:双塔2.映射函数F: Encoder+Projector3.Encoder越来越复杂 图像对比学习:对比聚类-SwAV Outline什么是对比学习典型对比学习模型010203对比学习视角来看召回粗排模型 重新审视召回粗排模型 更纯正的对比学习 对比学习-图召回 重新审视召回粗排模型:双塔模型-概述优点: 简单 在线ANN检索速度快缺点: User侧和Item侧特征交互太晚 效果不及排序模型三个实践经验决策点: 召回模型负例如何选择 User Embedding和Item Embedding要做Norm? Loss中相似性计算中要带温度超参么?DNN双塔召回粗排模型 重新审视召回粗排模型:双塔模型-负例问题Selection Bias问题召回负例可能做法: In-Batch 负例(Goog
3、le DNN双塔) 全局随机抽样(Youtube DNN) MixIn-Batch负例+全局随机抽样(Google) MixIn-Batch+曝光未点击我们19年做FM召回时的做法DNN双塔召回粗排模型假设我们采取In-Batch负例 重新审视召回粗排模型:Embedding Norm决策点:对User Embedding和Item Embedding要做Norm么?Option1:Inner ProductionOption 2:Cosine经验结果:要做(我们实验过Norm确实效果好一些)From: Sampling-Bias-Corrected Neural Modeling for Large Corpus ItemRecommendationsDNN双塔召回粗排模型为什么?有没有解释? 重新审视召回粗排模型:温度超参决策点:Loss函数里或者User和Item相似性计算要加入温度超参么?Option1:不加温度超参Option 2:加温度超参经验结果:最好加(我们实验过加温度超参确实效果好一些)From: Sampling-Bias-Corrected Neural Mode
4、ling for Large Corpus ItemRecommendations温度超参的影响为什么?有没有解释? 重新审视召回粗排模型:其实目前的双塔就是一种对比学习决策点: User Embedding/Item Embedding做Norm Loss带温度超参 In-Batch负例可以把当前的召回模型看作是对比学习系统DNN双塔召回粗排模型 重新审视召回粗排模型:Recap-SimCLRLoss Function:InfoNCE决策点: Embedding做Norm Loss带温度超参 In-Batch负例如果把正例方式换掉图像编码Encoder去掉,我们可以复现出双塔召回模型! 重新审视召回粗排模型:用对比学习解释经验做法灵魂三问: 对比学习视角:In-Batch负例的作用是什么? 对比学习视角:温度超参的作用是什么? 对比学习视角:User Embedding和Item Embedding为何要做Norm? 重新审视召回粗排模型:双塔模型负例的作用是什么?从对比学习的观点来看: 增强User Embedding和Item Embedding映射到投影空间内的Uniformi
《对比学习视角:重新审视推荐系统的召回粗排模型-张俊林》由会员郭**分享,可在线阅读,更多相关《对比学习视角:重新审视推荐系统的召回粗排模型-张俊林》请在金锄头文库上搜索。
2023汽车行业人才管理与薪酬趋势
2023麦肯锡金融业白皮书:后疫情时代财富管理重启增长
国家金融与发展实验室-数字经济背景下科技服务商对商业银行的异质性影响研究-12页
2023年3月银行在长期背景下的干预——硅谷银行及其他银行(英)-2023.3-10页
2023视频号商业生态发展报告:多元增长迎接爆发
2023新能源汽车行业充电桩行业深度报告:千亿市场盈利边际向好
2023新能源汽车充电桩行业深度报告:千亿市场盈利边际向好
2022乡村旅游振兴白皮:乡村旅游新阶段乡村民宿挑起增长大梁-携程
黑马工厂《坚果行业趋势报告》-33页
海外发展研究所-埃塞俄比亚和AfCFTA的投资条款:问题和挑战(英)-2022.12-36页
推动药物开发的创新安进公司揭示三大研发方向-117页
《追求成功的热情》
营销数字化转型登山图(2021版)-66页
《稻盛和夫为何能不断成功》
未来远程混合工作模式的挑战和机会(2021)-50页
商用密码应用安全性评估白皮书-69页
世界主要能源数据统计2021-81页
2022服装行业出海营销报告-71页
2022爱分析·人工智能厂商全景报告-85页
网络数据安全管理条例-208
2023-07-16 4页
2023-10-08 4页
2024-01-12 18页
2023-01-29 33页
2023-03-10 3页
2023-04-25 3页
2022-12-20 4页
2022-12-26 57页
2022-09-27 12页
2023-06-07 6页