新闻个性化推荐系统(python) 调试整体记录
5页1、新闻个性化推荐系统(python) 关zhu并回复 微信公众号:数据挖掘DW (ID:datadw )可获取源代码和数据集。 最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。1.数据集一共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日(3就是3号)2.代码部分先来看下演示图 (1)算法说明 举个例子简单说明下算法,其实也比较简单,不妥的地方希望大家指正。我们有如下一条数据plainview plaincopy1. 57389361006498791394550848MH370航班假护照乘客身份查明(更新)11 5738936这名用户在11号看了“MH370航班假护照乘客.”这条新闻。我们通过jieba找出11号的热点词如下。plainview plaincopy1. 失联311三周年马方偷渡客隐形护照吉隆坡航班护照者 我
2、们发现“航班”、“护照”这两个keywords出现在新闻里。于是我们就推荐5738936这名用户,11号出现“航班”、“护照”的其它新闻。同时我们对推荐集做了处理,比如说5738936浏览过的新闻不会出现,热度非常低的新闻不会出现等。(2)使用方法 整个系统采用一键式启动,使用起来非常方便。首先建立一个test文件夹,然后在test里新建三个文件夹,注意命名要和图中的统一,因为新闻是有时效的,每一天要去分开来计算,要存储每一天的内容做成文档。test文档如下图,就可以自动生成。使用的时候,要先在Global_param.py中设置好test文件夹的路径参数。一切设置完毕,只要找到wordSplite_test包下面的main()函数,运行程序即可。Global_param中设置参数说明: number_jieba:控制提取关键词的数量 number_day:从第一天开始,要预测的天数 hot_rate:预测集预测的新闻热度,数值越大热度越高(3)代码流程 首先我们从main()看起。pythonview plaincopy1. importGet_day_data2. importGe
《新闻个性化推荐系统(python) 调试整体记录》由会员小**分享,可在线阅读,更多相关《新闻个性化推荐系统(python) 调试整体记录》请在金锄头文库上搜索。
2020年高考真题——理科综合(全国卷Ⅲ)+Word版含答案
2021年绝味鸭脖策划书
2021年熟食店创业方案
2021年熟食店开店策划
2021年卤菜店创业计划书
2021年周黑鸭网络营销策划方案
东大21年1月考试《现代设计方法》考核作业
谈我国行政管理效率的现状及其改观对策(论文)
单证员考试-备考辅导-复习资料:无贸易背景信用证案分析.docx
土木工程毕业生答辩自述.docx
建筑学毕业后工作状态真实写照.doc
C#代码规范(湖南大学).doc
xx区食药监局2019年工作总结及2020年工作计划
2019年中医院药物维持治疗门诊工人先锋号先进事迹
2019年度xx乡镇林长制工作总结
2019年性艾科工作计划书
2019年人才服务局全国扶贫日活动开展情况总结
关于组工信息选题的几点思考
摘了穷帽子 有了新模样
2019年某集团公司基层党支部书记培训班心得体会
2024-04-08 33页
2024-04-08 10页
2024-04-08 25页
2024-04-08 12页
2024-04-08 10页
2024-04-08 21页
2024-04-08 40页
2024-04-08 34页
2024-04-08 28页
2024-04-08 28页