Apriori算法实验报告材料
22页1、word题 目Apriori算法实现学生某某学生学号专业班级指导教师2014-12-27实验一 Apriori算法实现一、 实验目的1. 加强对Apriori算法的理解;2. 锻炼分析问题、解决问题并动手实践的能力。二、 实验要求使用一种你熟悉的程序设计语言,如C+或Java,实现Apriori算法,至少在两种不同的数据集上比拟算法的性能。三、 实验环境Win7 旗舰版 + Visual Studio 2010语言:C+四、 算法描述1、 Apriori算法说明在Apriori算法中,寻找频繁项集的根本思想是:A. 简单统计所有含一个元素项目集出现的频率,找出不小于最小支持度的项目集, 即频繁项集;B. 从第二步开始,循环处理直到再没有最大项目集生成。循环过程是: 第k步中, 根据第k-1步生成的频繁(k-1)项集产生侯选k项集。根据候选k项集,算出候选k项集支持度,并与最小支持度比拟, 找到频繁k项集。下文中遇到的以下符号,分别代表相应的内容k-itemsetk项集Lk频繁k项集Ck侯选k项集2、 Apriori算法描述数据结构说明double minsup; /设置最小支持度map
2、 items_count; /统计各个项集的数目vectorvector datavec; /原始数据项集vectorvector candidatevec; /候选项集vectorvector frequentvec; /频繁项集ofstream outFile;int round=1; /生成项集轮次long trancount=0; /原始事务总数/判断某个项目在某一个事务中是否存在,存在如此值为1,反之为0vectormap bitmap;Apriori算法的第一步是简单统计所有含一个元素的项集出现的频率,来决定频繁1项集。在第k步,分两个阶段:1,用函数genCanItemsetK,通过第(k-1)步中生成的频繁(k-1)项集来生成侯选k项集;2.计算侯选k项集的支持度,并找出频繁k项集。Apriori算法描述如下getOriData();/获取原始数据集,并统计事务个数genCanItemset1(); /产生输出候选1项集genFreItemset1(); /产生频繁项集if(!frequentvec.empty() /根据频繁1项集,执行程序dogenCanItemse
3、tK();/生成并输出候选k项集genFreItemsetK();/计算并输出频繁k项集while(!frequentvec.empty(); /频繁项集不为空,如此循环继续其中,产生候选k项集函数genCanItemsetK中涉与两个重要函数,项集合并函数mergeItem和剪枝函数cutNotCanItemsetK。3、 函数方法说明/获取原始数据集,并统计事务个数void getOriData();/合并生成新的候选项集vector mergeItem(vector vect1,vector vect2,int round);/判断项集item是否已经存在候选项集集合items中,存在如此返回1int isExist(vector item,vectorvector items);/产生并输出候选1项集void genCanItemset1();/产生并输出频繁1项集void genFreItemset1();/产生并输出候选k-项集k=2void genCanItemsetK();/产生并输出频繁k-项集k=2void genFreItemsetK();/剪枝:剪去合并后项集中
《Apriori算法实验报告材料》由会员cl****1分享,可在线阅读,更多相关《Apriori算法实验报告材料》请在金锄头文库上搜索。
园林景观设计综合施工重点标准做法
2023年三年级科学教学工作总结
幼儿园期末简短评语
大尺寸工件孔系调头镗孔的检测与校正
中国电信汇线通常用功能的操作办法
湖南省长沙县六中2018-2019学年高一政治上学期第一次阶段性考试试题(无答案)
[最新]八年级语文下册9 海燕教学案 人教版
急救药品使用常规
欧诗漫化妆品废水处理
订货会邀请函15篇
2023年高中英语教案模板全英文(精选多篇)
教师个人校本研修工作总结
合租房屋出租协议完整押一付三版
合作小学开展联合研训工作2022上半年总结
关于网站建设合同集合6篇
市场人员公司内部深造学习心得体会
【9】中科院官方题库-心理咨询方法
西方中小学社会化管理及其对中国中小学管理改革的借鉴意义
四通八达的交通教案4.1
XX公司信息服务部门的组织结构
2023-01-09 10页
2023-08-02 22页
2023-01-15 44页
2023-01-29 50页
2022-12-20 19页
2022-10-09 14页
2023-02-24 66页
2024-01-19 4页
2022-11-17 6页
2024-02-09 2页