电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

Apriori算法实验报告材料

22页
  • 卖家[上传人]:cl****1
  • 文档编号:468167237
  • 上传时间:2023-11-09
  • 文档格式:DOC
  • 文档大小:132.50KB
  • / 22 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、word题 目Apriori算法实现学生某某学生学号专业班级指导教师2014-12-27实验一 Apriori算法实现一、 实验目的1. 加强对Apriori算法的理解;2. 锻炼分析问题、解决问题并动手实践的能力。二、 实验要求使用一种你熟悉的程序设计语言,如C+或Java,实现Apriori算法,至少在两种不同的数据集上比拟算法的性能。三、 实验环境Win7 旗舰版 + Visual Studio 2010语言:C+四、 算法描述1、 Apriori算法说明在Apriori算法中,寻找频繁项集的根本思想是:A. 简单统计所有含一个元素项目集出现的频率,找出不小于最小支持度的项目集, 即频繁项集;B. 从第二步开始,循环处理直到再没有最大项目集生成。循环过程是: 第k步中, 根据第k-1步生成的频繁(k-1)项集产生侯选k项集。根据候选k项集,算出候选k项集支持度,并与最小支持度比拟, 找到频繁k项集。下文中遇到的以下符号,分别代表相应的内容k-itemsetk项集Lk频繁k项集Ck侯选k项集2、 Apriori算法描述数据结构说明double minsup; /设置最小支持度map

      2、 items_count; /统计各个项集的数目vectorvector datavec; /原始数据项集vectorvector candidatevec; /候选项集vectorvector frequentvec; /频繁项集ofstream outFile;int round=1; /生成项集轮次long trancount=0; /原始事务总数/判断某个项目在某一个事务中是否存在,存在如此值为1,反之为0vectormap bitmap;Apriori算法的第一步是简单统计所有含一个元素的项集出现的频率,来决定频繁1项集。在第k步,分两个阶段:1,用函数genCanItemsetK,通过第(k-1)步中生成的频繁(k-1)项集来生成侯选k项集;2.计算侯选k项集的支持度,并找出频繁k项集。Apriori算法描述如下getOriData();/获取原始数据集,并统计事务个数genCanItemset1(); /产生输出候选1项集genFreItemset1(); /产生频繁项集if(!frequentvec.empty() /根据频繁1项集,执行程序dogenCanItemse

      3、tK();/生成并输出候选k项集genFreItemsetK();/计算并输出频繁k项集while(!frequentvec.empty(); /频繁项集不为空,如此循环继续其中,产生候选k项集函数genCanItemsetK中涉与两个重要函数,项集合并函数mergeItem和剪枝函数cutNotCanItemsetK。3、 函数方法说明/获取原始数据集,并统计事务个数void getOriData();/合并生成新的候选项集vector mergeItem(vector vect1,vector vect2,int round);/判断项集item是否已经存在候选项集集合items中,存在如此返回1int isExist(vector item,vectorvector items);/产生并输出候选1项集void genCanItemset1();/产生并输出频繁1项集void genFreItemset1();/产生并输出候选k-项集k=2void genCanItemsetK();/产生并输出频繁k-项集k=2void genFreItemsetK();/剪枝:剪去合并后项集中

      4、含有非频繁项集中的项void cutNotCanItemsetK(vector & item);五、 实验截图1. 程序运行界面2. 输出文件截图13. 输出文件截图1六、 实验总结做完这个实验,有如下收获:1. 同一数据集,最小支持度越小,那么产生的频繁项集维数越高,程序运行时间越长;2. 更加深刻理解了:频繁子集的任何子集一定是频繁的,子集频繁父亲一定频繁;3. Apriori也存在缺点:第一在每一步产生侯选项目集时循环产生的组合过多,没有排除不应该参与组合的元素;第二,每次计算项集的支持度时,开销会随着数据的增多而成几何级增长。七、 附1.#include #include #include #include #include #include #include using namespace std;double minsup; /设置最小支持度map items_count; /统计各个项集的数目vectorvector datavec; /原始数据项集vectorvector candidatevec; /候选项集vectorvector frequentvec; /频繁项

      5、集ofstream outFile;int round=1; /生成项集轮次long trancount=0; /原始事务总数/判断某个项目在某一个事务中是否存在,存在如此值为1,反之为0vectormap bitmap;/获取原始数据集,并统计事务个数void getOriData();/合并生成新的候选项集vector mergeItem(vector vect1,vector vect2,int round);/判断项集item是否已经存在候选项集集合items中,存在如此返回1int isExist(vector item,vectorvector items);/产生并输出候选1项集void genCanItemset1();/产生并输出频繁1项集void genFreItemset1();/产生并输出候选k-项集k=2void genCanItemsetK();/产生并输出频繁k-项集k=2void genFreItemsetK();/剪枝:剪去合并后项集中含有非频繁项集中的项void cutNotCanItemsetK(vector & item);int main()g

      6、etOriData();/获取原始数据集,并统计事务个数cout fName;cout minsup;outFile.open(fName,ios:trunc);outFile 最小支持度为minsup = minsup endl;genCanItemset1();genFreItemset1();if(!frequentvec.empty() /判断频繁1项集是否为空,为空如此退出dogenCanItemsetK();genFreItemsetK();while(!frequentvec.empty(); /频繁项集不为空,如此循环继续outFile.close();cout n结果已保存到 fName 文件!n;system(pause);return 0;/获取原始数据集,并统计事务个数void getOriData()int flag;cout flag;string filename;if(flag = 1)filename = dataA.txt; /打开数据文件elsefilename = dataB.txt;ifstream file(filename);if(!fil

      7、e) /检查文件是否打开成功coutFail to open data file!endl;system(pause);exit(0);elsestring temp;vector item; /项集的临时vector cout原始数据集:endl;int begin,end;while(getline(file,temp) /一行一行读入数据trancount+;begin=0;temp.erase(0,temp.find_first_not_of(rtn ); /去除字符串首部的空格temp.erase(temp.find_last_not_of(rtn)+1); /去除字符串尾部的空格while(end=temp.find( ,begin)!=string:npos) /每一个事务中的项是以空格为分隔符的item.push_back(temp.substr(begin,end-begin); /将每一个项插入item中begin=end+1;item.push_back(temp.substr(begin); /一个事务中的最后一项datavec.push_back(item); /将一个事务中的所有项当成一个整体插入另一个大的vector中item.clear(); /清空itemcout tempendl;file.close();/产生并输出候选1项集void genCanItemset1()map item_map;for(int ix=0;ix!=datavec.size();+ix)for(int iy=0;iy!=datavecix.size();+iy)items_countdatavecix.at(iy)+; /该项集的计数加1item_mapdatavecix.at(iy)=true; /表示该项目在该事务中存在,值为1,否如此默认为0bitmap.push_back(item_map);item_map.clear(); /这里一定要清空一下

      《Apriori算法实验报告材料》由会员cl****1分享,可在线阅读,更多相关《Apriori算法实验报告材料》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.