数据挖掘技术
12页1、数据挖掘技术,定义,数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。,分析客户使用分销渠道的情况和分销渠道的容量 ;建立利润评测模型;客户关系优化;风险控制等。 汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户,通过数据挖掘的方法使营销费用减少了30。,实例,关联分析(associationanalysis),两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。,聚类分析(clusteringanalysis),聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。,分类(classificatio
2、n),分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。,实例,美国Firstar银行使用数据挖掘工具,根据客户的消费模式预测何时为客户提供何种产品。 GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本,通过数据挖掘的方法使库存成本比原来减少了3.8%。,预测(prediction),预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。,时序模式(time-seriespattern),时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。,偏差分析(deviationanalysis),在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数剧存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。,总结,因此,数据挖掘在商业上的用途可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法等。,谢谢观赏,
《数据挖掘技术》由会员xzh****18分享,可在线阅读,更多相关《数据挖掘技术》请在金锄头文库上搜索。
爱心树活动教案
世界文化之旅0
七年级学年知识归纳
七年级历史下册第二单元第12课《蒙古的兴起和元朝的建立》课件人教新课标版
一片美丽的叶子
非谓语动词 (6)
[中学联盟]江苏省太仓市第二中学七年级英语上册教学课件:Unit3READING1 (2)
“数与代数”教材修订说明
2014年7月师院培训
字理教学快捷入门之一20140521s
议论文写作指导之新材料作文审题立意 (2)
压缩语段 (2)
琵琶行课件 (2)
2014年各年级的教学计划和建议
(苏教版)五年级数学下册找规律第二课时
秋姑娘的信 (5)
苏教版数学五年级上册《复式条形统计图》课件 (2)
【名校课时通】2014届九年级化学全册第二单元探秘水世界第三节原子的构成名师教学课件鲁教版
《逻辑与语文》课件2
《检阅》[1]
2022-08-27 60页
2022-01-06 52页
2021-07-05 46页
2021-07-05 4页
2021-05-02 23页
2021-05-02 17页
2021-05-02 23页
2020-08-03 9页
2020-08-03 8页
2020-08-03 5页