好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据挖掘论文.docx

7页
  • 卖家[上传人]:壹****1
  • 文档编号:439534455
  • 上传时间:2022-12-21
  • 文档格式:DOCX
  • 文档大小:12.89KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数据挖掘论文--论数据挖掘在电子商务中的应用专业:信息管理与信息系统姓名:宋兴晨学号:20138307013[摘要]企业的竞争优势并不取决于信息的拥有量,而是取决于信息的处理利用能力如何 化信息优势为竞争优势,是企业制胜于市场的一个法宝本文论述了一种信息处理利用的有 效工具一一数据挖掘方法及其在电子商务中的应用[关键词]数据挖掘方法电子商务应用一、电子商务和数据挖掘简介电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展 商务业务活动目前国内已有网上商情广告、电子票据交换、网上订购,网上银行、网上支 付结算等多种类型的电子商务形式电子商务正以其成本低廉、方便、快捷、安全、可靠、 不受时间和空间的限制等突出优点而逐步在全球流行数据挖掘(DataMining)是伴随着数据仓库技术的发展而逐步完善起来的数据挖掘主要是为 了帮助商业用户处理大量存在的数据,发现其后隐含的规律性,同时将其模型化,来完成辅 助决策的作用它要求从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取人们 事先不知道的但又是潜在有用的信息和知识数据挖掘的过程有时也叫知识发现的过程 而电子商务中的数据挖掘即Web挖掘,是利用数据挖掘技术从www的资源(即Web文档) 和行为(即We服务)中自动发现并提取感兴趣的、有用的模式和隐含的信息,它是一项综合 技术涉及到Internet技术学、人工智能、计算机语言、信息学、统计学等多个领域。

      随着网 络技术和数据库技术的成熟,传统商务正经历一次重大变革,向电子商务全速挺进这种商 业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加 深入了解客户需求信息和购物行为特征的可能性数据挖掘技术作为电子商务的重要应用技 术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要 工具二、何谓数据挖掘及方法确切地说,数据挖掘(Data Mining),又称数据库中的知识发现 (Knowledge Discovery in Database,KDD),是指从大型数据库或数据仓库中提取隐含的、未知 的、非平凡的及有潜在应用价值的信息或模式它融合了数据库、人工智能、机器学习、统 计学等多个领域的理论和技术比较典型的数据挖掘方法有关联分析、序列模式分析、分类 分析、聚类分析等它们可以应用到以客户为中心的企业决策分析和管理的各个不同领域和 阶段1•关联分析关联分析,即利用关联规则进行数据挖掘关联分析的目的是挖掘隐藏在数据 间的相互关系,它能发现数据库中形如”90%的顾客在一次购买活动中购买商品A的同时 购买商品B”之类的知识2.序列模式分析序列模式分析和关联分析相似,但侧重点在于分析数据间的前后序列关系。

      它能发现数据库中形如”在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商 品C,即序列A-B-C出现的频度较高”之类的知识,序列模式分析描述的问题是在给定 交易序列数据库中,每个序列是按照交易时间排列的一组交易集,挖掘序列函数作用在这个 交易序列数据库上,返回该数据库中出现的高频序列在进行序列模式分析时,同样也需要 由用户输入最小置信度C和最小支持度So3•分类分析设有一个数据库和一组具有不同特征的类别(标记),该数据库中的每一个记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集分类分析就是通过分 析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然 后用这个分类规则对其他数据库中的记录进行分类4•聚类分析聚类分析输入的是一组未分类记录,并且这些记录应分成几类事先也不知道, 通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录 所在类别它所采用的分类规则是由聚类分析工具决定的采用不同的聚类方法,对于相同 的记录集合可能有不同的划分结果应用数据挖掘技术,较为理想的起点就是从一个数据仓库开始,数据挖掘可以直接跟踪数据并辅助用户快速做出商业决策,用户还可以在更新数据的时候不断发现更好的行为模式,并将其运用于未来的决策当中。

      三、选择数据挖掘技术的两个重要依据数据挖掘使用的技术很多,其中主要包括统计方法、机器学习方法、和神经网络方法和数据 库方法统计方法可细分为回归分析、判别分析、聚类分析、探索性分析等机器学习方法 可细分为归纳学习方法(决策树、规则归纳)、基于范例学习、遗传算法等神经网络方法 可细分为钱箱神经网络(BP算法)、自组织神经网络等数据库方法主要是多维数据分析或 OLAP方法,另外还有面向属性的归纳方法由于每一种数据挖掘技术都有其自身的特点和 实现的步骤,对数据的形式有具体的要求,并且与具体的应用问题密切相关,因此成功的应 用数据挖掘技术以达到目标过程本身就是一件很复杂的事情,本文主要从挖掘任务和可记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集分类分析就是通过分 析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然 后用这个分类规则对其他数据库中的记录进行分类4•聚类分析聚类分析输入的是一组未分类记录,并且这些记录应分成几类事先也不知道, 通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录 所在类别它所采用的分类规则是由聚类分析工具决定的。

      采用不同的聚类方法,对于相同 的记录集合可能有不同的划分结果应用数据挖掘技术,较为理想的起点就是从一个数据仓库开始,数据挖掘可以直接跟踪数据 并辅助用户快速做出商业决策,用户还可以在更新数据的时候不断发现更好的行为模式,并 将其运用于未来的决策当中三、选择数据挖掘技术的两个重要依据数据挖掘使用的技术很多,其中主要包括统计方法、机器学习方法、和神经网络方法和数据 库方法统计方法可细分为回归分析、判别分析、聚类分析、探索性分析等机器学习方法 可细分为归纳学习方法(决策树、规则归纳)、基于范例学习、遗传算法等神经网络方法 可细分为钱箱神经网络(BP算法)、自组织神经网络等数据库方法主要是多维数据分析或 OLAP方法,另外还有面向属性的归纳方法由于每一种数据挖掘技术都有其自身的特点和 实现的步骤,对数据的形式有具体的要求,并且与具体的应用问题密切相关,因此成功的应 用数据挖掘技术以达到目标过程本身就是一件很复杂的事情,本文主要从挖掘任务和可获得 的数据两个角度来讨论对数据挖掘技术的选择三、数据挖掘在电子商务中的应用数据挖掘能发现电子商务客户的的共性和个性的知识、必然和偶然的知识、独立和关联的知 识、现实和预测的知识等,所有这些知识经过分析,能对客户的消费行为如心理、能力、动 机、需求、潜能等做出统计和正确地分析,为管理者提供决策依据。

      具体应用如下: 1•分类与预测方法在电子商务中的应用在电子商务活动中,分类是一项非常重要的任务, 也是应用最多的技术分类的目的是构造一个分类函数或分类模型,通常称作分类器分类 器的构造方法通常由统计方法、机器学习方法、神经网络方法等这些方法能把数据库中的 数据映射到给定类别中某一个,以便用于预测,也就是利用历史数据记录,自动推导出给定 数据的推广描述,从而对未来数据进行预测2•聚类方法在电子商务中的应用聚类是把一组个体按照相似性原则归成若干类别对电子 商务来说,客户聚类可以对市场细分理论提供有力的支持市场细分的目的是使得属于同一 类别的个体之间的距离尽可能小,而不同类别的个体之间的距离尽可能大,通过对聚类的客 户特征的提取,电子商务网站可以为客户提供个性化的服务3•数据抽取方法在电子商务中的应用数据抽取的目的是对数据进行浓缩,给出它的紧凑描 述,如求和值、平均值、方差值、等统计值、或者用直方图、饼状图等图形方式表示,更主 要的是他从数据泛化的角度来讨论数据总结数据泛化是一种把最原始、最基本的信息数据 从低层次抽象到高层次上的过程可采用多维数据分析方法和面向属性的归纳方法在电子 商务活动中,采用维数据分析方法进行数据抽取,他针对的是电子商务活动中的客户数据仓 库。

      在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集分类分析就是通过分 析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然 后用这个分类规则对其他数据库中的记录进行分类4•聚类分析聚类分析输入的是一组未分类记录,并且这些记录应分成几类事先也不知道, 通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录 所在类别它所采用的分类规则是由聚类分析工具决定的采用不同的聚类方法,对于相同 的记录集合可能有不同的划分结果应用数据挖掘技术,较为理想的起点就是从一个数据仓库开始,数据挖掘可以直接跟踪数据 并辅助用户快速做出商业决策,用户还可以在更新数据的时候不断发现更好的行为模式,并 将其运用于未来的决策当中三、选择数据挖掘技术的两个重要依据数据挖掘使用的技术很多,其中主要包括统计方法、机器学习方法、和神经网络方法和数据 库方法统计方法可细分为回归分析、判别分析、聚类分析、探索性分析等机器学习方法 可细分为归纳学习方法(决策树、规则归纳)、基于范例学习、遗传算法等神经网络方法 可细分为钱箱神经网络(BP算法)、自组织神经网络等。

      数据库方法主要是多维数据分析或 OLAP方法,另外还有面向属性的归纳方法由于每一种数据挖掘技术都有其自身的特点和 实现的步骤,对数据的形式有具体的要求,并且与具体的应用问题密切相关,因此成功的应 用数据挖掘技术以达到目标过程本身就是一件很复杂的事情,本文主要从挖掘任务和可获得 的数据两个角度来讨论对数据挖掘技术的选择三、数据挖掘在电子商务中的应用数据挖掘能发现电子商务客户的的共性和个性的知识、必然和偶然的知识、独立和关联的知 识、现实和预测的知识等,所有这些知识经过分析,能对客户的消费行为如心理、能力、动 机、需求、潜能等做出统计和正确地分析,为管理者提供决策依据具体应用如下: 1•分类与预测方法在电子商务中的应用在电子商务活动中,分类是一项非常重要的任务, 也是应用最多的技术分类的目的是构造一个分类函数或分类模型,通常称作分类器分类 器的构造方法通常由统计方法、机器学习方法、神经网络方法等这些方法能把数据库中的 数据映射到给定类别中某一个,以便用于预测,也就是利用历史数据记录,自动推导出给定 数据的推广描述,从而对未来数据进行预测2•聚类方法在电子商务中的应用聚类是把一组个体按照相似性原则归成若干类别。

      对电子 商务来说,客户聚类可以对市场细分理论提供有力的支持市场细分的目的是使得属于同一 类别的个体之间的距离尽可能小,而不同类别的个体之间的距离尽可能大,通过对聚类的客 户特征的提取,电子商务网站可以为客户提供个性化的服务3•数据抽取方法在电子商务中的应用数据抽取的目的是对数据进行浓缩,给出它的紧凑描 述,如求和值、平均值、方差值、等统计值、或者用直方图、饼状图等图形方式表示,更主 要的是他从数据泛化的角度来讨论数据总结数据泛化是一种把最原始、最基本的信息数据 从低层次抽象到高层次上的过程可采用多维数据分析方法和面向属性的归纳方法在电子 商务活动中,采用维数据分析方法进行数据抽取,他针对的是电子商务活动中的客户数据仓 库在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的 计算量特别大,可把汇集操作结果预先计算并存储起来,以便用于决策支持系统使用4•关联规则在电子商务中的应用管理部门可以收集存储大量的售货数据和客户资料,对这 些历史数据进行分析并发现关联规则如分析网上顾客的购买行为,帮。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.