好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据仓库与数据挖掘课程实验.doc

6页
  • 卖家[上传人]:jiups****uk12
  • 文档编号:40000866
  • 上传时间:2018-05-22
  • 文档格式:DOC
  • 文档大小:75.50KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数据仓库与数据挖掘课程实验 课程实验课程实验课程实验部分安排八个有代表性的上机实验与课程内容相呼应,每一个实验安排两学时学生应在实际操作中规范地完成各项实验更深入理解数据仓库及 OLAP 系统工作原理,构建数据仓库、熟练掌握 OLAP 操作实验完成后,教师在实验结束前,现场验收学生的完成情况,并给出现场评定,最后结合实验报告给出实验成绩实验一实验一 认识认识 sql server2000 一、 实验目的1、通过某个商用数据库管理系统的安装使用,初步了解 DBMS 的工作环境和系统构架2、熟悉对 DBMS 的安装搭建今后实验的平台3、了解所选 DBMS 系统的主要组件4、理解数据库、数据表、属性、关键字等关系数据库中的基本概念5、熟悉利用管理器创建数据库、数据表并向表中插入数据6、查询数据表中数据二、实验平台操作系统:windows2000 或者 windows XP 数据库管理系统:国产如 KingbaseES,国外如:MS SQL Server, Oracle三、实验内容及要求1.安装和启动i.根据安装文件的说明安装数据库管理系统在安装过程中记录安装的选择,并且对所作的选择进行思考,为何要进行这样的配置,对今后运行数据库管理系统会有什么影响。

      ii.学会启动和停止数据库服务,思考可以用哪些方式来完成启动和停止2.初步了解 DBMS 的安全性i.这里主要是用户的登录和服务器预定义角色可以尝试建立一个新的用户,赋予其数据库管理员的角色,今后的实验可以用该用户来创建数据库应用3.数据库系统的构架i.了解数据库系统的逻辑组件:它们主要是数据库对象,包括基本表、视图、触发器、存储过程、约束等今后将学习如何操作这些数据库对象4.DBMS 的管理和使用了解 DBMS 如何通过它提供的工具对数据和数据库服务器进行管理和使用的i.学会运用控制管理器和企业管理器进行操作 利用管理器创建 school 数据库,创建关系数据库 SCHOOL 表: 学生表 student(sno,sname,ssex.sage,sdept,grade), 课程表 course(cno,cname,cpno,chour,ccredit), 教师表 teacher(tno,tname,email,salary) 其中,Sno,cno,tno 分别是各表的主键,具有唯一性约束 向各个数据表中输入适当的数据 查询表中的数据ii.了解系统其他管理工具熟悉数据库的备份与还原工具的使用。

      对创建的 school 数据库进行备份和还原操作实验二、实验二、 设计数据仓库并利用设计数据仓库并利用 DTS 工具建立数据仓库工具建立数据仓库一、实验目的熟悉数据仓库的设计过程,并能够利用 DTS 工具建立数据仓库二、实验平台操作系统:windows2000 或者 windows XP 数据库管理系统: MS SQL Server三、实验要求1.实验数据采用 SQL SERVER2000 提供的 pubs 示例数据库作为 OLTP 源系统2.pubs 是一个图书出版公司的数据库,记录图书出版及销售等各个方面的信息该公司的销售部门给予实用数据仓库为销售策略作辅助支持,采用自底向上的开发模式先为销售部门设计一个数据集市3.分析需求:a)希望针对每个出版社作图书销售业绩分析b)希望针对每个国家的出版社图书销售业绩分析c)希望针对每个州的出版社图书销售业绩分析d)希望针对每个城市的出版社图书销售业绩分析e)希望针对每本图书做销售业绩分析f)希望针对每类图书做销售业绩分析g)希望针对每年出版的图书做销售业绩分析h)希望针对每位作者所编写的图书做销售业绩分析i)希望针对每个书店做销售业绩分析j)希望针对每个州的书店做销售业绩分析k)希望针对每个城市的书店做销售业绩分析l)希望针对年、季、月做销售业绩分析4.设计事实数据表和维度数据表,创建数据仓库。

      四、实验内容1.分析 pubs 数据库的架构,画出关系图 分析 pubs 数据表含义序号数据表名称作用1Publishers出版社表记录出版社的基本信息2Pub_info出版社信息表记录出版社的标志和其他信息3Employee雇员表记录雇员的基本信息4Jobs工作表记录工作的基本信息5Roysched版税表记录图书的版税情况6Titles图书表记录图书的基本信息7Titleauthor图书作者表记录图书和作者之间的关系8Authors作者表记录作者基本信息9Sales销售表记录图书在各书店的销售信息10Stores书店表记录书店的基本信息11discounts折扣表记录书店的打折信息2.针对需求进行归纳,发现分析的角度可以分为出版社、图书、作者、书店和时间 5 大类确定的主题是销售3.数据筛选:a)Publishers 所有字段应当加入到数据仓库中b)不需要出版社详细资料,所以 Pub_info 不必加入数据仓库c)不需要出版社中员工的信息,所以 employee 和 jobs 不需要;d)同样与税率相关的 roysched 表和 titles 表中的 royalty 和 titleauthor 表中的 royaltyper 字段排除掉。

      e)也不需要图书的预付款、年销售量、出版日期、摘要说明等信息,排除了 titles 表中的 advance,ytd_sales,notes 和 pubdate .f)对于书店表,公司只对书店的地理位置感兴趣;暂不考虑折扣情况4.可用的数据:a)Publishers 所有字段b)Titles(title_id, pub_id, title, type, price)c)Authors( au_id, au_lname, au_fname)d)Sales( stor_id, title_id ord_num, qty, ord_date)e)Stores( stor_id, stor_name, city, state)5.识别事实数据与维度数据事实数据维度数据规模几百万笔/上亿笔数据远比事实数据少数据标识拥有多个外键只有单一主键数据类型数值数据字符数据数据性质不会改变经常改变系统分析的范围归纳为出版社、作者、图书、书店和时间 5 大类,维度就是数据分析的角度,可以分为 5 项: 出版社:publisher 表中的全部字段属于出版社维度,city,state,country有层次结构 作者:author 表中的属性为图书维 图书: sales.title_id, title 表中除了 price 其他 title_id,title,type,pub_id 为图书维。

      Price 为事实 书店:store 全部字段为图书维度,sales.store_id, 时间:sales.ord_date 关于事实:sales 中的 ord_num 和 qty 字段事实表:sales(pub_id,stor_id,title_id,ord_date,qty, unitprice,total)维表:publishes(pubIid,pub_name,city,state,country)Books(title_id,book_name,type,pubdae)Stores(stor_id,stor_name,stor_city,stor_state)Authors(title_id,au_id,au_name)Time(ord_date)6.利用 DTS 实现数据库数据的加载 Sales 事实表:select p.pub_id,st.stor_id,t.title_id,s.ord_date,s.qty,t.price unitprice from publishers p,stores st,titles t,sales s where t.pub_id=p.pub_id and s.title_id=t.title_id and s.stor_id =st.stor_id关于 total 字段的数据处理function Main() { DTSDestination(“total“) = DTSSource(“qty“)*DTSSource(“unitprice“); return(DTSTransformStat_OK); } Publishers 维度表与源 publishers 完全一致 Books 维信息来源于 titles 表 Select title_id, title, type, pubdate from titles Authors 表 Select ta.title_id,ta.au_id,a.au_fname,a.au_lname from titleauthor ta, authors a where ta.au_id=a.au_id 修改表明为 authors,删除 au_fname 和 au_lname 字段,并添加 au_name 字段。

      DTSDestination(“au_name”)=DTSSource(“au_fname”)&” “ &DTSSource(“au_lname”) Stores 维度来自 stores 表 Select stor_id,stor_name,city,state from stores 在新表中将 city,state 更名为 stor_city 和 stor_state Time 维度表来自 sale Select distinct ord_date from sales。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.