比分200网;万博体育manbetx 下载本文

Northwind数据仓库的构建和ETL

课程设计与实验报告

课程设计与实验教学目的与基本要求

数据仓库与知识工程课程设计与实验是学习数据仓库与知识工程的重要环节,通过课程设计与实验,可以使学生全面地了解和掌握数据仓库与知识工程课程的基本概念、原理及应用技术,使学生系统科学地受到分析问题和解决问题的训练,提高运用理论知识解决实际问题的能力皇冠代理网hg33987.com。

使学生在后继课的学习中,能够利用数据仓库与数据挖掘技术及实践经验,解决相应的实际问题,并能在今后的学习和工作中,结合自己的专业知识,开发相应的数据仓库与数据挖掘应用程序银河电子城。培养学生将已掌握的理论与实践开发相结合的能力,以及在应用方面的思维能力和实践动手能力任你博。

课程设计与实验一 数据仓库的构建和ETL

(一)目的

1.理解数据库与数据仓库之间的区别与联系;

2.掌握数据仓库建立的基本方法及其相关工具的使用欧洲杯几年举行一次。 3.掌握ETL实现的基本方法及其相关工具的使用滚球游戏大全。

(二)内容

1. 以SQL Server为系统平台,设计、建立创建数据仓库NorthwindDW(根据课程设计内容)澳门百家乐怎么玩。

2. 将业务数据库Northwind的数据经过ETL导入(或加载)到数据仓库NorthwindDW皇冠新二网址。 3. 将数据仓库NorthwindDW事实表的前100个记录导出到Excel中比分188。

(三)数据仓库设计要求

Northwind数据库存储了一个贸易公司的订单数据、产品数据、顾客数据、员工数据、供货商数据等,假设贸易公司的经营者迫切的需要准确地把握贸易公司经营情况,跟踪市场趋势,更加合理地制定商品采购、营销和奖励政策狗万怎么样。具体的分析需求是:

? 分析某商品在某地区的销售情况 ? 分析某商品在某季度的销售情况 ? 分析某年销售多少金额的产品给顾客 ? 分析某员工的销售业绩

任务:确定主题域、确定系统(或主题)的边界易胜博官网。设计数据模型(星型模型)的事实表和维表买球app。

实验步骤一、主题需求分析:

主题域:订单主题,商品主题,员工主题;

订单相关边界:Orders,Order Details,Employees; 商品相关边界:Products, Order Details; 员工相关边界:Employees,Orders;

实验步骤二、构建数据模型以及相应的事实表和维度表:

1.原始关系图:

2.去除不需要的表和与需求分析无关的字段:

5.根据信息分析包以及表间关系图设计具体维度表和事实表:

Orders事实表结构以及主键字段: 字段名称 EmployeeID ProductID CustomerID OrderDate UnitPrice Total Quantity Discount 数据类型 Int Int nchar datetime money money smallint real 功能描述 员工号码 产品号码 顾客号码 订购日期 产品单价 单项总价 订购数量 折扣 原表名 Employees Products Customers Orders Order Details 无 Order Details Order Details 原字段 EmployeeID ProductID CustomerID OrderDate UnitPrice Quantity * UnitPrice*Discount Quantity Discount 主键字段:EmployeeID, ProductID, CustomerID, OrderDate

Employee 员工维度表结构以及主键字段: 字段名称 EmployeeID FirstName LastName 数据类型 Int nvarchar nvarchar 功能描述 员工号码 员工名 员工姓 原表名 Employees Employees Employees 原字段 EmployeeID FirstName LastName 主键字段:EmployeeID

Product产品维度表结构以及主键字段: 字段名称 ProductID ProductName UnitPrice 数据类型 Int nvarchar money 功能描述 产品号码 产品名称 单价 原表名 Products Products Products 原字段 ProductID ProductName UnitPrice 主键字段:ProductID

Customer顾客维度表结构以及主键字段: 字段名称 CustomerID ContactName Address 数据类型 nchar nvarchar nvarchar 功能描述 顾客号码 顾客姓名 大致地区 原表名 Customers Customers Customers 原字段 CustomerID ContactName City+Region+Country 主键字段:CustomerID Time时间维度表结构以及主键字段: 字段名称 OrderDate Year Quarter Month 数据类型 datetime nvarchar nvarchar nvarchar 功能描述 日期 年 季度 月 原表名 Orders 无 无 无 原字段 OrderDate OrderDate拆分 OrderDate拆分运算 OrderDate拆分 主键字段:OrderDate

Region地区维表结构 字段名称 Address City Country Region 数据类型 nvarchar nvarchar nvarchar nvarchar 功能描述 大致地区 城市 国家 地区 原表名 Customers 无 无 无 原字段 Address Address拆分 Address拆分 Address拆分 主键字段:Address