数据仓库实验报告 - 图文

2026/4/23 13:43:24

五. 实验总结 本次实验使用SQL Server 2005建立多维数据模型,使我对建立多维数据模型与数据的导出过程有了简单的认识。此外,数据仓库的创建与设计过程需要先配置环境,然后建立多维数据模型。数据仓库系统建立的过程:收集与分析业务需求、建立数据仓库的概念和逻辑模型、对数据仓库做物理设计、定义数据源、选择数据仓库技术与平台、数据的ETL处理、选择数据分析与数据展示软件、数据仓库的更新设计等。数据仓库应用系统的开发包括两个部分:一是数据仓库数据库的开发与设计,用于存放数据仓库的数据;二是数据分析应用系统的开发。 实 验 名 称 实验二 SQL Server 2005中的关联规则应用 一.实验目的 通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下关联规则的应 用的知识,训练其把教材上的内容应用到实际中的技能,为今后继续关联规则知识的学习奠 定基础。 二.实验内容 在SQL Server 2005示例数据仓库环境下关联规则的应用。 在SQL Server 2005中,可以利用Analysis Serverces进行关联规则的挖掘。以系统提供的Adventure Works DW数据库为例说明如何发现关联规则。 三.实验步骤和结果 1. 创建Analysis Services项目 打开Business Intelligence Development Studio,选择“文件”->“新建”命令,新建一个Analysis Services项目。在“名称”文件框中将新的项目命名为Adventure Works,单击“确定”按钮。 2. 创建数据源 在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加链接。系统将打开“链接管理器”对话框。 在“链接管理器”对话框的“提供程序”下拉列表中选择“本机OLE DB\\Microsoft OLE DB Provider for SQL Server”选项,在“服务器名”下拉列表中选择承载AdventureWorksDW的服务器,在“选择或输入一个数据库名”下拉列表中选择AdventureWorksDW选项,再单击“确定”按钮。 单击“下一步”按钮进入“模拟信息”页,选择“默认值”。此后都采取默认值,新的数据源AdventureWorksDW将显示在解决方案资源管理器的“数据源”文件夹中。 3. 创建数据源视图 在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令。系统将打开数据源视图向导。在“选择数据源”页的“关系数据库”下,默认选中子啊上一步中粗昂间的AdventureWorksDW数据源。单击“下一步”按钮,在“选择表和视图”页上选择下列各表,然后单击右键头键,将dbo.vAssocSeqLineItems视图和dbo.vAssocSeqOrders视图包括在线数据源视图中,单击“下一步”按钮。 在“完成向导”页上,默认情况下,系统将数据源视图命名为AdventureWorksDW。单击“完4. 5. 6. 7. 成”按钮。系统将打开数据源视图设计器,显示AdventureWorksDW数据源视图。 在数据源视图设计器的数据源视图窗格中,选择vAssocSeqLineItems表的OrderNunber列。将该列拖到vAssocSeqOrders表中,并将其放到OrderNumber列上。vAssocSeqOrders和vAssocSeqLineItems表之间便存在新的多对一关系。 创建关联挖掘结构 在解决方案资源管理器中,右键单击“挖掘结构”,从弹出的快捷菜单中选择“新建挖掘结构”命令,在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”选项,再单击“下一步”按钮。 在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术?”列表框中选择“Microsoft关联规则”选项,再单击“下一步”按钮。 “选择数据源”页随即显示。默认情况下,“可用数据源视图”下的AdventureWorksDW为选中状态。 单击“下一步”按钮,在“指定表类型”页上选择vAssocSeqOrder表右边的“示例”复选框,选中vAssocSeqLineItems表右边的“嵌套”复选框。关联模型必须包含一个键列、多个输入队列以及一个可预测列。输入队列必须为离散列。关联模型的输入数据通常包含在两个表中。 单击“下一步”按钮,在“指定定型数据”页上依次清除CustomerKey右边的“键”复选框和LineNumber右边的“键”和“输入”复选框。选中Model列右边的“键”和“可预测”复选框。然后系统也将自动选中“输入”复选框。 单击“下一步”按钮,在“指定列的内容和数据类型”页上单击“下一步”按钮。在“完成向导”页的“挖掘结构名称”输入Assocoation,再单击“完成”按钮。系统将打开数据挖掘设计器,显示刚刚创建的Association挖掘结构。 设置关联规则挖掘的参数 首先打开数据挖掘设计器的“挖掘模型”选项卡,右键单击设计器网格中的“关联”列,从弹出的快捷菜单中选择“设置算法参数”命令。系统将打开“算法参数”对话框,在“算法参数”对话框的值列出设置以下参数。 MINIMUM_SUPPORT=0.01 MINIMUM_PROBABILITY=0.1 然后单击“确定”按钮。 MINIMUM_SUPPORT指定在该算法生成规则之前必须包含项集的事例的最小数目。将该值设置为小于1,将指定最小事例数最为事例总计的百分比;将该值设置为大于1的整数,将指定最小事例数作为必须包含项集的事例的绝对数。默认值为0.03. MINIMUM_PROBABILITY指定规则为True的最小概率。 建立关联规则挖掘模型 由于已经定义了“关联”挖掘模型的结构和参数,可以对该模型进行处理。选择“挖掘模型”菜单的“处理挖掘结构和所有模型”选项,系统将打开“处理挖掘结构-Association对话框。单击“运行”按钮,系统将打开“处理进度”对话框,以显示有关模型处理的信息。 查看挖掘结果 处理完成之后,“选择挖掘模型查看器”,第一个页面是挖掘到的频繁集。或者打开第二个页面,查看挖掘出来的规则。


数据仓库实验报告 - 图文.doc 将本文的Word文档下载到电脑
搜索更多关于: 数据仓库实验报告 - 图文 的文档
相关推荐
相关阅读
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 10

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219