频道栏目
首页 > 数据库 > SQL Server > 正文
SqlServer2012建数据挖掘模型
2017-04-24 09:46:51         来源:煊琦的CSDN小窝  
收藏   我要投稿

SqlServer2012建数据挖掘模型。??Microsoft SQL Server提供了集成的数据挖掘建模分析环境,这里我们用SQL Server官网提供的数据创建模型并用于分析顾客购车行为,从而预测潜在购车客户。

前提条件 准备分析服务数据库 创建分析服务项目Analysis Services Project 创建数据源Data Source 创建数据源视图Data Source View 创建目标邮件结构 创建目标邮件挖掘模型结构Targeted Mailing Mining Model Structure 确认数据类型内容类型Content and Data Type 确认测试数据集结构Testing Data Set for the Structure 添加处理模型 聚类分析挖掘模型 朴素贝叶斯挖掘模型 模型探索 决策树模型 聚类分析模型 朴素贝叶斯模型 测试模型 用梯度图测试准确性 测试过滤模型 进行预测 创建预测 钻取数据视图

前提条件

安装:Microsoft SQL Server 2012 (注:最好英文版,中文版有些地方可能会出错)

安装:多维模式下的Microsoft SQL Server 分析服务

数据库:采用官网的样例数据库 https://go.microsoft.com/fwlink/?LinkId=88417

准备分析服务数据库

??使用SQL Server建立商业智能应用程序( business intelligence application)进行建模分析。用数据工具(SQL Server Data Tools (SSDT))建立分析服务项目(SQL Server Analysis Services project),之后建立一或多个数据源(data sources),然后定义元数据视图(data source view)。

创建分析服务项目(Analysis Services Project)

打开SQL Server数据工具(SQL Server Data Tools (SSDT))

这里写图片描述

注意:要确认是商业智能项目模式(Business Intelligence Projects)。

更改步骤:工具->导入和导出设置。

这里写图片描述

一直到下一步,可以看到环境为 商业智能集合。

这里写图片描述

点击 文件->新建->项目

这里写图片描述

选择分析服务多维和数据挖掘项目(Analysis Services Multidimensional and Data Mining Project),项目起名为CustomerDataMining。

这里写图片描述

确认项目部署的服务名:

点击项目(右键)->属性->部署->服务器为localhost。

这里写图片描述
这里写图片描述

创建数据源(Data Source)

数据源文件夹(右键)->新建数据源

这里写图片描述

跳过欢迎页进行下一步->新建

这里写图片描述

点击服务器名,选择自己的服务器(若为空则手动输入localhost)->刷新->选择数据库(这里我们从外部导入之下下载的样例数据库)->确定

这里写图片描述
这里写图片描述

选择服务账户

这里写图片描述

数据源起名Adventure Works DW 2012,点击完成。

这里写图片描述

创建数据源视图(Data Source View)

通过数据源视图,我们可以选择项目所需要的数据,建立表之间的关系,在不修改原来的数据的情况下修改数据的结构。

点击数据源视图(右键)->新建数据源视图

这里写图片描述

选择已有数据源->下一步

这里写图片描述

选择需要的表或视图,这里我们选择:

ProspectiveBuyer (dbo) – 可能购车者信息

vTargetMail (dbo) – 曾经购车者信息

这里写图片描述

点击下一步,设置视图名 Targeted Mailing,点击完成。

这里写图片描述
这里写图片描述

创建目标邮件结构

创建目标邮件挖掘模型结构(Targeted Mailing Mining Model Structure)

点击挖掘结构(右键)->新建挖掘结构

这里写图片描述

下一步->从已有的数据仓库选择->数据挖掘结构,我们选择决策树

这里写图片描述

选择数据源:

这里写图片描述
这里写图片描述

选择模型信息,我们最少需要一个预测列,一个输入列和一个关键值列。

预测列:

? BikeBuyer

关键值:

? CustomerKey

输入列:

? Age

? CommuteDistance

? EnglishEducation

? EnglishOccupation

? Gender

? GeographyKey

? HouseOwnerFlag

? MaritalStatus

? NumberCarsOwned

? NumberChildrenAtHome ? Region

? TotalChildren

? YearlyIncome

其他分析列:

? AddressLine1

? AddressLine2

? DateFirstPurchase ? EmailAddress

? FirstName

? LastName

这里写图片描述

确认数据类型,内容类型(Content and Data Type)

点击检测按钮,对信息类型进行基本检测,点击完成。

注:这里GeographyKey 是文本,不然可能会有标识符等不识别错误。

这里写图片描述

确认测试数据集结构(Testing Data Set for the Structure)

这里设置测试比例为30%,测试集中最大数量为1000。

这里写图片描述

挖掘数据结构名:Targeted Mailing

挖掘模型名:TM_Decision_Tree

选择允许通过,点击完成。

这里写图片描述
这里写图片描述

添加·处理模型

点击挖掘模型页面,我们可以看到之前建立的决策树模型,这里我们再建立两个模型,模型处理这里省略了。

点击复制链接 与好友分享!回本站首页
上一篇:SQLite入门介绍(三)
下一篇:PostgreSQL中文手册
相关文章
图文推荐
点击排行

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站