数据挖掘应用案例 - 范文中心

数据挖掘应用案例

01/18

网上书店关联销售

应用背景: 网上书店现在有了很强的市场和比较固定的大量的客户。为了促进网上书店的销售量的增长,各网上书店采取了各种方式,给客户提供更多更丰富的书籍,提供更优质服务,等方式吸引更多的读者。但是这样还不足够,给众多网上书店的商家们提供一种非常好的促进销售量增长,吸引读者的方法,就是关联销售分析。这种方法就是给客户提供其他的相关书籍,也就是在客户购买了一种书籍之后,推荐给客户其他的相关的书籍。这种措施的运用给他们带来了可观的效益。

这里介绍的关联销售并不是,根据网上书店的销售记录进行的比例统计,也区别于简单的概率分析统计,是用的关联规则算法。“啤酒和尿布”的故事足以证明了该算法的强大功能和产生的震撼效果。

那么,怎么来实现这样一个效果呢?

解决步骤:

首先,通过数据源,也就是销售记录。这里做数据挖掘模型,要用到两张表,一张表是会员,用会员ID 号来代替;另一张表是那个会员买了什么书。应用SQL Server 2005的Data Mining工具,建立数据挖掘模型。

具体步骤如下:

第一步:定义数据源。选取的为网上书店的销售记录数据源(最主要的是User 表和Sales 表)。

第二步:定义数据源视图。在此建立好数据挖掘中事例表和嵌套表,并定义两者之间的关系,定义User 为事例表(Case Table),Sales 为嵌套表(Nested Table)。 第三步:选取Microsoft Association Rules(关联规则)算法,建立挖掘模型。 第四步:设置算法参数,部署挖掘模型。

第五步、浏览察看挖掘模型。对于关联规则算法来说,三个查看的选项卡。

A :项集:“项集”选项卡显示被模型识别为经常发现一起出现的项集的列表。在这里指的是经过关联规则算法处理后,发现关联在一起的书籍的集合。

B :规则:“规则”选项卡显示关联算法发现的规则。“规则”选项卡包含一个具有以下列的网格:“概率”、“重要性”和“规则”。概率说明出现规则结果的可能性。重要性用于度量规则的用途。尽管规则出现的概率可能很高,但规则自身的用途可能并不重要。重要性列就是说明这一情况的。例如,如果每个项集都包含属性的某个特定状态,那么,即使概率非常高,预测状态的规则也并不重要。重要性越高,规则越重要。

C :关联网络:节点间的箭头代表项之间有关联。箭头的方向表示按照算法发现的规则确定的项之间的关联。

效果展示: 1、可以看到在图中,绿色的是选择的节点,橙色的是可以预测所选节点的节点,也就是说如果消费者买了《月光宝盒(2VCD )》的话,那么就可以给该消费者推荐《乱世佳人(上集,2VCD )》。紫色的是和所选节点能够双向预测的,即买了《大圣娶亲》,推荐《乱世佳人(上集,2VCD )》;同样,买了《乱世佳人(上集,2VCD )》,推荐《大圣娶亲》。这样我们就很容易看到经过关联算法计算出来的书籍之间的关联性。

2、也可以通过写DMX 语句来实现预测查询。

SELECT PredictAssociation([User].[Sales],include_statistics,10)

From [User]

NATURAL PREDICTION JOIN

(SELECT (SELECT '月光宝盒(2VCD)' AS [Book Name]) AS [Sales]) AS t 结语:

今天,网上书店已经进入了一个比较稳定的发展期,吸引了越来越多的客户,特别是青年群体。数据挖掘在其商品销售、提高客户价值、发现客户等方面提供了技术支持,逐渐得到广泛的应用。

网上书店应该对检索失败的数据进行分析,按类进行统计,有针对性地补充和丰富书目信息。同时,收集站点在线调查、留言本和推荐书目等的数据,整理分析,使之转化成为标准的结构化数据,利用数据挖掘的方法发现客户感兴趣的模式,甚至可以预测客户群体兴趣的变迁,提前做好书目的增加及完善工作。


相关内容

  • 毕业论文文献综述基于SPSS的多元回归分析模型选取的应用 之文献综述
    基于SPSS 的多元回归分析模型选取的应用 文献综述 重庆工商大学 统计学 2010级 统计2班 殷婷 引 言 随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军 ...
  • 房地产投资分析教学大纲
    <房地产投资分析>教学大纲 适用专业:房地产开发与管理 课程类别:专业核心课程 授课学时:54 学 分:3 总纲 课程的性质: 本课程研究房地产投资分析的基本理论与方法,以便为房地产投资进行正确决策提供依据.该课程由房地产投资分 ...
  • 伊利分销案例
    五.典型客户应用案例 1.食品行业--内蒙古伊利股份有限公司分销管理系统 高科技企业一般都有技术.资金.人力和管理的实力来进行自行组织软件开发和网络化管理,如联想.方正这样的依靠庞大的销售网络实施产品销售的IT 公司:但还有众多的制造和销售 ...
  • 金牌店长特训营
    <金牌店长特训营>培训目标 掌握绝对成交的技巧与话术,店长如何快速复制销售精英? 店长如何实现由"超级明星"到"组织效能"的蜕变? 掌握沟通激励技巧,激发员工潜力,增强行动 如何减少流失率 ...
  • 主成分聚类分析法的案例教学方法
    主成分聚类分析法的案例教学方法 张 (中南财经政法大学 摘 虎 信息学院,武汉430060) 要:本文针对<多元统计分析>课程中主成分分析和聚类分析法的教学难点,采用案例教学法 来解释主成分分析及聚类分析,并依据主成分得分对样品 ...
  • 软件测试试卷(有答案)
    模拟试题1 一.选择题(每题2分,共30分) 1.导致软件缺陷的最大原因是( ) A. 编写程序 B. 设计方案 C. 软件需求说明书 D.软件规格说明书 2.在下面几个语句中,判断哪一个是错误的 A)发现和修复产品中的软件缺陷越早,开发费 ...
  • 运筹学案例
    <管理运筹学>案例作业 班级:三门峡MBA班 姓名:司久胜 2008年9月1日 案例一:中国股民股票投资状况调查与分析 一.案例简介 为了了解我国广大股民的投资状况,研究我国股民的股票投资特征,培养MBA学员的实地调查能力,并为 ...
  • [金融市场学]课程论文写作基本要求2
    <金融市场学>课程论文撰写要求 一.参考选题范围 根据金融市场学教学内容,结合自己的专业,用不少于3000字的篇幅,自命题写出一篇论文. 二.全文字数要求不低于3000字 三.需联系实际 四.课程论文写作辅导 课程论文作为部分课 ...
  • 新三板调研论文
    财会杯论文 课题名称:新三板挂牌公司盈利模式比较及其经济后果研究 队伍名称: 所在院系: 会计学院 指导老师: 杨志强老师 目录 一.研究背景与内容提出 „„„„„„„„„„„„„„„„„„„„ I (一)新三板的概况与现状„„„„„„„„ ...
  • 防火墙案例
    据统计,本周瑞星共截获了875810个钓鱼网站,共有451万网民遭遇钓鱼网站攻击.瑞星安全专家提醒用户,在机场.图书馆.咖啡馆等公共场所使用免费WiFi上网时,一定要注意安全,不要随意连接没有设置密码的网络.目前,发现很多黑客会在公共WiF ...