时间:2018-7-30来源:本站原创作者:佚名

在众多业务领域中,交叉销售是应用关联规则提升销售成功率和客户价值贡献的典范,通过发现产品或客户行为之间的关联规则,例如有些产品经常被一起购买、代发工资日开放式理财产品旺销、购买寿险的客户往往也会购买健康险等,构建交叉销售体系,实现销售额、服务效率和客户体验的综合提升。

案例背景

经济学上有一个经验,持有两项产品的客户流失率55%,而持有四项产品以上的客户流失率近乎0。根据Forrester研究公司分析专员SucharitaMulpuru的研究成果,在电商行业,向顾客推荐产品所产生的价值肩负起了给电商网站带来10-30%的收益的重任。亚马逊在年曾宣称它们公司35%的收益都是通过向上销售和交叉销售实现的。

作为最具影响力的挖掘关联规则的数据挖掘算法,网上有人归纳了十大机器学习算法,Apriori位列其中。作为最具影响力的挖掘关联规则的数据挖掘算法,Apriori算法已经被广泛的应用到购物篮分析(交叉销售的一种)、商场顾客的消费轨迹、网络入侵检测等多个领域。

数据准备与预处理

每个数据挖掘算法对于要分析的数据都有特定的格式要求,Apriori算法要求数据包含客户ID和产品名称两列。表6-1是一份信用卡客户持有产品的清单,类似的还有超市购物单、网店订单等,要应用Apriori算法挖掘关联规则,则需要转换成表2格式。

表1客户持有产品的清单(样例)

表2Apriori算法的输入数据格式

发现关联规则1、为建模创建事务数据库,可理解为为分析准备一个虚拟环境,并不产生分析结果。在安装SAS的时候应该勾选SASEM模块,否则会报错。2、生成项集并根据支持度阈值得到频繁项集,当产品项很多时,运算量会非常大。此处,频繁项集输出到表Asc_Result中。

3、利用频繁项集,构造满足最小置信度阈值的强关联规则,并直观展示出来,此处输出到表Rla_Rules中。

代码清单1Apriori的SAS代码

/*Step1.为建模创建事务数据库*/

PROCDMDB

DATA=Asso_Datsrc/*Asso_Datsrc是表2的输入数据*/

OUT=_null_

DMDBCAT=Tmp2;

IDCsr_Id;/*指定Csr_Id为客户编号*/

CLASSProd;/*Prod为字符类型的变量*/

TARGETProd;/*指定Prod为分析关联规则的产品项*/

RUN;

/*Step2.生成频繁项集*/

PROCASSOC

DMDBCAT=TMP2

DATA=Assoc_Datsrc

OUT=Asc_Result/*将频繁项集输出到Asc_Result表中*/

PCTSUP=10/*设定支持度阈值为10%*/

ITEMS=4;/*最大项数为4,即在一条规则中最多包含4个产品*/

CUSTOMERCsr_Id;

TARGETProd;

QUIT;

/*Step3.生成强关联规则并直观展示出来*/

PROCRULEGEN

IN=Asc_Result/*以上一步生成的频繁项集作为输入*/

OUT=Rla_Rules/*将关联规则输出到表Rla_Rules中*/

MINCONF=60;/*设定置信度阈值为60%*/

QUIT;

代码运行后将输出强关联规则,即可以推荐的产品。

发现序列模式

有的时候不仅要看产品之间的关系,还要







































中科白癜风医院让天下无白
北京哪个医院治白癜风比较好

转载请注明原文网址:http://www.imeimeishou.com/tbyx/8224.html

------分隔线----------------------------