在众多业务领域中,交叉销售是应用关联规则提升销售成功率和客户价值贡献的典范,通过发现产品或客户行为之间的关联规则,例如有些产品经常被一起购买、代发工资日开放式理财产品旺销、购买寿险的客户往往也会购买健康险等,构建交叉销售体系,实现销售额、服务效率和客户体验的综合提升。 案例背景经济学上有一个经验,持有两项产品的客户流失率55%,而持有四项产品以上的客户流失率近乎0。根据Forrester研究公司分析专员SucharitaMulpuru的研究成果,在电商行业,向顾客推荐产品所产生的价值肩负起了给电商网站带来10-30%的收益的重任。亚马逊在年曾宣称它们公司35%的收益都是通过向上销售和交叉销售实现的。 作为最具影响力的挖掘关联规则的数据挖掘算法,网上有人归纳了十大机器学习算法,Apriori位列其中。作为最具影响力的挖掘关联规则的数据挖掘算法,Apriori算法已经被广泛的应用到购物篮分析(交叉销售的一种)、商场顾客的消费轨迹、网络入侵检测等多个领域。 数据准备与预处理每个数据挖掘算法对于要分析的数据都有特定的格式要求,Apriori算法要求数据包含客户ID和产品名称两列。表6-1是一份信用卡客户持有产品的清单,类似的还有超市购物单、网店订单等,要应用Apriori算法挖掘关联规则,则需要转换成表2格式。 表1客户持有产品的清单(样例) 表2Apriori算法的输入数据格式 发现关联规则1、为建模创建事务数据库,可理解为为分析准备一个虚拟环境,并不产生分析结果。在安装SAS的时候应该勾选SASEM模块,否则会报错。2、生成项集并根据支持度阈值得到频繁项集,当产品项很多时,运算量会非常大。此处,频繁项集输出到表Asc_Result中。3、利用频繁项集,构造满足最小置信度阈值的强关联规则,并直观展示出来,此处输出到表Rla_Rules中。 代码清单1Apriori的SAS代码 /*Step1.为建模创建事务数据库*/ PROCDMDB DATA=Asso_Datsrc/*Asso_Datsrc是表2的输入数据*/ OUT=_null_ DMDBCAT=Tmp2; IDCsr_Id;/*指定Csr_Id为客户编号*/ CLASSProd;/*Prod为字符类型的变量*/ TARGETProd;/*指定Prod为分析关联规则的产品项*/ RUN; /*Step2.生成频繁项集*/ PROCASSOC DMDBCAT=TMP2 DATA=Assoc_Datsrc OUT=Asc_Result/*将频繁项集输出到Asc_Result表中*/ PCTSUP=10/*设定支持度阈值为10%*/ ITEMS=4;/*最大项数为4,即在一条规则中最多包含4个产品*/ CUSTOMERCsr_Id; TARGETProd; QUIT; /*Step3.生成强关联规则并直观展示出来*/ PROCRULEGEN IN=Asc_Result/*以上一步生成的频繁项集作为输入*/ OUT=Rla_Rules/*将关联规则输出到表Rla_Rules中*/ MINCONF=60;/*设定置信度阈值为60%*/ QUIT; 代码运行后将输出强关联规则,即可以推荐的产品。 发现序列模式有的时候不仅要看产品之间的关系,还要中科白癜风医院让天下无白北京哪个医院治白癜风比较好
|