决策树应用于电商行业用户细分精准画像的案例
某省电信运营商e8套餐(宽带+固话)升级e9(宽带+固话+手机)的主要业务目标为针对e8客户加装电信C网号码并购买手机,升级为e9融合套餐或e9自主套餐用户。即,通过电信的自身的宽带客户资源,进行精准电话营销,促使用户购买手机,从而提升电信在手机市场的占有率。
2、数据理解:e8升e9的数据理解
3、确定分析对象
本环节关键点:
缩小分析基础客户群范围,从表中238万宽带客户中筛选出24万符合业务目标的e8客户,作为数据挖掘的基础客户群
具体步骤:
常用的数据挖掘基础客户群筛选维度如下:
分析对象筛选流程:
以e8升e9为例,根据前期业务和数据理解,本次挖掘的基本目标客户为e8用户,且在同账户下无C网手机。
具体数据样本选取路径如下:
注,具体操作方法:
4、变量筛选
以e8升e9案例中变量处理为例,具体筛选流程如下:
(1)选择模型输入变量
根据数据准备阶段字段筛选结果选择了9个字段作为模型输入变量。CHAID节点对应的目标变量和预测变量设置,见下截图。
(2)模型输出结果
运行CHAID决策树节点后,会根据样本数据和输入变量训练决策树模型。虽然输入了9个变量但是CHAID决策树节点训练的模型最终生成决策树所选择的变量只有5个,分别是宽带在网时长()、固话通话时长()、固话ARPU()、宽带在网时长()、宽带流量()。可以看出,这5个变量在都是具有重要业务含义的字段,基本符合建模目标。
(3)决策树输出的初步结果
下图,是决策树模型输出的结果,树状结构末端的每个“叶子”,代表一个细分用户群体。这个决策树结果共有17个“叶子”节点。
6、模型调优
e8升级e9模型中,决策树模型验证调优流程如下:
初步结果判定:
决策树结果共有17个“叶子”节点,用户细分群体偏多,部分群体的规模小,占比不足5%,因此需要根据各叶子节点的特征,对决策树的“叶子”进行修剪合并。
比如,上图中的节点1(套餐档位