- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
国内通话数 连续 汇总变量,客户个月国内通话数合计 国内通话时长 连续 汇总变量,客户个月国内通话时长合计 所有通话时长 连续 衍生变量,客户个月所有通话时长合计 国内通话消费 连续 原始变量 高峰时期通话时长占比 连续 衍生变量,比例指标,高峰时期通话时长占国内通话时长比例 非高峰时期通话时长占比 连续 衍生变量,比例指标,非高峰时期通话时长占国内通话时长比例 周末时期通话时长占比 连续 衍生变量,比例指标,周末时期通话时长占国内通话时长比例 国际通话时长占比 连续 衍生变量,比例指标,国际通话时长占全部通话时长比例 高峰时期平均每次通话时长 连续 衍生变量,强度相对指标 非高峰时期平均每次通话时长 连续 衍生变量,强度相对指标 周末时期平均每次通话时长 连续 衍生变量,强度相对指标 国内平均每次通话时长 连续 衍生变量,强度相对指标 高峰时期通话时长趋势 连续 衍生变量,趋势指标 非高峰时期通话时长趋势 连续 衍生变量,趋势指标 周末时期通话时长趋势 连续 衍生变量,趋势指标 高峰时期通话时长波动 连续 衍生变量,波动指标 非高峰时期通话时长波动 连续 衍生变量,波动指标 数据理解:宽表生成(续) 第三十页,共六十二页。 周末时期通话时长波动 连续 衍生变量,波动指标 计费通话时长 连续 衍生变量,高峰非高峰周末免费时长后时长合计 * 实际通话花费 连续 衍生变量,反映客户国内通话实际花费 * 总通话花费 连续 衍生变量,反映客户全部(国内国际)通话花费 * 总花费 连续 衍生变量,反映客户全部总花费(包括固定费用) * 平均每分钟通话花费 连续 衍生变量,反映客户平均每分钟通话的花费 平均每分钟花费 连续 衍生变量,反映客户平均每分钟花费() 是否流失 离散(标记变量) 原始变量,是否流失标记变量 数据理解:宽表生成(续) 第三十一页,共六十二页。 数据理解:关键术语和指标定义 时段分类 高峰时期:指典型的工作时间(周一至周五早到晚)非高峰时期:指典型的不含周末的非工作时间(周一早早,周一至周四晚次日早和周五晚晚周末时期:指周六周日晚 话务量级别 针对国内电话通话时长合计,按照如下标准划分客户电话情况:.低使用者:通话时长所有客户平均通话时长(简称平均)减去所有客户通话时长一个标准差(标准差).中使用者:通话时长介于平均减一个标准差与平均加一个标准差之间.高使用者:通话时长介于平均加一个标准差与平均加倍的标准差之间.超高使用者:通话时长大于平均加倍标准差 话费方案是否合理 默认值 * * * 第三十二页,共六十二页。 数据探索性分析 离散变量的探索性分析方法 离散变量分为两类:名义型和有序型。 名义型:取值之间没有大小关系,也无法比较好坏优劣 有序型:取值之间可以比较大小,有好坏优劣之分 )、名义型离散变量的探索性分析方法 离散变量各个取值的数量及占比 图形:饼图条形图 )、有序型离散变量的探索性分析方法 离散变量各个取值的数量及占比 图形:饼图条形图 频数表累积频数累积频率 第三十三页,共六十二页。 数据探索性分析 连续变量的探索性分析方法 )、集中趋势:均值,中位数,众数 )、离散趋势:最小值,最大值,全距,标准差,变异系数 )、分布形态:偏度,峰度 )、使用图形:直方图,箱线图 第三十四页,共六十二页。 数据探索性分析 变量之间关系的探索性分析方法 )、离散变量与离散变量 条形图,网络图 )、离散变量与连续变量 直方图,箱线图 )、连续变量与连续变量 散点图 第三十五页,共六十二页。 培训大纲 一、指标变量获取 二、案例背景 三、商业理解 四、数据理解与数据准备 五、建立模型与模型评估 六、模型应用 七、总结 第三十六页,共六十二页。 建模和评估 聚类 聚类 建立规则 决策树 神经网络模型 对客户进行聚类分析,并比较不同客户群流失可能性 建立规则,描述那些易于流失的客户群的特征 建立打分模型,对客户流失可能性(概率)进行评价 第三十七页,共六十二页。 模型的选择 )、因素一:业务角度的考虑 商用数据挖掘是从业务中来到业务中去的过程,在数据挖掘项目的整个过程中都不能忘记我们的服务对象是业务。选择什么样的模型首先应该考虑:模型结果的表现形式如何?这个模型对业务有帮助吗?模型的结果如何应用? 具体到流失问题来说,从营销挽留策略来看,不同级别客户的服务方式大不一
文档评论(0)