📄 31.txt
字号:
发信人: greenflower (小呆), 信区: DataMining
标 题: 一个数据挖掘计划的例子(1)
发信站: 南京大学小百合站 (Wed Aug 22 10:41:42 2001)
问题:银行客户流失的问题。
银行首先自己作过DM,他们的模型是基于按月的用户活动的统计,从 、而得出一个大致的
趋势,但是基于这种模型的统计,当找到一个要流失的用户时,他的资金也已经基本上都
流失了。现在企业唯一的希望就是利用他们建立的数据仓库来对交易级的数据进行分析。
假设验证的计划:
产生好的想法:与多方人员进行交流,包括员工、用户、经理等。
定义数据要求:有些假设只需要企业内部的数据,而有些假设还需要一些企业外部的数据
。
确定用于假设的数据。去除一些无法实施的假设。例如:有一个假设是说养狗的用户比养
猫的用户更忠于这个银行,可能这个假设是正确的,但是我们缺少相应的数据,所以只好
去掉这个假设。
准备数据,建模,评估。
知识发现的计划:
客户要求:只要求分析那些 流失客户 的行为模式。
我们的建议:寻找 不同客户 的行为模式。因为不同的用户,他们的行为模式是有很大区
别的。这些区别可能掩盖整体上忠诚、满意客户和将要流失用户的区别。
数据准备阶段:我们建议将那些能够明确代表用户随时间发生变化的字段 取出来。同时加
上一些统计字段,如按天,按周,按月对用户行为的统计。
采用的方法:我们可以采用多种方法对用户进行分类。如按照用户的帐号种类,邮编,个
人资料等。不过在这里,我们将采用聚集的方法,让数据来说话。在将用户分成几个类之
后,我们可以继续对不同类进行进一步的分析。如果有些类的流失客户特别少或者特别多
的话,那就应该对这些类进行特别的分析。如果这些类的流失客户都比较平均的话,那也
可以采用序列模式的方法。
--
在孤单的路上自由的孤单......
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.119.80.20]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -