数据挖掘在企业CRM中的研究
摘 要:本文主要介绍了数据挖掘的基本概念、功能分类以及数据挖掘技术在CRM中的典型应用;随后文章选择C4.5算法为本系统增加分析功能;接着对C4.5算法进行了深入的研究与分析,发现在计算速度以及生成结果的复杂性上有待改进,在此基础上提出了改进优化的方法并用程序实现,通过实验比较证明取得了良好的效果。在文章的最后用改进后的C4.5算法为本CRM系统实现了客户的保持分析功能。
关键词:CRM;数据挖掘;改进C4.5算法;功能;处理
1引言
客户关系管理(Customer Relationship Management)的指导思想就是对客户进行系统化的研究,以便改进对客户的服务水平,提高客户的忠诚度,并因此为企业带来更多的利润。这就要求CRM系统要能够在有效地获取客户的各种信息的同时,对客户的行为方式进行深入地分析,寻找其中的规律,为客户提供更好、更个性化的服务,为企业决策提供支持。然而如何管理和分析大量、庞杂的客户信息,从中找出对企业管理决策有价值的知识则需要有更先进的技术和工具的支持,而数据挖掘等新兴技术的出现,为CRM的实施提供了良好的支持。
数据挖掘的功能以及方法有多种,如关联分析、分类、聚类和时序模式等,关联分析可以用于交叉营销中的连带销售;聚类一般可以用于数据挖掘前数据的预处理;而分类是CRM中运用最为广泛的一种方式,它可以被用于客户细分、客户获取等方面,本文将使用分类方法为CRM系统实现客户的保持功能,在接下来将重点讨论数据挖掘的CMR中的运用。
2 典型算法分类与选择
目前已经出现了好几种决策树分类算法,如:ID3;C4.5;CHAID;CHART;SLIQ;SPRINT;PUBLIC等,现列出与本课题相关的具有代表性的一些算法。
ID3算法虽然是比较经典也是最老的一种算法,可是它存在许多的不足:一是它不能处理连续属性值,对于连续值属性,它都要把该属性离散化,这样就大大降低了分类的精确度;二是算法过程不灵活,不能处理有空缺值的样本集合,

