基于因子分析与聚类分析的客户偏好探究.doc

基于因子分析与聚类分析的客户偏好探究.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于因子分析与聚类分析的客户偏好探究

基于因子分析和聚类分析的客户偏好探究 一 文献综述 二十世纪五十年代中期,美国学者温德尔史密斯提出了顾客细分理论。该理论指出,顾客由于其文化观念、收入、消费习俗等方面的不同可以分为不同的消费群体。企业在经营中应该针对不同的顾客提供针对性的服务,这样才能够利用有限资源进行有效的市场竞争。对顾客的细分从方法上讲有根据人口特征和购买历史的细分和根据顾客对企业的价值即基于顾客的消费金额、消费频率的细分。本文的细分是基于购买历史和人口特征的聚类分析。饭店作为一个古老的服务行业,在现阶段的高度竞争市场下的发展趋势最重要的方面便是服务趋于个性化,所以针对饭店的消费群体特征的聚类可以对饭店进行定位,在此基础上通过分析目标客户群体对消费质量评价的最主要影响因素可以达到其服务个性化的目标。波特把顾客的价值定义为买方感知性与购买成本的一种权衡。对顾客的个性化服务增加了买方的感知度从而加大了他们愿意为此付出的成本,于是饭店便可以增加营业额。 聚类分析是把研究对象视作多维空间中的许多点, 并合理地分成若干类,即一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。故聚类算法是对顾客进行分析的一个有效方式。在聚类分析的众多算法中因子分析是研究如何以最少的信息丢失, 将众多原始变量浓缩成少数几个因子变量, 以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。而典型的k-means算法以平方误差准则较好地实现了空间聚类,对于大数据集的处理效率较高。在对顾客细分相关文献的研究过程中,主要运用的方法有神经网络,分层聚类,因子分析等方法。比如,在关于网络青少年用户的分类中,作者用层次聚类的方法,通过对青少年年龄,性别,民族,网络可得性,父母的观点等变量等变量定义不同的上网动机,在此基础上对其进行了分类。而在研究人寿保险持有者未来购买基金支持寿险可能性的文章中,通过灰度聚类和神经网络利用消费者的基本信息,财产地位信息,风险承受程度将消费者分为了忠实客户和非忠实客户。在对客户忠诚度的聚类中,作者用RFM的商业模型用DBI确定了Kmeans的最优K值,并最终用kmeans对客户忠诚度进行了聚类。 经过综合分析,我们选择了这两种方法处理顾客数据和饭店的基本资料。即,通过k-means对客户进行聚类后通过因子分析分析不同类别客户的评价影响因素。 为分析每类客户倾向的饭店特征,本文根据客户聚类结果对饭店数据进行筛选。由于饭店部分属性之间具有相关性,本文采用因子分析法挖掘其“根本属性”,之后对饭店数据进行聚类,分析得到每类客户评价得分最高的饭店特征。 二 方法论 本文选取UCI上的数据(包括饭店、客户、评价得分等信息),旨在通过划分客户群体并分析每一类客户对不同饭店的评价得分,得出每一类顾客选择饭店的倾向,即特定类别客户的喜好和评价饭店时最看重的因素。将结论应用于指导饭店发展路线与目标客户群间的战略匹配。具体方法步骤如下: 1 根据详细的客户信息对客户进行K-means聚类,总结出每一类客户的显著特点 2 客户偏好的研究 饭店的多个属性之间存在相互影响的关系,因此本文在研究饭店特点采用因子分析法,将相同本质的归入一个因子,可减少变量的数目 在因子分析的基础上,对同类顾客所评价的饭店进行聚类分析,得到每类顾客所选饭店的种类。然后分析比较各类饭店的特点,选出影响最大的因子(依据系数绝对值大小来判断),参照因子旋转矩阵后即可得到对顾客评分影响最大的饭店属性,从而分析出特定类别顾客在选择、评价一家饭店时的偏好。 Figure 1 研究框架 三 研究过程 顾客聚类分析: 在顾客信息的属性中删去User ID,其余属性作为输入字段进行K均值聚类。模型中的K值默认为5,但是分类结果中不同类型间的差异较小,随即降低K值进行尝试。考虑到顾客评分分为0,1,2三个等级,而且K=3时分类结果间的差异较显著,因此将顾客分为三类。 Cluster 1:此类顾客人数最多,出生日期在1986年之后,绝大多数人学生,其次是工作者,主要同家人一起就餐;基本不饮酒;兴趣点主要为technology;绝大多数未婚,性格为thrifty protector Catholic为主 ;基本不吸烟;公交 Cluster 2:此类顾客人数最少,年龄最大,不愿多透漏个人信息(数据中有大量缺失值)。 Cluster 3:此类顾客人数居中,出生年份在1981左右,主要为学生、工作者 多与朋友一起就餐,大多属于social drinker。多数人是单身,但是单身比率高于类型1,性格为hard-worker,car-owner为主。 聚类分析结果如下图所示: Figure 2 顾客的聚类结果 顾客偏好分析 本文通过分析每类顾客关注饭店的特征提取分析顾客的偏好,从而便于饭店

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档