基于大数据的西成高铁增值服务目标旅客识别研究.docx

基于大数据的西成高铁增值服务目标旅客识别研究.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于大数据的西成高铁增值服务目标旅客识别研究

?

?

摘要:与既有线普通铁路线相比较,高铁所吸引的旅客群体主要为高中端旅客,他们在旅行需求和心理存在较大的差异。本文以西成高铁为例,对旅客进行大数据分析,旨在找出他们之间的关联度,都有利于西成高铁对当前的系统与服务进行改进,更好地提升用户对西成高铁服务的利用率。

关键词:客运服务;心理需求;质量

一、引言

西成高铁自2017年12月全面投入运营后,西部地区重庆、成都和西安三个主要城市之间距离被大大缩短,据中国铁路总公司发布发消息,截至到2018年12月4日18时,西成高铁客运专线所共开行的高铁/动车列车达到了4.3万趟,自该线路开通以来平均每天开行的列车约有117趟;发送的专线沿线旅客超过了1720万人次,平均每天发送旅客数量达到了4.7万人次。

二、基于K-means方法的西成高铁旅客用户行为与需求挖掘

1.数据获取与数据处理

本研究于2018年11月和12月期间,收集了西成高铁在该年的11月1日至11月30日铁路客户服务中心系统后台日志数据,该系统的日志数据详细记录了旅客乘坐西成高铁的出行及获得相关服务的信息,如旅客证件信息、旅客进出站记录、购票记录、改签及退换票记录、接入网络的IP地址及终端信息、乘坐车次、列车发车时间、旅客使用高铁订餐相关服务的记录等。

2.数据分析流程

对西成高铁旅客行为与需求进行挖掘和分析所采取的方法为大数据分析中常用的K-means算法,在具体执行该算法的过程中,考虑到西成高铁旅客的用户对象主要以学生、老人及各行各业的商务人士为主,用户虽然具有比较大的异质性,但所设置的聚类簇数也不宜过多,否则会导致聚类效果较差。我们根据西成高铁旅客用户的大致分类情况,将拟采用的K-means算法所获得的聚类簇数设置为6个,其具体分析过程包含原始数据获取、数据筛选、高铁服务使用类别数量、出行次数比较、使用增值服务的行为比重、使用一般服务的行为比重、数据类型设置、数据过滤、K-means聚类等环节。

3.聚类分析结果

本研究通过K-means聚类分析算法所得出的聚类分析结果如表2所示。由于将K-means聚类簇数设置为6个,我们可以因此获得六个聚类结果。在这六个类中,聚类3仅包含两个记录,且该聚类下的增值服务使用次数、一般服务使用次数、活动次数、活动持续时间、利用西成高铁服务数量的值均要远大于其他五个类,说明聚类3所包含的26个记录存在异常的情况,因此我们不需要对该类的相关信息进行更进一步的分析。

聚类1所包含了记录数最多,记录数占所有数据总量的18.57%,该类下聚集了大量用户,共有8273个用户,是包含用户数最多的类该类用户在数据采集期间在铁路服务系统中的出行记录数量平均值为3.025个,在出行过程中所包含的活动行为数量平均有55.764个,在所有类中处于中等水平,说明该类旅客用户乘坐西成高铁的行为活动及其使用相关服务的行为比较正常。该类旅客用户使用西成高铁一般服务的行为比重相对较低,这些旅客的增值服务使用次数、一般服务使用次数都处于比较中间的水平,说明这类用户利用西成高铁服务目的比较统一和集中,主要利用的是西成高铁的某一个服务,通常主要是购票服务。总体来看,该类旅客用户对西成高铁服务的利用处于中等水平,其目的主要以购票为主,利用西高铁提供的其他增值服务的次数并不高,因此西成高铁可重点关注这类用户在出行目的地及其在出行过程中的服务使用记录,有针对性地为这些旅客推荐一些出行或休闲相关的信息,以使满足这类旅客用户的出行需求。

聚类2所包含的记录数其次多,记录数占到了所有数据总量的12.42%,该类下包含的用户数量为4435个,是用户数量其次多的类。在该类下使用智能设备的用户数量比较并不算高,只有26%,说明该类用户大多使用的是桌面端的设备接入到西成高铁的铁路服务系统。该类用户使用西成高铁的出行次数平均值为2.049次,比聚类1的出行次数相对要少,该类用户一般服务使用的比重也比较高,达到了58%,该类旅客用户的增值服务使用行为比重也不算低,达到了24.6%,要高于聚类1,说明该类用户在使用高铁一般服务的同时,也会发起比较多的增值服务行为。

聚类4和聚类5所包含的记录数占所有数据记录的比重分别为6.63%和4.27%,这两类用户属于两类行为相反的用户群。其中,聚类4的用户属于以一般服务使用为主要目的,主要利用桌面端设备进行操作,会在铁路服务系统中留下比较多的服务使用记录,以获取精确的服务项目的用户群,该类用户进行其他的情况相对较少;聚类5的用户属于更愿意利用铁路服务系统中其他服务的用户,这类用户以利用智能设备为主。另外,聚类6的用户在一般服务行为和增值服务使用行为的频次上都不算,但其活动记录的次数却达到了117.54次,说明这类用户喜欢比较喜欢漫无目的在铁

文档评论(0)

135****1100 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档