数据分析工作总结.pdf

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据分析工作总结

数据分析工作总结1

近期主要完成了某产品用户画像分析,从9月底拿到数据,到上

周输出第三稿,中间历时一个半月,如果从收到需求,到三稿输出,

那就超过两个月,在这次整个分析过程中,遇到了不少问题,尝试了

使用不同方法,现在是时候做一个复盘、总结、反思。

在开始阶段,遇到的主要问题是客户的要求是分析产品用户画像

报告,因为没有直接跟客户沟通,而需求只有简单的一句话,我只能

根据经验列出要分析的要点,确定需要的数据维度。在我确定分析框

架后,我发现如果按照我方的想法最后输出的结果却不是客户想到

的,那就白做了,所以确定分析框架后还需要客户确认,思路是否可

行,分析方向有无异议。这个问题还算比较好解决,客户同意了分析

思路即可。

经过与客户沟通后,到了第二阶段,发起提数需求。这个过程总

体算比较顺利,客户方数据库工程师首先反馈了一份样本数据,让我

方确认数据是否正确,如正确,则提供全量样本。数据验证的过程,

主要是由我来完成,对样本数据,我提出了一些疑问,对方也一一解

答。当然还有个别字段逻辑问题,我没有发现,对后续的分析带来了

一些影响,造成最后能使用的维度减少,是一个遗憾。

拿到全量数据后,对数据进行清洗。在这个过程中发现数据质量

非常不理想,很多字段的缺失值占比很大,个别字段也有异常值,总

体样本中能使用的记录锐减。一开始我的处理方法比较简单,对缺失

值占比达的字段直接不使用,带来的后果就是输出的第一版分析报告

过于简单。

重新回到数据,再次对数据进行摸底,而且也调整分析方法,尝

试使用聚类分析方法,按用户活跃渠道,对用进行分群,分群后,再

结合其他维度,对用户进行描述。这一次输出的报告还是存在一些问

题,最大问题就是用户群之间区别不明显,只能继续修改。中间因为

要做另一个分析,用户画像分析就暂时先放一边。

完成另一个分析后,继续回到产品用户画像分析,这次同事提出

了一些建议,在没有更好的思路前,我按照同事的建议第三次修改分

析报告。当然还是要先处理数据,这次我对异常值、缺失值就行了处

理,异常值使用的是盖帽法,对缺失值,在一些字段中用0填补,这

样增加了可使用的维度。数据清洗完后,对连续变量进行分箱处理,

这一次还是先使用聚类分析,对几个字段进行聚类,这样增加了两个

大的维度,接着基于两个大的维度,使用对应分析方法,结合其他维

度观察变量间的关系,最后的结果显示有部分变量之间是存在明显的

关系,有些几乎没有区别。数据处理完后,再次输出分析报告。

完成第三次分析后,我回过头来看看分析中存在的问题,尤其是

使用对应分析,查阅了一些资料,发现在对应分析中,应该先进行预

分析。聚类分析,两次我都是使用k—means聚类,其实还可以使用

二阶聚类,二阶聚类适用于分类变量,这是快速聚类不适用的,我尝

试在清洗后的数据中使用二阶聚类,效果尚可。

最近恰好又在看丁亚军老师的讲课视频,讲到聚类分析,再结合

我在工作中的应用,对聚类分析方法有了新的认识。聚类方法在刚兴

起的时候,是不被传统的统计学家们接受,因为这个方法太简单,没

有使用到过多的统计学知识。在实际的工作中,聚类使用的频率还是

很高的,尤其是在用户分群方面,用户特征的描述。对应分析是第一

次用到,为什么会想到使用对应分析,主要是根据变量类型,几个分

类型变量,探究变量间的关系,除了相关分析外,对应分析也使用,

而且它的结果更直观。

最后能完成第三稿也要感谢同事的建议,一个人的力量是有限的,

群策群力、集思广益才能做得更好。

数据分析工作总结2

今年以来,我校加大信息化基础建设,严格落实信息系统安全及

保护,从源头做起,不断提升了信息基础安全理念,强化信息技术安

全管理和保障,加强对包括设备安全,数据安全,信息安全等信息化

建设保障,以信息化促进学院业务管理的精简化和标准化。

一、信息等级化分类,安全分类化保护。

我校网络管理信息化管理现状,自网络信息中心(以下简称中心)

成立时起,我中心制订了宿舍网络使用条款服务器托管等安全条款,

此八年以来,保障了广大师生网络使用及业务系统安全,未因网络出

现重大安全问题,未有因业务系统托管而出现硬件无法修复、数据被

盗等基础保障。

本年工作进度报告:

1、服务系统保护、上学期我中心开始了安全等级建设,确立了服

务系统安全分等级保护目标,重要信息重点保护,次要信息次级保护

原则,针对原来一个系统多个应用的服务进行了

文档评论(0)

***** + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体社旗县兴中文具店(个体工商户)
IP属地河南
统一社会信用代码/组织机构代码
92411327MAD627N96D

1亿VIP精品文档

相关文档