- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
-Spark在TalkingData的应用
志涛
alkingData研发副总裁
目录目录
关于TalkingData
为什么使用Spark?
Sppark在TalkinggData的使用场景?
目前面临的问题?
关于DMP
于TalkingData
• 成立于成立年
• 服务超过10万款移动应用,以及8万多应用用开发者
• 每天处理超过10T的数据
•• 服务于招商银行服务于招商银行、平安平安、泰康泰康、卓越地产等卓越地产等等等企业级客户等等企业级客户
• 国内比较早使用Spark的大数据公司
什么使用Spark
什么使用Spark
从Strata大数据大会了
2013年初
解了解了SparkSpark
公司数据积累到公司数据积累到一定规定规
2013年年8月
模,尝试数据利用
尝试使用Spark做机器
2013年 10月
学习
数 据 利 用 全 面 转 向
Spark 年年年55月月
park在TalkingData的使用场景
数据落盘 清洗加工 批量计算 数据探索 机器学习
TTalkilkingDData DMPDMP
们现在面临的问题
Spark很不错,不过从数据的视角角看,需要更多
数据资产可以管理数据资产可以管理 ,数据世代可以追踪数据世代可以追踪踪踪
数据质量的管理和控制
方便的数据加工流程编织方便的数据加工流程编织
数据访问的认证、授权、安全控制、审审计
方便的数据探索能力和数据应用开发能方便的数据探索能力和数据应用开发能能力能力
交互式的分析能力
计算资源的分配计算资源的分配、以及使用统计以及使用统计
可配置数据接入和数据输出
数据服务化数据服务化
监控和运维能力
于DMP
标签管理 人群管理 微观分析 潜客获取 营销活动 TD大数据应
大数据采集 大数据整合 大数据据计算 大数据分析
线上应用数据采集 基本属性整合
用户用户户计算户计算 用户分析用户分析
TD大数据管
业务系统数据采集 元数据管理
标签签计算 标签分析
第三方数据采集第三方数据采集 ETL
大数据可视化
大数据计算
大数据
文档评论(0)