尤勇 --《大众点评网监控系统架构剖析》-- ThinkInLAMP 华东架构师大会概论.pdf

尤勇 --《大众点评网监控系统架构剖析》-- ThinkInLAMP 华东架构师大会概论.pdf

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
 CAT (Central Application Tracking) ⼤众点评、架构组、尤勇 微博:DP尤勇 ⼤纲   CAT背景   CAT介绍   CAT报表   CAT设计   CAT案例   CAT总结 ⼤纲   CAT背景   CAT介绍   CAT报表   CAT设计   实际案例   CAT总结 小米+步枪   Java迁移初期,2009-2010年   Cacti、Nagios ...   Bug Email   Error Logs 趟过的坑   SOA之后多个应用同时报错,不知道是哪个出错了   ⼤量报错,需要花很久时间才能定位   很多问题最终都说可能是⽹络问题   项目出现⼀堆异常根本不关⼼   Mobile⼀开始上线⼀天就⼏⼗到上百万异常   调用缓存、数据库基本是⿊盒⼦   ⼀次将线上的库配置到了Beta ,花了整个通宵排错 监控背景   Hawk监控   典型基于Key-Value的日志监控模型   完成了异常,cache,sql等监控   CAT监控   eBay的CAL取得了巨⼤成功 监控分层   业务监控   通过⼏个核⼼指标来确定业务 正常   应用监控   通过监控应用运⾏指标来确定 应用健康状况(URL\CALL \Cache\SQL等)   系统监控   监控系统的运⾏指标   CPU、Memory、IO   Zabbix ,Cacti 监控作用 减少线上故障发现时间(OP) 减少线上故障定位时间(OP) 帮助应用程序进⾏优化(PD) ⼤纲   CAT背景   CAT介绍   CAT报表   CAT设计   CAT案例   CAT总结 CAT简介   CAT(Central Application Tracking)是基于Java 开 发的实时应用监控平台,为⼤众点评⽹提供了全面 的监控服务和决策支持。   CAT作为⼤众点评⽹基础监控组件,它已经在中间 件框架(MVC框架,RPC框架,数据库框架,缓存 框架等)中得到⼴泛应用,为点评各业务线提供系 统的性能指标、健康状况、基础告警等。 CAT现状   集成中间件产品(RPC、SQL、Cache等)   5台CAT物理监控集群   200+ 业务应用(包括部分.net以及Job)   900+ 应用服务器   ~6TB 消息⼤小,~50亿消息(每天)   ~800GB 存储(每天,压缩后)

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档