- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据驱动的
系统稳定性保障体系研究与实践
姓名:胡霞
国泰君安证券股份有限公司
个人简介
胡霞
资深运维工程师
负责君巡智检平台建设,拥有丰富IT运维开发经验,
专注运维自动化、系统监控、故障诊断与应急响应
等技术领域,致力于通过技术创新提升系统稳定性
和运维效率,全面推进系统稳定性保障体系规划建
设和落地。
GOPS全球运维大会暨研运数智化技术峰会2024·上海站
数字化基建背景下的运维左移
数据驱动的系统稳定性保障体系
目录稳保落地实践——君巡智检平台建设
总结与展望
数字化基建背景下的
01运维左移
数字化基建背景下的运维左移
项目立项需求评审概要设计应用架构评审项目开发SITUAT测试上线发布版本持续迭代
图1:信息系统故障根因占比统计
系应业应应交
统用务用急维
架设运部处材
构计行署置料
韧性可靠性可观测性持续稳定性成熟性适应性
信息系统稳定性能力
来源:中国信息通信研究院,2022年
GOPS全球运维大会暨研运数智化技术峰会2024·上海站
数据驱动的
02系统稳定性保障体系
如何提高系统的稳定性?
GoogleSRE中(SRE三部曲[1])有一个层级模型来描述系统可靠性基础和高层次需求(DickersonsHierarchyofServiceReliability),如下
图:
图2:稳定性标准金字塔模型
product
Development
CapacotyPlanning
Testing+Releaseprocedures
Postmortem/RootCaueAnalysis
IncidentResponse
Monitoring
GOPS全球运维大会暨研运数智化技术峰会2024·上
您可能关注的文档
- 邓嵬-脱敏GOPS2024上海站-中航信云平台运维实践(脱敏版).pdf
- 贺安辉脱敏版GOPS2024上海站-博睿数据.pdf
- 宏时-脱敏GOPS2024上海站-Zabbix 7.0 环境高标准建设和运维-宏时1009.pdf
- 赵舜东-脱敏-基于开源工具的可观测性平台二次开发实践-赵班长.pdf
- 陈登辉-脱敏GOPS2024上海站PPT陈登辉V4.pdf
- 管俊-平台工程的“破局之道” .pdf
- 韩洪雷 GOPS2024上海站.pdf
- 白璐-脱敏-运维新纪元:智能运维与大模型的融合革新.pdf
- 傅建新-大模型在运维低容错场景下的应用实践探索-终稿 -脱敏版.pdf
- 梁克会-(脱敏稿)2024GOPS上海站-大模型在超大规模数据库运维中的研究与应用.pdf
文档评论(0)