- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
面向业务的智能运维系统探索与实践
一、BAIOPS-业务智能运维
智能运维(AIOps-AlgorithmicITOperations基于算法
的IT运维)是人工智能技术在IT运维领域的运用,引用
Gartner的报告的一段话“到2020年,将近50%的企业将会
在他们的业务和IT运维方面采用AIOps,远远高于今天的
10%”,最近2-3年智能运维的概念随处可见,各大互联网
公司、传统IT公司、金融业等都在谈他们的智能运维设想,
同时也有人谈AI色变,觉得人工智能只是一个愿景,要落
地很难。其实AI已经不是一个新的概念了,百度、微软、
谷歌等公司早就在10几年前开始自己的人工智能布局了,
到现在均已成为人工智能行业的领跑者了。
话不多说,人工智能那么强大,应用场景十分的广泛,当
然也包括运维领域,而且面向业务的运维更是运维发展的热
点趋势,下面我就和大家就“面向业务的智能运维体系建设
的探索与实践”这个话题发表下我的个人见解。
二、传统运维-痛之又痛
传统的运维中,存在着诸多痛点:
(1)被动低效的运维难以保证业务连续性
运维人员往往扮演着事后“救火”的角色,待事故发生后
才去处理;
数据分散在多处,出了故障无法快速修复,业务连续性难
以有效保障;
随着业务复杂性不断提高,人工运维的成本呈指数级增长。
(2)缺乏统一的运维监控体系和技术工具
针对不同运维实体的烟囱式的运维工具,功能重叠、难以
整合;
运维的自动化程度偏低,运维脚本泛滥,层次化、模块化
程度不足;
监控、运维、告警平台林立,各成体系,缺乏统一化体系。
(3)海量的运维数据的价值无法充分挖掘
传统运维系统收集了大量的运维数据,但是却缺乏有效的
手段加以分析和利用;
运维数据的利用仅限于简单的可视化和浅度的分析上,缺
乏纵向数据的关联挖掘,无法快速定位故障根因;
固定式的阈值告警造成了大量的误判和漏判,而且人工调
整阈值的方式也比较费时费力。
(4)缺乏全方位端到端的运维监控手段
大部分的运维监控仅停留在针对主机、网络的层面,忽略
了业务层面的识别手段,故障的发生无法从最直接的业务层
面得以发现,产生预警;
性能管理大多停留在服务单应用性能的管理和分析上,无
法提供端到端的掌控。
三、业务智能运维的切入点
针对上述这些传统运维中存在的痛点,智能化的运维出现
必定具有划时代的意义,智能运维系统的设计可以从如下几
方面进行展开思考:
(1)面向业务维度实现异常检测
业务运维是运维的大趋势,需从最复杂的业务维度入手,
根据业务维度的指标(如PV、响应时间、错误率、GC等)
上的异动进行异常检测,提前预警;
(2)提供业务全局关系视图
业务应用维度的复杂性是运维过程中最高的,往往是二线
和三线运维之间界限最模糊的区域,所以智能运维可以先解
决的就是向用户提供全面、清晰的业务关系视图,让运维人
员对业务应用的掌控得心应手;
(3)KPI可视化与下钻定位
KPI指标可以通过丰富的可视化手段展示给运维人员,业
务系统的故障可以清晰的体现在可视化终端,同时支持详细
的下钻手段,直至定位到发生故障的环节,甚至代码段;
(4)采用动态阈值思想的异常检测
避免传统固定阈值告警的弊端,引入机器学习算法来进行
阈值动态化的异常检测效果;
(5)重视故障的全流程管理
故障发生时,可以提供一定的手段将业务层面的KPI异常
与引起故障的原因联系起来,支持手动下钻之余还可以自动
定位和关联;
(6)立体化监控体系的建设
覆盖从资源、平台层、应用监控和微服务调用链的立体化
的运维分析能力。
四、业务智能运维体系架构
4.1智能运维核心要素
智能运维体系架构的建设应该考虑如下因素:
数据
我们要搭建智能运维平台,首先要数据驱动,数据驱动下
要做好以下几件事:
海量数据存储:运维数据的量级是亿级、TB甚至PB级别
的,所以存储系统一定要具备高容量和扩展性;
数据多样化:运维过程产生的数据多种多样,如应用产生
的性能数据,服务器基础监控产生的CPU/IO/Net数据,服
务间调用链数据、日志数据等,那么需要针对不同类型数
您可能关注的文档
- 首届电力行业培训数字化微课竞赛微课教学脚本设计技术说明 .pdf
- 饲料企业销售管理制度范本 .pdf
- 食品安全观ppt _原创精品文档.pdf
- 飞机火灾事故案例分析题及答案 .pdf
- 风险分级管控和隐患排查治理双重预防机制考试试题及答案 .pdf
- 风冷模块施工方案.pdf
- 题型一单项选择.pdf
- 领导问你对未来职业的规划该怎么回答(精选10篇) .pdf
- 颅内动脉瘤的介入治疗围手术期护理-2019年精选文档 .pdf
- 预包装食品标签通则gb7718 .pdf
- 初中生物基础知识巧记口诀.docx
- 泵轴封装置基础知识.docx
- 2014高考最直击人心的化学宝典:化工流程题.doc
- 2014-2015高一上学期物理(必修1)第4章综合检测A卷(含解析).DOC
- 2013年四川省雅安市初中毕业暨高中阶段教育学校招生考试化学试卷.doc
- 2014高考最直击人心的化学宝典:电解质溶液.doc
- 2013年山东省聊城市初中毕业生学业考试理综试卷化学部分.doc
- 2014-2015高一上学期物理(必修1)第1章综合检测A卷(含解析).DOC
- 2014-2015高一上学期物理(必修1)第2章综合检测B卷(含解析).DOC
- 2014-2015高一上学期物理(必修1)第2章综合检测A卷(含解析).DOC
文档评论(0)