必示科技产品部总监,清华大学计算机系博士, 研究领域为智能运维 (AIOps),在 JSAC、TON、KDD、ESEC/FSE 等 CCF A/B 类国际会议或期刊上发表多篇文章,研制的智能运维系统在建设银行、中国移动、百度等40 多家银行、证券、运营商、互联网等企业实施落地。
内容简介:
在线评测基准(AIOps Live Benchmark)是一个创新运维平台,它在真实的IT系统上使用混沌工程工具模拟现实运维场景,通过可观测工具获取实时数据,以在线评估AIOps应用的性能。该基准提供了评估指标和排行榜,旨在构建真实的运维平台,评测异常检测、告警分析、故障定位等AIOps应用的实际效果,并发布权威的数据集和评估基准。该系统将在OpenAIOps社区(open.aiops.cn)公开发布,通过这个平台,运维人员能快速了解常见的运维问题和解决方案,运维专家可以发布难题寻求社区帮助,科研人员和开发人员则能获得宝贵的真实运维数据,用于学术研究和产品测试。
演讲提纲:
1、在线评测基准背景介绍
1.1 强调实际运维环境的复杂性和挑战
1.2 现有AIOps工具众多,到底如何选择,如何评估效果
2、在线评测基准系统介绍
2.1 什么是在线评测基准(AIOps Live Benchmark)
2.2 具体如何使用在线评测基准
2.3 用户使用收益
3、关键系统模块介绍
3.1 IT系统实例:TrainTicket、Online Boutique、DeathStarBench
3.2 混沌工程工具:ChaosMeta、ChaosBlade
3.3 可观测工具:Prometheus、Skywalking、Zabbix
3.4 AIOps应用:异常检测、告警分析、根因定位
4、结论
4.1 强调在线评测基准在提升AIOps应用性能、促进知识共享和社区合作方面的作用
4.2 邀请更多的专业人士参与,共同推动AIOps技术的发展
听众受益:
1、获取资源和数据的渠道:听众将了解到如何访问和利用在线评测基准提供的权威数据集和评测结果,这些资源对于学术研究、产品测试及技术创新都具有极大的价值。
2、认识到在线评测基准的重要性:汇报强调了在线评测基准如何促进运维专家、科研人员和开发人员之间的交流合作,展示了共享资源、经验和解决方案的重要性,进而推动AIOps技术的发展和应用。