出品人:孙  亮(博士)
阿里巴巴达摩院资深算法专家
主要研究领域包括时间序列异常检测、预测、可解释机器学习以及各种应用,如智能运维等。在在IEEE T-PAMI、NeurIPS、ICML、SIGKDD等机器学习领域的知名期刊和会议上发表论文40余篇,中美专利6项,著有机器学习英文专著1部,中文专著1部。近年来带队获得2021年国际AIOps挑战赛亚军,2022 ICASSP Grand Challeng根因诊断冠军等。

智能运维(AIOps)

智能运维 (Artificial Intelligence for IT Operations,AIOps),是将人工智能的能力与运维相结合,即基于已有的运维数据(日志、监控数据、应用数据等)进行机器学习,不断地提炼并总结规则,解决自动化运维的问题,如自动完成数据收集、响应事件、及时告警和深度数据分析,让AI帮助我们、代替我们做出决策,通过AI来提升运维效率,使得发布软件更加地快捷和可靠,并让运维完全自动化成为可能。
InsightPilot: Towards LLM-Empowered Automated
 Data Exploration
丁  锐
微软首席研究员
微软亚洲研究院的数据、知识和智能(DKI)团队的首席研究员。一直致力于数据分析当中的洞见(insights)研究,这对于在商业和日常生活中理解数据及有效决策至关重要。丁锐的研究主要集中在两个主题上。第一个主题是如何将洞见概念转化为可计算的数据实体,这是洞见发现(即检测和挖掘)的基础问题。另一个主题是数据分析的可解释性以及因果性在其中的重要角色,这也是使洞见具有解释性,可靠性及泛化性的关键。他的研究成果主要发表在SIGMOD和SIGKDD等会议上。此外,与洞见相关的研究在微软也有一系列产品转化,作为微软产品中用于数据分析的功能,包括Power BI的QuickInsights、Excel的Analyze Data和Forms Insights。                                                                        
内容简介:
该报告介绍两部分内容,第一部分是基于洞见(insight)的探索式数据分析,着重讨论洞见的概念和基本形式,以及基于洞见的操作和计算,总结洞见可以服务于哪些新的形式的数据分析。第二部分介绍InsightPilot,一个在大模型的助力下,如何将探索式数据分析变得自动化的新的数据分析范式。为了实现更为自动化的数据探索,InsightPilot 将数据探索的过程抽象为由 context-intent-analysis 组成的序列,即利用大语言模型(LLM)理解已有的数据洞察(context)、提出一个合理的数据分析意图(intent),并由 Insight Engine 将意图转化为具体的数据分析(analysis)。通过利用数据分析的结果对数据洞察进行更新,让大模型推荐新的数据分析意图,从而迭代形成若干个由 context-intent-analysis 三元组完成的序列,从而使 InsightPilot 完成整个数据探索的过程。   

演讲提纲:
1. 基于洞见的探索式数据分析
2. InsightPilot的自动化数据分析范式
3. 数据探索过程的迭代和更新

听众受益:
1. 了解洞见(Insight)的概念和形式。
2. 了解如何以洞见为切入点来拓展数据分析的问题空间。
3. 认识到大模型在通往自动数据分析的过程中的潜力以及需要注意的事项         
                                                                                                                           
阿里云服务器智能异常调度系统构建与实践
内容简介:
阿里云弹性计算ECS当前服务百万级的客户,保障基础设施的稳定性极为重要。近年来,阿里云弹性计算团队构建了一套相对完善的智能异常调度系统,实现服务器异常的自动识别、智能规避以及服务的快速恢复。本次分享重点围绕服务器异常的智能诊断、服务治理两个领域中重点突破的技术点,展开深入探讨。                                                                        
演讲提纲:
1. 系统背景:为什么要建设智能异常调度系统?
2. 系统架构:异常调度系统概览(重点阐述智能诊断与服务治理)
1). 核心组件简介:包含数据采集、智能诊断、智能运维、服务治理、故障恢复、客户侧事件、客户自诊断能力等。
2). 智能诊断介绍:建立一套智能化体系,做到线上特定异常特征抽取、日志模式智能解析、运维规则自动化修正以及对应的A/B test机制建立。
3). 服务治理介绍:如何建立一套评价机制来评价机器的服务质量,并以此为线上治理稳定性的准则。
3. 系统实践:基于数据采集-异常发现->自动化运维->事件推送->自诊断体系全流程运维能力,保障云上业务的稳定性。

听众受益:
1. 为什么说AIOPS是大规模运维的必然选择
2. 阿里云弹性计算是如何通过AIOPS的方式,运维百万级别的客户及实例,保障用户实例的高可用。            
朱兆良
阿里云计算有限公司高级技术专家
阿里云弹性计算平台异常调度AIOPS方向负责人。经历淘宝、阿里妈妈、对象存储、弹性计算平台多个子公司及部门,近8年的运维管控系统建设经验,主导建设存储运维管控系统赤骥,近年来专注弹性计算平台异常调度平台AIOPS方向,致力于通过AI的方式赋能提升弹性计算稳定性,提升运维效率及智能运维能力。                                                   
借助AIOps算法提升业务可观测性在京东科技的实践之路
内容简介:
1. 以京东科技智能运维整体能力建设历程与智能运维建设价值
2. 京东科技海量运维日志与集中监控指标智能化检测分析实践之路,提升业务可观测性
3. 京东科技AIOps算法赋能传统根因定位到运维专家知识融合生成式故障定位编排的演进路线与实践,保障系统稳定性
4. AI算法+GPT构建京东运维大模型,让运维更智能、更有温度

演讲提纲:
1. 京东科技智能运维整体能力建设历程及智能运维建设的价值
2. 京东科技海量运维日志结合监控指标等多模态数据,智能化检测预警的实践之路,提升业务可观测性
3. 京东科技AIOps算法赋能传统根因定位到运维专家知识融合生成式故障定位编排的演进路线与实践,保障系统稳定性
4. AI算法+GPT构建京东运维大模型建设及落地路线

听众受益:
1. 如何从0-1搭建运维算法学件,找到合适的场景落地,AI算法让运维更智能;
2. AIOps算法赋能业务可观测性实战经验;
3. IEEE智能运维方向论文收录经验,知识产权创新点挖掘方法;
4. 运维大模型构建思路与大模型落地运维场景挖掘
张  静 
京东科技智能运维算法高级经理
硕士毕业于东北大学,持续深耕智能运维领域多年,带领团队致力于京东智能运维算法研发,应用于京东线上横向业务场景,纵向监控、数据库、网络、资源调度等多个场景取得突破。申请智能运维发明专利50余项,IEEE国际会议论文收录10篇。具有将技术在业界推广的经验,提升京东智能运维行业影响力的经验:做客2023DAMS中国数据智能管理峰会-信创运维专题演讲,2023Gdevops峰会北京站-智能运维专题演讲,ArchSummit2022全球架构师峰会智能运维专题演讲,2022双态IT研讨会-智能运维场景深化应用(北京站)演讲:《京东科技智能运维实践分享》,2021数据技术嘉年华.ON LINE(第二期)《解密StarDB国产数据库智能运维的核心算法》技术分享;参与中国信通院《云计算智能化运维(AIOps)能力成熟度模型 第1部分通用能力要求》与《云计算智能化运维(AIOps)能力成熟度模型 第2部分系统与工具技术要求》白皮书撰写。
B站AIOps的探索与实践
内容简介:
随着B站SLO体系逐渐完备,对于定位效率也有了更加明确要求,确立了GOC 1-5-10的目标。但面对万级规模的微服务应用,数十种类型的组件与基础设施,错综复杂的调用与依赖,如何更高效的发现问题/定位问题/异常恢复就变得极为重要,AIOps则是其中的必经之路。本次分享将围绕B站AIOps的挑战,设计,应用与实践展开,探讨AIOps工程实践与落地方案。                                                                                                                                  

演讲提纲:
1. B站AIOps架构设计
2. B站可观测数据体系建设
3. B站AIOps算法的选型与设计
4. B站AIOps场景的实践与落地

听众受益:
1. AIOps工业化落地实战经验
2. 微服务架构下黄金指标检测/根因定位实践方案
3. 算法工具赋能可观测的应用案例                                                                                        
王程田
B站AIOps负责人
B站AIOps负责人,毕业于香港科技大学,2020年加入B站先后负责事件平台,链路追踪,告警平台及AIOps方向技术演进&迭代。持续深入探索AIOps技术,并在B站实现多场景的落地。进一步提升了研发和运维效率                        
京ICP备2020039808号-4