香港中文大学(深圳)助理教授,校长青年学者,国家海外高层次人才。博士毕业于香港中文大学,在苏黎世联邦理工学院任职博士后三年。研究方向为软件可靠性、软件测试、MLOps、智能运维等。近年来在ICSE, FSE, ASE, ISSTA, OSDI, CSUR, TDSC等顶级会议期刊发表学术论文30余篇。获得ISSRE最有影响力论文奖,IEEE开源软件服务奖。谷歌学术引用超3600次。主导的自动化日志分析开源项目LogPAI在GitHub上被star 4000余次,并被450多个学界业界组织下载10万余次。
内容简介:
日志是运维领域中十分重要且广泛存在的一种数据模态。日志消息通常由包含高密度语义信息的自然语言组成。因此在大模型时代以前,研究人员无法对日志进行精细化地处理和分析,导致日志常常没有被高效利用。具体而言,日志仅仅是被抽象成日志模版的序列来使用,而这个过程会损失掉大量的语义信息,导致日志数据对自动化运维算法的帮助十分有限。基于这个原因,人们也普遍更青睐于高可用的、结构化的调用链和指标数据进行自动化运维。 该情况在大模型出现以后发生了改变:作为运维领域中唯一一个纯文本模态的数据,日志能直接受益于大语言模型强悍的语义理解能力,使得许多过去富有挑战的任务变得不再难以完成。例如,大语言模型的上下文学习能力使得高精度、自动化、端到端地为业务代码生成日志埋点成为了可能。此外,大模型参数高效微调技术也使得日志解析问题基本被攻克。其他基于大语言模型的日志下游任务解决方案也如雨后春笋般逐渐涌现出来。本次演讲将着力于讨论传统日志分析所面临的局限、当前大模型技术对日志分析领域的可能的赋能方式、以及大模型技术影响下日志分析领域的未来。
演讲提纲:
1、传统自动化日志分析的研究现状与面临的挑战
2、解决当前挑战的思路与方案:基于LLM的自动化日志分析,将各个日志分析的子任务构建成Text2Text的生成任务
3、实践效果与效果评估
4、总结与展望
听众受益:
系统化地了解大语言模型对自动日志分析和智能运维领域的影响和贡献,以及在大语言模型影响下日志分析的可能的未来走向。