内容简介:
代码大模型技术正引领软件开发迈向智能化新时代,为各行各业注入强劲动能。然而,现有技术多聚焦于常规代码片段与通用算法,难以应对日益复杂的软件应用场景。随着大模型技术的持续突破,软件智能化转型对代码生成技术提出了更高要求,尤其是在大规模仓库级程序生成与维护方面,亟待突破性进展。本报告将深入探讨我们在仓库级程序生成与维护领域的探索与实践,包括仓库上下文理解、仓库级代码翻译、仓库级问题修复等。为代码大模型技术在业务场景中的落地应用提供经验和建议。
演讲提纲:
本演讲将分享我们在仓库级程序生成与方面的研究经验。首先,介绍现有的仓库级程序生成和修复技术发展现状。接着,介绍我们针对仓库级代码生成和维护方面的几点研究经验:1.仓库上下文压缩:设计自适应上下文剪枝技术,动态选择合适的跨文件代码;2.仓库级代码翻译:将项目拓扑进行拆解, , 提高项目级翻译的准确率;3. 仓库级问题修复: 采用经验池管理问题修复Agent思考轨迹,提高问题修复技术的准确度。最后,分析仓库级程序自动开发与维护面临的挑战并对未来工作作出展望。
听众收益:
1. 获得仓库级程序生成与维护的最新研究进展
2. 代码仓库理解方面的研究经验
上海交通大学软件学院副教授,博士生导师。长期从事智能软件工程领域的研究工作,包括代码大模型、程序自动生成、代码翻译、代码搜索等。在ICSE、FSE、ASE、TOSEM等顶级学术会议和期刊上发表学术论文30余篇,主持和参与国家自然科学基金、国家重点研发计划等项目。并与华为、宁德时代、腾讯等企业开展广泛的产学研合作。