出品人:鄢  晶
众安保险中台首席架构师
众安保险资深技术专家,负责众安保险中台架构。在微服务、Devops、云原生领域有丰富的实践经验。曾主导众安保险智能运维平台、云原生应用架构、AIGC中台等基础能力的建设。                                                                                                            

AI工具链与工程平台

聚焦于最前沿的AI技术,包括机器学习框架、模型部署工具、自动化工程平台等关键技术,深入探讨如何构建高效的、覆盖研发生命周期的AI工具链,以加速开发周期和提高模型性能,同时探讨工程平台在大规模部署和管理AI应用中的挑战和解决方案,并关注在AI工程领域中的最佳实践和案例分享,探讨如何构建可靠、可扩展的AI工程平台,以支持企业的数字化转型和创新发展。
MFTcoder:大模型多任务微调框架
内容简介:
代码大模型(Code LLMs)已经成为一个专门的研究领域,通过使用代码相关数据对预训练模型进行微调来提升模型的编码能力。以往的微调方法通常针对特定的下游任务或场景进行定制,意味着每个任务需要单独进行微调,需要大量的训练资源,并且由于多个模型并存而难于维护和部署。此外,这些方法未能利用不同代码任务之间的内在联系。为了克服这些限制,我们提出了一种多任务微调框架——MFTCoder,它可以实现在多个任务上同时并行地进行微调。通过结合多种损失函数,我们有效地解决了多任务学习中常见的任务间数据量不平衡、难易不一和收敛速度不一致等挑战。                                                                                                                                                                                                                                    
演讲提纲:
1、CodeFuse介绍
2、为什么要做MFT
3、 CodeFuse-MFTcoder
3.1 整体MFTcoder的框架
3.2 如何构造多任务数据
3.3 针对多任务优化的Tokenization
3.4 多任务的高效微调
3.5 多任务损失
4、实验结果&打榜结果
5、总结
                                                                                     
                                                               
听众受益:
1、了解CodeFuse的功能
2、了解多任务微调框架MFTcoder
3、框架及对应的模型已经开源,欢迎使用                                                                                                                                            
余  航
蚂蚁集团高级算法专家
新加坡南洋理工大学博士,于2022年年底加入蚂蚁集团。利用时序、图、NLP算法助力技术风险领域智能化。去年开始从事代码大模型CodeFuse相关工作,负责底座模型建设。共发表顶会论文34篇,顶刊论文10篇,书本章节1篇。其中包括Science,TPAMI,JMLR,ICLR,NIPS,ACL,SIGMOD,ICASSP,ASE等。
众安DevPilot AI代码助手助力研发体系升级
徐  敏
众安保险高级架构专家
众安保险高级架构专家,负责众安AI基础平台建设,专注于企业技术架构规划演进、微服务架构及云原生技术的研究与落地工作。带领团队完成微服务框架、API 网关、微服务治理等多个项目在众安集团内部落地。                    
内容简介:
在AIGC大潮中,本次演讲将探讨如何利用AI技术革新编程工具,以提升开发效率并优化整体研发流程。演讲将揭示在AI时代研发体系升级的必要性,深入剖析AI代码工具如何全面渗透到各类研发场景,实现智能辅助。重点介绍DevPilot的设计与实现,这是一个旨在通过AI赋能,助力开发者高效编写和管理代码的创新工具。最后,将展示DevPilot如何实现成果的量化,以及它在提升研发效率和流畅度上的显著效果。  
                                                                                                                                                                            
演讲提纲:
1、AI时代研发体系升级背景
2、AI代码工具如何覆盖研发场景
3、DevPilot设计实现
4、DevPilot如何实现成果量化
                                                                                                                      
                                                                 
听众受益:
1、了解如何运用AI代码工具提升工作效率,贯穿整个研发流程。
2、了解DevPilot的设计理念与实施方法,并掌握其量化提升开发效率的具体策略。
                 
手把手教会你大模型研发提效端到端应用
丁  辉
中兴通讯首席架构师、大模型专家
在互联网、嵌入式系统、电信领域有着多年的从业经验,是一名拥有超过10年软件开发的软件架构专家和具备管理经验的资深技术专家。
在敏捷研发技术圈长期耕耘和实践,长期负责中兴通讯无线研究院教练的运作。同时作为CAC中国敏捷教练联盟核心发起人之一,参与CAC认知体系建设和试点,带领中兴通讯无线院通过首批CAC认证并成为联盟首批认证会员。
作为软件架构专家,对高并发分布式大型系统设计、解耦设计、重构有独特理解和丰富的实践经验,特别是在DDD、形式化建模(TLA+)方面开发多门战训营课程并指导过千人团队进行实践落地,在erlang并发编程、Rust安全编码等方面也有较多坚实沉淀。
作为AI专家,在大模型原理、prompt编程、langchain应用、预料整理、大模型精调/预训练、大模型推理加速等方面经验丰富,参与了中兴星云大模型的设计、建设和应用落地推广,内外部都取得良好效果。                                                          
内容简介:
大模型兴起以来,在各个行业都带来了深入影响,特别是软件开发的各个环节都进行了重塑,但是由于大模型涉及的范围过广,各家也都在摸索,都希望能看到一个完整的又取得实效的全流程案例;另外,各个环节具体怎么深入开展也都缺乏一些指导。包括,对大模型的预训练、精调、评估、知识库建设、RAG建设、Agent应用,语料开发等全流程做一个详细阐述。听众可以根据自己实际情况做一定筛选,并进行自己团队的大模型提效建设和应用。
我们希望把摸索的全流程提效的全景图给大家做一个分享,希望对大家的大模型建设给出一些借鉴思路。

演讲提纲:
1、对大模型在软件开发方面的提效全流程(需求、设计、编码、测试)进行全景设计,展示大模型提效的业务架构、应用架构、技术架构和工具全景图。
2、对提效大模型的赋能(增量预训练方案、预训练语料的清洗、预训练语料的增强;精调语料标注、评测语料开发、验收)
3、对知识库和agent应用的落地
4、对RAG检索的嵌入
5、对上述过程完整串接                                                                                                                 
                                                                 
听众受益:
1、可以了解大模型应用全景图
2、可以对大模型的业务场景、应用架构、技术架构做一个全面了解
3、对预训练、精调、知识库、RAG、Agent应用打开做一个铺垫                                     
                                                                                     
解密一位活跃在Github上的非人类程序员
内容简介:
Git 在代码管理和协作方面发挥着重要作用。它帮助开发者追踪代码问题与变更,管理不同版本,并与团队成员协作开发。另一方面,大语言模型在代码生成方面的能力已经被广泛用于提升研发效能。此次分享旨在探讨如何将大语言模型与Git结合,在研发的各个环节提升团队工作效能,解决以下痛点问题:
 1)代码审查效率低下: 手动审查代码不仅耗时费力,而且容易遗漏问题。
 2)Issue解决困难: 开发者可能难以快速定位问题根源,并找到有效的解决方案。
 3)代码理解成本高: 新开发者需要花费大量时间理解代码逻辑,降低了开发效率。                                                                      
演讲提纲:
1、背景介绍与痛点分析
2、大语言模型与Git结合的方法
3、 实践案例
4、存在的问题与下一步计划
5、总结和未来展望
                                                                           
                                                                                     
                                                               
听众受益:
1、学习如何利用Git和大模型结合提升研发效能
2、从实际案例中了解将大模型和Git结合的效果和尚存在的问题
3、展望大模型赋能研发的未来发展趋势                                                      
李明宇
中科院计算所高通量计算机研究中心
处理器芯片国家重点实验室高级工程师
中国科学院计算技术研究所高级工程师,前深信服科技集团云计算首席专家。开源项目活跃开发者,20余年编程与软件开发经验,10余年云端系统研发与产业化工作经历。
历任国家重点实验室研究组负责人,上市公司事业群技术总监、首席技术专家。
李老师在理论研究和产业实践均有丰富的经验,为多家知名企业和单位落地云原生和数字化转型项目。荣获中国软件协会“优秀CTO”等多项莱誉,兼任中国新一代IT产业联盟分委会秘书长、全国高校人工智能与大数据创新联盟专家委员、北京开源创新委员会委员。                          
Hydra Lab构建大语言模型赋能的智能测试系统
步绍鹏
微软中国高级研发经理
微软中国高级研发经理,就职于微软移动体验产品部,负责搭建Phone Link 项目工程系统,保证产品质量。具有多年软件质量优化和保障经验;并负责带领团队,推动微软开源云测试平台Hydra Lab的构建和完善;在分布式测试系统、智能测试、对话式质量保证系统方面获得多项专利;所构建的Hydra Lab系统在全球多个研发中心部署,服务于微软内部多个核心产品线;2023年初开始,结合所带领团队的产品场景,推动Azure OpenAI智能能力的产品赋能;对软件测试、质量保障场景下的提示词优化、LLM落地有深入理解和研究。                                                        
内容简介:
微软开源项目Hydra Lab经过一年的迭代,在智能测试领域有了更多的功能特性,本次分享将简介Hydra Lab的演进逻辑、内部落地实战、功能展示。同时将对AI agent理念在Hydra Lab中应用的原理进行讲解,分析解读Hydra Lab的smart test如何处理移动应用黑盒测试,并结合新兴技术Spring AI/LangChain分别在Java、Python环境中构建智能体。

演讲提纲:
1、Test Agent的实践演进
2、 Hydra Lab的智能测试能力现状
3、Hydra Lab智能测试原理简介:LangChain与Spring AI
4、 利用Hydra Lab搭建智能测试系统实战                                                                                                               
                                                                 
听众受益:
1、深入了解 Test Agent 的实践演进:学习微软 Hydra Lab 项目如何通过 Test Agent 实践提升测试系统的能力。
2、 理解智能测试原理:结合 Spring AI 和 LangChain 新兴技术,学习智能测试原理的相关概念,并通过讲解 AI Agent 理念的应用。
3、理解 Hydra Lab,并初步了解实战搭建智能测试系统:理解 Hydra Lab 在移动应用黑盒测试中的策略,学习如何在 Java 和 Python 环境中构建具有智能测试能力的系统。

京ICP备2020039808号-4 京公网安备11011202100922号