内容简介:
人工智能的快速发展与广泛应用已成为经济社会发展的强大引擎。在中心化云机器学习的基础之上,发挥端侧情境机器学习隐私保护、实时响应、动态适应的优势进行互补,形成“端云协同”机器学习的计算框架,已成为产学研的焦点。本报告将分享团队在大小模型协同技术方面的观点和研究进展,以及在资源受限、分布偏移下的端云协同学习和推理方法。
演讲提纲:
1、大小模型端云协同智能的背景
1)WHY(云侧中心化机器学习的桎梏;实证分析;国家政策、行业趋势、图灵奖学者观点)
2)WHAT(组成部分、特点、优势;taxonomy)
2、大小模型协同基础算法(How:Basics)
1)基于调度的协同
2)基于反馈的协同
3)基于生成的协同
3、大小模型端云协同智能(How:Application)
1)云到端压缩迁移Cloud to Device (C2D)
2)云助端自主适应Cloud for Device (C4D)
3)端到云去偏汇聚Device to Cloud (D2C)
4)端和云协同推理Cloud and Device (C&D)
4、案例分析
5、总结
听众受益:
1、了解引进大模型和业务原有小模型如何进行合作
联合应用平台既有的特定业务小模型与云侧大模型进行相互调度、反馈,形成循环增强的模型组合智能体系
2、了解模型压缩 + 目标场景适应如何联合优化:模型小型化、轻量化的同时需考虑部署场景的特异性,目标场景可能和原始模型训练数据存在分布迁移
3、了解端智能模型、云模型在差异化模型架构、数据分布、需求任务下的高效协同训练和推理(低通信开销、高响应速度、低算力资源等需求)
浙江大学平台“百人计划”研究员,博士生导师。浙江大学启真优秀青年学者,研究方向包括大小模型端云协同计算,多媒体分析与推荐系统。近年来,在TPAMI、TKDE、KDD、CVPR等CCF A类期刊和会议上发表论文三十余篇。任NeurIPS、KDD、TKDE、TOIS等期刊会议的程序委员会委员或特邀审稿人。曾获2023年度计算机学会科技进步一等奖,中国人工智能学会CICAI最佳论文奖、2021年WAIC云帆奖-明日之星(全球15人)等奖励与荣誉。