清华大学长聘副教授
软件学院机器学习研究组负责人
国家优秀青年科学基金获得者,入选北京市科技新星和清华大学良师益友。主要研究领域为机器学习理论、算法与模型,专注于迁移学习、深度学习、科学学习及其在自然科学和软件工程中的应用。以第一或通讯作者发表Nature正刊/子刊和JMLR、TPAMI、ICML、NIPS、ICLR论文40余篇,谷歌引用2.6万次,三篇论文入选ICML和NIPS最具影响力论文。担任ICML、NIPS、ICLR、ICCV和CVPR(资深)领域主席,TPAMI和AIJ编委。获教育部技术发明一等奖、北京市科技进步一等奖、IJCAI-FTL时间检验奖,入选机器学习全球高影响力学者、爱思唯尔中国高被引学者、全球前2%科学家。
内容简介:
人工智能正在离散制造业、流程工业、医疗健康、气象环保等多个领域被广泛应用。目前,人工智能正从模型创新为主旋律的1.0时代向模型落地为主旋律的2.0时代变迁,需要融合业务领域、数据科学、软件工程等多学科的专业知识,同时需要多角色分工协作,导致人工智能应用开发成本高、效率低、质量缺少保障。人工智能工程化通过软件工程和系统工程的基本方法论,规范应用开发过程解决上述问题。本报告通过若干典型人工智能应用开发案例,总结人工智能落地的痛点挑战及应对策略。最后介绍“清华数为”Anylearn大数据机器学习研发管理系统,支持数据集、算法族、模型库等资产管理,支持机器学习研发过程管理、知识沉淀、模型迁移,满足资源统筹利用、团队高效协作等人工智能工程化实施的需求。
演讲提纲:
1. 引言:人工智能工程化方法论
2. 人工智能大模型研发案例
3. 人工智能大模型研发挑战
4. 清华数为Anylearn系统
5. 清华数为Anylearn对人工智能大模型研发的支撑
6. 总结与展望:人工智能软件研发支撑平台——工业大模型底座
听众受益:
通过若干案例分析,听众将具体了解人工智能模型研发的基本过程和关键挑战,尤其是AI大模型场景下研发过程管理的重要性。