毕业于清华大学,通义实验室对话智能负责人,研究方向为代码大模型、对话大模型及AI Agents等,打造了通义灵码、通义晓蜜、通义听悟、阿里云百炼、钉钉魔法棒等大模型应用。2020年以来,围绕预训练、对话、代码、大模型等方向发表60+篇国际顶会论文(ACL/EMNLP/AAAI/NeurIPS等)。
内容简介:
正如ImageNet推动了深度学习的发展一样,优秀的数据集是学术研究和技术创新的重要推动力,在大模型时代也是如此。大模型是基于通用数据和知识训练而成,在实际应用中,大模型还需要和具体的任务、工具、非结构数据以及结构化数据结合,针对这四类典型场景,阿里巴巴通义实验室对话智能团队打造了(1)大模型+Tasks:SpokenWOZ、(2)大模型+Tools:API-Bank、(3)大模型+Doc:Doc2Bot、(4)大模型+SQL:BIRD-SQL 四大数据集,并先后发表在EMNLP、NeurIPS等国际顶级会议,取得了广泛的关注和较好的影响力。本次报告将详细地介绍这四个数据集建设的目的、挑战和成果。
演讲提纲:
1、大模型+Tasks:SpokenWOZ
2、大模型+Tools:API-Bank
3、大模型+Doc:Doc2Bot
4、大模型+SQL:BIRD-SQL