出品人:汪  源
博士/网易副总裁
杭州研究院执行院长,网易数帆总经理

全面负责网易集团基础软件技术研究、公共技术平台建设和网易数帆业务。担任CCF CTO Club创始成员、中国软件行业协会智能应用服务分会副主任、浙江软件行业协会副理事长。曾获浙江省有突出贡献青年科技人才、万人计划青年拔尖人才、151人才工程第一层次培养人员和杭州市杰出青年人才等荣誉。曾承担省部级以上科技项目5项,获省部级以上科技进步奖特等奖和一等奖各1项,发表高水平论文6篇,授权发明专利11项。                                                                                        

领域大模型

利用大规模数据和机器学习技术,构建适用于特定领域的高性能模型。模型通过深入理解领域知识和数据特征,能够提供更准确的预测、改善决策和优化系统性能。基于领域大模型,开发者能够加快应用开发速度,更能显著提升该领域的业务能力。                                                                                
TableGPT:刚性大模型的漫长落地之路
内容简介:
预训练大预言模型(LLM)的高速发展革新了人机交互、信息获取的方式,但是 LLM 在面对精准定量问题中展现出来的“刚性”和准确性仍然差强人意。另外,日常中较为典型的定量问题场景往往涉及结构化数据(来自数据库、Excel、中台等),由于上下文长度的限制,大模型无法处理表格或者数据库中的结构化信息。在本次报告中,我们介绍TableGPT,一个融合自然语言交互、对结构化数据的向量化理解和链式指令集的完备系统,在落地场合中通过与用户进行自然语言交互实现对表格文件或者数据库表的增删改查和其他复杂操作,兼容自动化大小模型交互,并支持可视化图表生成和简单的报告撰写。具体地,我们设计了一套特异的领域限定语言体系(DSL),TableGPT 在经过指令精调后将用户的自然语言输入映射到该DSL中,经过工程化的校验后,分发到各个功能性计算模块,以此保证系统本身的“刚性”和可控性。                                                                                              
演讲提纲:
1、大模型是一个文科生吗?
2、如何将一个文科生大模型培养成理科生,或者文理兼修的全才?
3、TableGPT在几个领域中的成功落地案例。    

听众受益:
对大模型落地需要什么有一定认知。   
                                                                   
赵俊博
浙江大学百人计划研究员
浙江大学计算机科学与技术学院百人计划研究员、博士生导师、图灵班项目主任,于2019年9月获纽约大学计算机专业博士学位,师从图灵奖得主、美国两院院士Yann LeCun。获福布斯30Under30科技赛道封面人物,阿里云MVP,百度青年 AI 学者,首届 WAIC 青年科学家等多项荣誉。主要研究方向包括深度学习,预训练大模型,AIGC,Data-centric AI,AI+X等。 曾任职于Meta(前Facebook),NVIDIA,并有过连续创业经验。截止2022年7月,论文总引用量已达15000余次。                        
ChatBI——NL2SQL领域大模型的研发及在数据分析产品中的落地
李家诚
网易数帆资深算法工程师
硕士毕业于中国科学技术大学,2017年加入网易,目前负责领域大模型研发及在网易的落地应用。曾参与研发智能客服、新闻文本纠错、评论内容分析、商品页搜索排序、多模态视频理解等项目。申请AI相关专利10余项,曾带领团队获ACL-SemEval、CVPR-PBVS等评测冠军。                                                                                
内容简介:
在当今数字化快速发展的时代,数据已经成为业务经营与管理决策的核心要素。无论是跨国大企业还是新兴创业公司,正确、迅速地洞察数据已经变得至关重要。然而,传统的BI工具往往对用户有一定的技术门槛,需要熟练的操作技能和复杂的查询语句,这使得大部分的企业员工难以深入挖掘数据的价值。 2023年,大模型和AIGC迅速进入人们视野,为我们打开了一个全新的人机交互思路。用户可以直接用自然语言与机器对话,就像与另一个人交谈一样。这意味着,无论用户是否具有专业技能或背景知识,都可以轻松、直接地与计算机互动,进行数据查询和分析。 网易杭州研究院研发NL2SQL领域大模型,结合工程设计进行人机交互,打造对话式BI产品——有数ChatBI。通过自然语言与BI平台进行交互,实现数据查询和分析,开启了数据分析新范式。                                                                                       

演讲提纲:
1、大语言模型技术的发展现状
2、NL2SQL领域大模型在BI的应用、挑战以及解决思路
3、算法评测效果与业务落地效果
4、未来持续演进                                                                            
                                                                      
听众受益:
1、对研究者来说,了解NL2SQL领域大模型相关技术及目前能力
2、对业务应用来说,对话式数据分析可实现人人都是数据分析师的愿景,将更好地帮助业务成长,实现数智化转型    
                                                                                                                                                                             
大模型在ToB企服领域的技术和应用实践
内容简介:
ChatGPT推动AI浪潮,百模大战一触即发,对于TOB企业服务公司来说应该如何拥抱大模型? 是“用”还是“训”?是以场景和价值驱动,还是以模型本身为驱动?开源和闭源,之后如何发展,企业如何选择?一般企业玩儿的起私有化大模型吗?领域大模型如何预训练? WakeData针对这一系列技术和应用问题进行了探索和实践,期待与您分享。
                                                                                                                                                       
演讲提纲:
1、 大模型发展脉络以及技术趋势的预判
2、 开源VS闭源的一些思考
3、 为什么要有领域大模型?为什么要做私有化大模型?
4、 私有化大模型的技术细节:如何挑选模型以及模型规模,如何低成本部署?
5、 Wake Mind:探索ToB领域大模型产品的商业化路径
6、 落地:垂直领域大模型的微调细节以及其它企业应用
                                                                                                                                            
听众受益:
1、了解大模型在ToB领域的技术和应用实践;
2、探讨大模型的行业化、私有化、商业化的技术方法和业务路径
3、探索大模型趋势和企业自身优势之间的机会点。
                                                               
李    翔
WakeData AI算法科学家
中山大学人工智能方向博士&博士后,珠海市产业青年优秀人才,师从中山大学印鉴教授,在人工智能领域有 11 年的研究与落地经验;熟悉资讯流推荐、画像预测标签、NLP、CV、语音识别等多个 AI 方向,并将对应落地成果发表在国际一流期刊以及申请多项发明技术专利。
                                                                               
CodeGPT-辅助商业银行研发全流程
傅宣铭
招商银行算法专家
曾就职于澳洲Bain Digital担任数据科学家,后就职于招银理财、微众银行担任量化投研投资岗位,现于招行做算法研发。                              
内容简介:  
私有部署GPT辅助商业银行研发提效                                                              

演讲提纲:
1、GPT技术简介
2、大模型的局限性及适用场景
3、 CodeGPT功能
4、CodeGPT应用
5、CodeGPT技术栈
6、CodeGPT案例
7、 应用展望                                                         
                                                                      
听众受益:
商业银行如何通过大模型技术辅助研发全流程        
京ICP备2020039808号-4