出品人:彭靖田
谷歌开发者专家
谷歌出海创业加速器导师

谷歌开发者专家,谷歌出海创业加速器导师。加州大学访问学者,毕业于浙江大学竺可桢学院。
行业布道者:Linux 云原生基金会(CNCF) 程序委员,深度学习和大模型培训学生超10万人。
连续创业者:3家公司成功退出(字节收购,股权退出)。华为公司 2012 实验室深度学习团队成员,从零到一参与了华为深度学习平台和华为深度学习云服务的设计与研发工作。2017 年作为技术合伙人加入才云科技(2020年被字节全资收购,成为字节火山云),负责 AI Cloud产品和解决方案。(2019-2023)品览数据联合创始人兼CTO,带队自主研发 AI 智能工程设计云平台 AlphaDraw「筑绘通」,是国内有报道的以 AI 生成式算法赋能建筑设计并实现 AI 自动制图和 AI 生成模型的领先科技企业,累计融资近2亿元。
开源项目 Kubeflow 维护者,TensorFlow 贡献者。国内第一本深度剖析 Google AI 框架的畅销书《深入理解 TensorFlow》作者。     

具身智能与大模型加速技术

本论坛聚焦于具身智能和大模型加速技术在前沿人工智能领域的突破与实践,涵盖类人机器人智能交互和具身智能的最新研究成果。我们将探讨大模型如何赋能人形机器人在类人垂域中的智能交互与行为决策,同时分享在机器人社交生活中应用具身智能的前景和挑战。此外,论坛还将揭秘大模型推理加速技术的高性能优化路径,探讨如何在计算成本与性能之间取得平衡,为大规模人工智能应用的高效运行提供技术支持。本论坛旨在推动具身智能和大模型技术的深度结合,探索其在未来人工智能社会中的潜力与落地路径。
赋能机器人智能交互:类人大模型的技术架构与实践探索
刘 迅
数字华夏科技有限公司研究院执行院长
内容简介:
共同探讨类人大模型技术如何赋能机器人,实现更加自然的人机交互。通过多层次架构,包括话题理解、情感识别和行为决策,类人大模型有效融合多模态数据,提升机器人在多场景中的认知与互动能力。基于Llama、GLM等大模型技术,系统可适配商业、教育等垂直领域的类人任务需求。通过实际案例,听众将了解如何通过大模型提升机器人智能交互的实践落地,并展望该技术在未来机器人领域中的创新与挑战。        

演讲提纲:
1、背景:机器人智能交互的挑战与机遇
2、类人垂域大模型的技术架构与模块解析
3、类人垂域大模型在不同领域的应用场景
4、类人大模型与多模态数据融合的技术实践
5、总结与展望:智能交互未来的发展趋势

听众受益:
1、听众将能够深入了解类人垂域大模型的技术架构及其在不同模块的具体功能,帮助他们理解如何通过这些技术实现更加人性化的机器人交互;
2、听众将获得关于类人垂域大模型在商业、教育、医疗等垂直领域的实践应用案例与挑战的见解,帮助他们更好地评估和利用这些技术解决行业中的具体问题;
3、听众将熟悉机器人如何通过类人大模型与多模态数据增强机器人行为应用中的认知、决策和进化能力,为未来智能机器人领域的创新提供借鉴。

计算机科学博士。上海市第二工业大学研究生校外导师、iWOAR2023委员会委员。获上海市青年五四奖章、上海市闵行区领军人才、上海市重点产品质量攻关成果项目三等奖、上海市技术发明奖一等奖提名等多项市级荣誉。持有国家发明专利10件,美国发明专利1件,SCI等高水平论文6篇。主要从事机器视觉、人工智能、LLM大模型等高新技术在机器人等前沿应用的研究与落地。
构建机器人的社交生活:具身智能可以往何处去?
叶在乔
哈尔滨工业大学(深圳)助理教授
内容简介: 
在本次演讲中,我将探讨为机器人构建社交生活的概念,重点关注机器人如何通过表演舞台和社交互动融入人类。机器人越来越多地被设计成扮演各种角色,从同伴到合作者,它们的社交性通过不同场景得到培养。这些共同的体验使人类能够与机器人建立有意义的情感联系。例如,在日本,咖啡馆是机器人可以进行自然的人机互动的实验场所。
本次演讲深入探讨了互动设计模式如何支持这些社交互动,以及大语言模型等科技的支持如何让“人-机器人”的社交互动变得更加美好。

演讲提纲:
1、机器人的多种角色
2、社交机器人的关键互动技术:情绪智能、人格、类人交流
3、通过互动实现机器人社交
4、社交互动仪式
5、道德影响和文化框架        

听众受益: 
听众可以通过这次演讲了解HRI(Human-Robot Interaction)的最新科研进展,并且在通过发本演讲的丰富案例展示了解到机器人社交的发展状况,对于大语言模型如何赋能具身智能进行脑力激荡。        哈工大(深圳)未来设计学院助理教授,研究方向为机器人交互、时尚与人机交互、可持续人机交互。印第安纳大学伯明顿分校人交互哲学博士,浙江大学建筑学学士。在ACM IDC、ACM C&C、ACM HAI、IASDR、IEEE/ACM ASE等国际会议以及ACM Interactions、IJHCI等国际期刊上发表论文十余篇,并担任多个人机交互领域会议的评审。

哈工大(深圳)未来设计学院助理教授,研究方向为机器人交互、时尚与人机交互、可持续人机交互。印第安纳大学伯明顿分校人交互哲学博士,浙江大学建筑学学士。在ACM IDC、ACM C&C、ACM HAI、IASDR、IEEE/ACM ASE等国际会议以及ACM Interactions、IJHCI等国际期刊上发表论文十余篇,并担任多个人机交互领域会议的评审。
成本终结者:揭秘LLM推理的高性能奥秘
叶 帆
腾讯云异构AI研发负责人
内容简介:
TACO-LLM是腾讯云自研的大语言模型推理引擎。经过集团内外部包括微信、代码助手、智能客服、弹幕审核、文档摘要等多个业务场景的打磨,及研发团队极具创新性的独特加速技术的加持,TACO-LLM从并行解码、Prefill优化、量化、长序列等多个方向发力,已基本实现对LLM全应用场景的覆盖,相比社区SOTA性能普遍加速1.5x-3x不等,获得业务的高度认可。本专题将揭开TACO-LLM优秀性能背后的秘密,着重从高性能算子设计的角度来一窥TACO的自研技术。我们将介绍未经公开的Turbo Attention及量化场景下的低精度算子实践。    
   
演讲提纲:
1、LLM应用的发展和挑战
2、LLM推理的技术原理和性能瓶颈
3、TACO-LLM的成本优势和性能表现
4、TACO-LLM技术解密:独家高性能算子Turbo Attention及混合精度量化算子的设计与调优
5、 微信、B站、希音等多种应用场景的TACO性能之旅

听众受益:
1、完整了解LLM应用部署的成本拆解和技术栈
2、了解LLM应用搭建的不同方式以及优劣势对比,例如MaaS、自建等
3、了解GPU、国产芯片、推理框架对LLM应用的性能影响        

叶博士一直以来专攻AI Infrastructure并深耕异构计算领域。于法国原子能署获得博士学位后赴硅谷英伟达负责CUDA研发,同时也是TensorRT的创始开创者之一。其后设计并从零开发了PAI-Blade,并广泛赋能众多行业,横跨电商、CV、NLP、ASR等多个领域。
目前,叶帆在腾讯云带领异构计算研发团队打造了腾讯智算中的AI加速引擎TACO,包括TACO-Train, TACO-Infer,TACO-LLM等。团队的另一个杰作qGPU也凭借业内领先的GPU虚拟化技术帮助了众多集团内外客户拓展GPU算力,实现极致效益。
大语言模型结合企业知识库的私有化部署
黄鸿波
深圳市鼎盛方圆科技发展有限公司CEO
内容简介:
随着人工智能技术的快速发展,大语言模型(LLM)在企业中的应用日益广泛。然而,公有化部署的模型在数据安全性、合规性以及特定领域知识回答方面存在局限。私有化部署能够提供更高的数据安全性和合规性,同时允许企业根据自身需求定制化模型,提高模型的有效性和准确性。        

演讲提纲:    
1、为什么要用私有化大模型部署
1)大语言模型在企业中的应用现状
2)公有化与私有化部署的对比分析
3)数据安全性与合规性
2、基于RAG的企业知识库的构建思路
1)技术架构
2)大语言模型企业落地目前存在的问题及解决方案
3、企业私有化大模型部署方案
1)企业私有化部署方案框架介绍
2)私有化部署中大模型和小模型的融合
3)我们实际在企业中私有化部署的方案        

听众受益:
1、了解大语言模型在企业中的私有化部署的重要性和优势。
2、掌握私有化部署的技术架构和关键技术点。
3、学习如何通过微调和改造方案解决现存问题,提升模型性能。
4、获得实际案例分析,理解如何在不同场景下应用大语言模型。
5、预见大语言模型在企业知识管理中的未来应用方向。        

深圳市鼎盛方圆科技发展有限公司创始人
中国43个谷歌机器学习方向开发者专家之一
前西山居AI技术专家
2018年出版《TensorFlow进阶指南 基础、算法与应用》一书
京ICP备2020039808号-4 京公网安备11011202100922号