内容简介:
在智能交互领域,具备情商的人形机器人不仅需要理解语言,还需精准感知人的表情、动作及场景,并进行情感化响应。本报告探讨实现高情商人形机器人交互的关键技术,涵盖四大核心模块:人的表情语言的多模态感知、人的动作和场景的多模态感知、情商大模型的提示词工程与微调、以及动作/表情/文本的多模态表达。我们设计了一整套技术架构,从传感器数据采集、深度学习模型训练到交互策略优化,并结合真实应用场景进行落地实践。例如,在展厅讲解、情感辅导等领域,机器人能够通过多模态感知分析用户情绪,并以恰当的方式回应,从而提升交互质量和用户体验。本报告将结合具体应用案例,展示如何优化机器人的情感智能,使其在多元场景中发挥更大价值。
演讲提纲:
1. 情商机器人交互的技术挑战与发展趋势
2. 场景、表情、语言、动作的多模态感知
3. 情商大模型的提示词工程与微调
4. 动作/表情/文本的多模态表达范式
5. 应用实践与未来方向
听众收益:
1. 深入理解高情商人形机器人交互的核心技术,掌握多模态感知、情感计算及交互优化的最新进展。
2. 获得情商大模型优化与多模态融合的工程实践经验,了解如何在真实应用场景中落地,实现更自然的人机互动。
3. 启发机器人在不同领域的创新应用,探索在陪护、教育、心理咨询等方向的商业化和技术落地路径。
正高级工程师,浙江大学计算机科学博士,师从张三元老师,苏步青院士门徒。历任华为高级算法工程师、扩博智能机器视觉专家、普适导航研究院院长。在人形及特种机器人领域持有国家发明专利11件,国际发明专利1件,SCI等高水平论文7篇。10年+技术高管经验,主导过多项千万级智能硬件产品并成果落地商用。10年+从事机器视觉、人工智能、多模态大模型等高新技术在人形及特种机器人智能化等前沿领域的研究与落地。获上海市青年五四奖章、上海市闵行区领军人才、上海市重点产品质量攻关成果项目三等奖、上海市技术发明奖一等奖提名等多项市级荣誉。