出品人:张  佶
阿里巴巴通义实验室NLP资深算法专家
负责通义大模型的应用研究和落地,带领的研究团队发表国际顶级会议论文40余篇,曾在机器阅读理解(MRC)、视觉问答(VQA)等国际权威榜单中实现首次超越人类基准的成绩。曾领导开发的阿里小蜜算法平台服务于阿里全球23个语言、130多个国家的电商用户。                                                                                                       

AI对齐(安全、伦理等)

聚焦以大语言模型为代表的人工智能全生命周期安全,包括模型数据安全、算法安全、开发过程安全、部署安全、应用安全等,指引学术界和工业界合力实现AI可信,共建技术、社会、文化、价值融合共生的良性人工智能环境。
个性化智能体价值观与社交能力的评估与对齐
内容简介:
个性化智能体正逐渐融入我们的日常工作和娱乐生活中。在这个过程中,确保智能体的行为与人类的价值观和社交规范保持一致,成为了一个重要的研究领域。本次技术分享将深入探讨AI对齐的概念、方法,以及在个性化智能体场景中遇到的挑战,介绍相关实践经验。                                                                                                                                                                                                                                      
演讲提纲:
1、背景介绍
1.1 AI对齐的概念和方法
1.2 个性化智能体场景和挑战
2、价值观的评估和对齐
2.1 CValues自动评测
2.2  给AI的100瓶毒药
2.3 基于专家原则的自我对齐
3、 社交能力评估和对齐
3.1  SocialBench自动评测
3.2 个性化角色对齐
3.3 角色穿模
3.4 品牌安全性
3.5 长程主动对话能力
4、 takeway总结
5、未来展望
                                                                                     
                                                               
听众受益:
1、提供一个对AI价值观和社交能力对齐与评估的全面理解
2、帮助在实践中更好地设计和优化个性化智能体,展望未来应用前景和潜在的研究方向                                                                                                                                  
高  星
阿里巴巴通义星尘算法负责人
长期投入NLP对话和大模型的研究和应用工作, 曾先后负责智能客服(阿里小蜜、店小蜜)、智能音箱(天猫精灵)、个性化智能体(通义星尘)等对话场景的算法研究和应用。
AI Safety – 打造负责任的生成式大语言模型
内容简介:
本次演讲深入探究生成式大语言模型的安全性问题,着重讨论如何使模型与人类社会的价值观相对齐。我们首先聚焦大模型安全的重要性,并介绍一些知名公司在此领域的工作。随后, 我们讨论大模型安全性的具体内容,分析大模型的典型风险以及指令攻击的具体案例。进一步, 我们将探讨如何提升大模型的安全性,按照生成式对话大语言模型的生命周期四个阶段详细介绍关键的改进措施。最后,本演讲将对未来大模型安全性的发展趋势进行展望,旨在提供一份对于如何在不断进步的技术世界中维护模型安全性的前瞻性指导。                
演讲提纲:
1、为什么要关注大语言模型安全性
2、大语言模型的安全风险
2.1 模型内在风险
2.1 外部指令攻击
3、如何提升大语言模型的安全性
3.1  Pretrain阶段(语料扫毒、引入安全性token)
3.2  SFT阶段(安全监督式微调、安全的上下文蒸馏)
3.3 RLHF阶段(安全RM数据构造、平衡帮助性与安全性)
3.4  评测阶段(Red-Teaming)
4、未来展望
                                                                                     
                                                               
听众受益:
1、认识大语言模型安全的重要性
2、了解大语言模型安全性在工业和学术界的最新进展
3、学习提升大语言模型安全性的实用策略                                                                                                                                
胡童欣
蚂蚁集团算法专家
负责蚂蚁集团大语言模型的安全性,在AI安全领域深耕多年,对AI安全的学术研究与工业应用都有着丰富经验。
AIGC技术在企业安全运营中的应用
内容简介:
在数字化时代,企业面临着日益复杂的网络威胁。本次演讲将探讨AIGC(人工智能生成内容)技术在企业安全运营中的革命性应用。我们将重点关注系统架构、威胁情报分析、日志分析、自动化响应以及安全培训和意识提升等方面。通过实际案例的解析,我们将展示AIGC技术如何成为企业安全运营的得力助手,并讨论如何最大化地发挥其潜力。                                                                                                                                                                                                                                    
演讲提纲:
1、系统架构:构建安全的AIGC平台
2、威胁情报分析:实时洞察,掌握先机
3、日志分析:洞悉异常,迅速应对
4、自动化响应:高效应对安全威胁
5、安全培训和意识提升:塑造强大的安全文化
                                                                                     
                                                               
听众受益:
1、学习构建安全的AIGC平台和系统架构,提升企业信息安全防护能力
2、掌握实时分析威胁情报和高效分析日志的技巧,迅速发现并应对安全威胁
3、了解如何利用AIGC技术自动化响应安全事件,提高应对效率
4、学习如何利用AIGC技术进行个性化和互动的安全培训,提升员工的安全意识和应对能力
                                                                                                                                 
肖  矜
众安国际信息安全负责人
10+年安全工作经验
曾就职于腾讯安全平台部、财付通
目前主攻方向:
云安全、攻击面管理、AIGC
AIGC浪潮下,踏入数字内容风控的新战场
内容简介:
在大型AI和AIGC浪潮的冲击下,数字内容风险控制成为了规避平台运营风险与满足监管合规的关键挑战。作为国内互联网最早的内容生产企业,网易是如何通过全面制定风险控制方案、构建高效的多模态数据利用平台以及打造更加强大的大型AI模型等策略,成功搭建了一个准确高效的数字内容风险控制体系。本次演讲将深入探讨AIGC浪潮下数字内容风险控制的技术挑战及其应对策略,展望未来数字内容风险控制的发展方向。
               
演讲提纲:
1、AIGC浪潮下数字内容风控背景介绍
1.1 数字内容风控
1.2 AIGC给数字内容风控带来的挑战
1.3 AIGC浪潮下数字内容风控技术应对
2、制定综合全面的风控体系
2.1 AIGC数据鉴别能力
2.2 大模型基座+小模型适配,解决领域适配问题
2.3 建设高效的多模态数据利用平台
3、多模态结合+课程学习,攻克难例
3.1 打造强大的多模态风控大模型
3.2 坚持打造可信AI大模型
3.3 建立快速的模型迭代能力
4、AIGC浪潮下数字内容风控未来展望
                                                                                     
                                                               
听众受益:
1、理解AIGC的影响:了解AIGC技术如何改变数字内容的生成和分发,以及这对现有风控体系带来的挑战。
2、学习风控策略:了解网易如何通过技术手段对抗技术风险,包括制定风险控制方案和构建多模态数据平台。
3、合规性知识:认识到在AIGC浪潮下,满足监管合规的重要性以及如何通过技术手段实现合规。
4、未来趋势洞察:获得关于数字内容风险控制未来发展方向的洞见,帮助听众把握行业趋势,做出前瞻性决策。
5、案例分析:通过网易易盾的案例,学习如何在实际中应用风控技术,以及这些技术如何帮助企业规避运营风险。
6、策略制定:学习如何为数字内容制定全面的风险控制方案,包括技术、流程和人员等方面的考量。
7、技术应用:探讨如何将AI和多模态数据处理技术应用于数字内容风控,提升听众对这些技术应用的认识。
8、风险管理意识:增强对数字内容风控重要性的认识,鼓励他们在自己组织中采取更积极的风控措施。                                                                                                                           
崔若璇
网易易盾内容安全算法专家
毕业于上海交通大学,现任网易易盾内容安全算法专家,负责网易易盾AIGC内容风控、广告内容检测、视频内容分析等算法项目。曾受邀参与“中国信通院”与“中国人工智能产业发展联盟”发起的可信AI 治理标准设计,在数字内容治理、AI算法加速、高性能图像与视频处理等算法领域,发表过多篇专利与国际顶会论文。
京ICP备2020039808号-4 京公网安备11011202100922号