论坛主席:刘焕勇
360人工智能研究院认知引擎算法负责人,曾就职于中国科学院,负责文档解析、知识图谱、行业大模型及Agent应用平台等研发,支撑航空翻译、故障维修、文档审核、搜索推荐等项目落地。有发明专利授权多项、核心期刊及顶会论文数篇,对外开源项目70余项,具有广泛影响力。
360人工智能研究院认知引擎算法负责人

AI数据工程和知识检索

本论坛结合政务、金融、医疗、工业等领域的数字化转型实践,向业界呈现如何利用数据智能释放大数据要素价值、构建数据智能应用。在这过程中,会借助AI算法、RAG、建模分析和数据可视化等为主要手段,完成数据到知识的转化,帮助企业智能运营、智能获客、智能推理、辅助决策,释放数据价值,促进企业竞争力进一步提升。
盲人摸象困境下的“本体论”技术审视及落地观察
刘焕勇
360人工智能研究院认知引擎算法负责人
内容简介:
当前,以“本体论”为代表的“语义层技术”在技术圈和产业圈“诡异”地流行开来,并且愈发炒作为Agent 时代的“harness 工程”。但是,需要注意的是,目前关于本体论大家说法不一、定义也不一样,也出现了很多“挂羊头卖狗肉”的做法,甚至出现,只讲概念,将本体论作为一个即插即用的工具进行宣传推销,而忽视了其强运营、强人工的高构建成本以及其仅仅只是方法论的概念本质。但是,在此之外,也的确有一些可以更轻量的实现方式和尝试。本报告旨在正本清源,从本体论的本质出发,对时下不同的本体论版本展开介绍,包括 semantic ontology、知识图谱、panlantir ontology等具体内涵、差异及适用场景。然后以实际的案例来看看当前本体论落地的一些具体的范式,比如驱动agent、驱动数据治理,这些都是国内公司的玩法。最后对本体论真正落地的挑战、难点、误区、路径等进行总结。    

演讲提纲:
1、为什么“本体论”会诡异”地流行开来?底层逻辑是什么?
2、“本体论”到底是什么?从semantic ontology到知识图谱再到panlantir ontology
3、“本体论”在国内落地的范式?驱动agent or 驱动数据治理?
4、“本体论”真正落地的挑战、难点、误区、路径

听众收益:
1、了解当前“本体论”到底是啥?正本清源理解
2、了解当前“本体论”落地的剧本都是什么?都怎么玩?
3、了解当前“本体论”的落地挑战、难点和误区。


360人工智能研究院认知引擎算法负责人,曾就职于中国科学院,负责文档解析、知识图谱、行业大模型及Agent应用平台等研发,支撑航空翻译、故障维修、文档审核、搜索推荐等项目落地。有发明专利授权多项、核心期刊及顶会论文数篇,对外开源项目70余项,具有广泛影响力
Elasticsearch 向量搜索及 AI Agents 开发
刘晓国
Elastic 中国社区首席布道师
内容简介:
详细介绍 Elasticsearch 向量搜索及其最新进展,并通过具体案例展示如何利用向量搜索(稀疏向量与密集向量)实现语义搜索。
Elasticsearch 是全球应用最广泛的搜索引擎之一。随着人工智能技术的发展,Elasticsearch 引入了向量搜索能力(包括密集向量与稀疏向量),以支持更强大的语义搜索。更重要的是,Elasticsearch 提供了混合搜索(BM25 + 向量搜索)能力。Elastic 的混合搜索将传统基于关键词的搜索(包括灵活的查询语法、精准的关键词匹配以及相关性评分)与基于向量相似度的语义理解相结合,并支持多种重排序(Reranking)技术。这种协同方式能够显著提升搜索结果的相关性,使查询不仅能够匹配关键词,还能够理解用户意图,从而更精准地定位内容。使用具备分布式搜索、检索与重排序能力的数据平台作为核心上下文检索引擎具有重要意义。开发者可以借助高级查询语法引入业务意图与过滤条件,过滤掉可能干扰结果或降低上下文价值的内容。本议题将通过生动且具体的示例,深入展示如何利用稀疏向量与密集向量实现高质量的语义搜索。
在最新的 Elastic 发布中,Elastic 推出了 AI Agent Builder,使开发者能够在几分钟内快速创建自己的 Agents。Agent Builder 提供了聊天式交互界面,用户可以直接在 Kibana 中创建和管理 agents、tools 及 skills。与此同时,Elastic 还提供了 Workflows 自动化引擎,为简单任务提供稳定可靠的脚本化自动化能力,并为需要推理的复杂场景提供由 AI 驱动的智能自动化。开发者可以在 Kibana 中基于 ES|QL、MCP、Workflows 以及 Index Search 构建 tools,也可以通过自定义 skills 扩展特定搜索场景的能力。用户能够通过自然语言对 Elastic 中的数据进行查询、关联与分析,实现真正意义上的“与数据对话”。Kibana 内置 MCP 与 A2A 服务器、可编程 APIs,以及一系列预构建的系统 tools,用于查询和探索 Elasticsearch 索引,并从自然语言自动生成 ES|QL 查询。Agent Builder 还允许开发者创建自定义 tools,并利用富表达能力的 ES|QL 查询语法,对返回给 agent 的上下文数据进行定向与塑造。结合 Elasticsearch 强大的聚合、过滤、分析以及混合搜索能力,Elastic 为现代 AI agents 提供了丰富而可信的上下文基础,从而构建具备上下文感知能力的下一代智能搜索与分析平台。

演讲提纲:
1. 智能时代的搜索需求
1.1 对语义搜索的需求,而不是简单的词汇匹配
1.2 对多媒体数据的搜索,比如图片,声音及视频
1.3 非结构化数据的搜索
1.4 向量搜索带来的新的解决方案
2. Elasticsearch 向量搜索介绍
2.1 向量搜索原理
2.2 向量搜索种类(密集向量,稀疏向量)
2.3 混合搜索介绍(多路召回,综合评分)
2.4 Rerank
2.5 向量搜索 Demo
3. 智能体开发/Agentic AI
3.1 AI agent 和传统的 RAG 区别
3.2 为什么需要上下文工程?
3.3 基于 Langchain 的 ES Agent 搜索
3.4 运用 MCP 开发 agents 应用
3.5 Agent builder 介绍
3.6 在 ES 中运用 A2A 及 MCP 构建多 agents 应用
3.7 Demo (agents/tools/workflows/skills)

现为 Elastic 社区首席布道师。新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,LinkMotion Future, Vantiq 等企业。从事过电脑设计,实时系统,手机,汽车电子,计算机操作系统,通信,云实时事件处理及大数据等行业。从爱立信开始,诺基亚,Ubuntu 到现在的 Elastic 从事社区工作有将近 20 年的经历。
Agent 开发范式演进:简化多源实时上下文构建
沈 林
阿里云 高级技术专家
EventBridge/EventHouse 负责人
内容简介:
“简单”和“可靠” 是AI普惠的关键。然而企业数据分散、Schema 多变、语义冲突、上下文腐烂等难题,正成为 Agent 迈向生产级的“深水区”。本次分享,意在如何简化多源实时上下文构建:打破传统知识库不断“打补丁”的方式,通过多源数据的一键集成、统一 Catalog、知识 Wiki、闭环反馈自进化等,将原本散乱在各处的数据,“快速”变成真正有效的知识,提升 Agent 的感知能力。以统一的、一键集成的、Serverless 的上下文服务, 助力开发者轻松搭建生产级的 Agent。        

演讲提纲:
1. AI 普惠的理想与现实
1.1 只有“简单”和“可靠”,AI 才能真正深入每一个行业。
1.2 当前,企业 Agent 已经迈向生产级的“深水区”,让 Agent 研发变得“复杂”和“不可靠”:
- 数据分散: 信息散落在文档、数据库、API、实时日志中。
- Schema 多变: 接口协议不统一,数据格式随时变动。
- Context-Rot(上下文腐烂): 陈旧或无关的上下文干扰模型判断。
- 语义冲突: 不同来源的数据对同一事实描述不一致。
2. 从终局看,探讨分析 Agent 研发范式演进
2.1 从提示词工程、到上下文工程、到 Harness 工程、环境工程、自主进化;
2.2 答案呼之欲出,问题是如何将这个过程变得“普惠”。
3. 统一的多源实时上下文构建
3.1 一键集成与多源实时感知:以“事件”为标准,实现异构数据一键实时接入,构造统一的多源实时 Catalog;
3.2 自动探测和 Schema 演进:自动分析上游数据 Schema,AI 语义化分析,并持续监听演进;
3.3 统一存储和检索服务:打破 MCP 补丁模式,面向结构化、半结构化和非结构化数据,建立统一的知识 Wiki, 帮助快速、准确的找到需要的数据;
3.4 闭环反馈与自我优化:引入反馈环机制(Human-in-the-loop 或 Model-in-the-loop),自动识别并纠正语义冲突,优化知识 Wiki,持续提升上下文质量;
3.5 一站式的 CICD 服务:可自定义的 benchmark,可观测,可告警,保障每一次 Agent 的实时上下文变更发布都达到生产级标准。
4. 总结与展望

听众收益:
1. 围绕“简单”和“可靠”的 AI 普惠目标,发现当前 Agent 上下文研发存在的问题;洞察 Agent 研发范式的演进路径,在下一个路口提前布局;
2. 深入了解多源实时上下文构建的原理过程,了解其中的难点和挑战,以及对应的分析和解决方案;
3. 通过类似产品,帮助企业在内部快速搭建“低维护”、“高可靠”的生产级 Agent 上下文服务。

阿里云高级技术专家、EventBridge/EventHouse 负责人,Apache RocketMQ PMC,深耕于消息中间件、事件驱动、Agent 上下文生态集成领域。目前,致力于赋能 Agent 开发者,让 AI 深入各行各业,真正实现 AI 普惠和平权。
基于本体智能的企业级“语义孪生”Agent 实践之路
刘钰胜
北京优锘科技 解决方案总监
内容简介:
在企业级AI落地如火如荼的今天,大模型(LLM)面临一个根本性困境:企业的真实业务世界与AI的认知世界之间存在巨大的语义鸿沟——大模型听不懂企业术语、跨表查询频频"幻觉"、想操作下游系统却力不从心。问题的根源不在模型能力,而在于缺少一套将企业真实业务世界精准映射到AI认知空间的"语义孪生"体系。
我们以本体(Ontology)为基座构建企业级"语义孪生"——不同于数字孪生对物理世界的几何复刻,语义孪生是对企业业务世界的概念、关系与规则的高保真语义映射,为AI Agent提供可理解、可推理、可操作的认知底座。
本次分享将从 Palantir 在大洋彼岸以“本体+AI”取得的巨大商业成功说起,深入剖析本体论在哲学、互联网(图谱符号主义)与 AI 时代(语义理解与信息压缩)的演进与本质差异。基于此,重点公开介绍优锘科技在数字孪生领域多年实战中沉淀出的面向AI的本体建模闭环方法论,并以自主研发的高精度智能问数系统为例,展示语义孪生如何通过本体神经网络(ONN)与多Agent协同机制,将自然语言模糊查询精准转化为高确定性的语义流水线,为听众呈现一条从语义孪生构建到企业级Agent落地的完整实践路径。

演讲提纲:
1. AI Agent落地的"认知困境":为什么企业需要语义孪生?
1.1企业AI落地的路线选择与共同困境:数据孤岛、语义缺失、幻觉风险
1.2阻碍大模型Agent进入核心业务的四道门槛(语义理解、确定性、执行力、业务记忆)
1.3从"数字孪生"到"语义孪生":AI时代企业认知基座的范式跃迁
1.4为什么"语义孪生"是破解认知隔离与黑盒幻觉的关键路径
2. 同一个词,三种灵魂:AI时代本体的重新定义
2.1哲学本体论、知识图谱本体与AI语义本体的认知异同
2.2优锘本体进化之路:从CMDB到数字孪生,再到语义孪生与本体智能
2.3Palantir的启示:解析Palantir如何以本体为核心构建企业级AI体系
3. 语义孪生的构建:面向AI Agent的本体建模闭环方法论
3.1语义孪生的核心理念:用本体为企业业务世界建立AI可理解的"语义镜像"
3.2系统化建模核心步骤:从业务还原、理想模型、现实反思到场景推演的闭环
3.3数据语义融合:将多源异构数据对齐到统一语义空间
-本体上线后的持续运营迭代机制
-面向AI Agent建模的核心原则(业务优先、语义为王、先少后多、持续演进)
4. 案例实战:企业级本体模型的设计与推演
4.1典型企业级业务场景下的核心本体识别
4.2语义孪生图谱的设计、业务场景推演与Agent调用路径验证
5. 本体驱动的Agent实践:以智能问数为例
5.1为什么传统智能问数难以进入严肃生产环境——问题拆解
5.2本体作为Agent认知底座的核心价值:从"猜测"到"确定"
5.3优锘的科学突围路径:基于本体论生的ONN本体神经网络+多Agent协同机制
5.4Agent如何沿着本体进行精准问数实例演示
6. 总结与展望
6.1从"本体为什么需要"到"怎么建"、"怎么用"的完整逻辑回顾
6.2本体+Agent:企业级AI从"能用"到"敢用"的必经之路

听众收益:
1.理解"语义孪生"新范式: 清晰理解语义孪生与传统数字孪生的本质差异,掌握如何以本体为基座为企业构建AI Agent可理解、可推理的语义认知底座,为本企业的AI战略提供新的架构视角。
2.一套系统化的本体建模方法论:掌握一套涵盖“业务还原、理想模型、现实反思、场景推演、数据融合、优化运营”的闭环本体建模方法论,能够立刻用于指导本企业的数据语义化与 AI 语义层建设。
3.大模型落地核心业务的架构参考:理解基于“本体神经网络(ONN) + 多 Agent 协同”的高确定性智能问数系统架构,帮助团队突破传统 RAG 和 Text-to-SQL 的准确率天花板。
北京优锘科技股份有限公司 解决方案总监,拥有超过二十年软件产品研发经验,为金融、能源、运营商、交通等几十家品牌客户提供本体智能项目的咨询和交付。受聘为中国科技产业化促进会标准化工作委员会;中国互联网协会ISC学术工委会等多个行业协会;《本体智能平台技术要求》标准编委。
面向知识密集型智能体的高效知识组织与利用
刘正皓
东北大学副教授/博士研究生导师
内容简介:
随着大语言模型训练与推理能力的持续提升,用户逐渐倾向于使用大语言模型替代传统搜索引擎获取信息。然而,大语言模型在实际应用中仍然面临显著的“幻觉”问题,生成内容的可靠性与可验证性不足。检索增强生成通过引入外部知识源以提升模型的事实一致性与回答可信度,已成为当前学术界与工业界的研究热点。尽管如此,现有方法在实际应用中仍存在若干关键挑战,包括内外部知识的冲突与融合困难、知识整合与利用效率不足,以及对复杂专业领域场景的适配能力有限等问题。本报告围绕知识密集型智能体系统介绍如何实现高效的知识获取、组织与利用机制,以提升智能体在复杂信息环境中的推理能力与任务执行效果。        
演讲提纲:
1. 大模型幻觉问题与知识增强背景
1.1 介绍大模型幻觉问题。
1.2 简述大模型检索增强生成框架与优势。
2、内外部知识冲突问题与知识置信边界
2.1 大模型内部参数知识与外部检索知识之间的冲突问题。
2.2 提升模型对外部知识的信任程度,并建立合理的“置信边界”,即在何种条件下依赖模型参数知识、何种情况下必须依赖外部证据。
3. 基于模型自主知识获取与整理机制
3.1 智能体正在从“被动检索知识”走向“模型自主获取与组织知识”。介绍如何让大模型主动规划信息获取路径,进行多轮查询、信息筛选与结构化整理。
3.2 介绍长期记忆更新、演化与利用机制,从而形成可持续演化的知识结构。
4. 检索增强生成模型的评价与优化
4.1 介绍如何构建更贴近RAG真实应用场景的评测基准,以提升RAG模型评价效果。
4.2 在优化层面实现多智能体协同优化从而实现更可靠、更高效的知识增强生成系统。
5. 典型领域应用
5.1 介绍UltraRAG工具,首个以MCP协议为基准的RAG搭建框架。
5.2 介绍UltraRAG团队在清华清小搭相关场景的落地转化。

听众收益:
1. 系统理解大模型幻觉问题的本质与成因
通过对幻觉现象及其与知识增强关系的梳理,帮助听众建立对大模型可靠性问题的整体认知框架,理解当前方法为什么“有效但不充分”。
2.掌握知识增强智能体的核心技术路径
从检索增强生成到知识密集型智能体,帮助听众把握当前主流技术路线及其关键模块设计,包括检索、融合、推理与记忆机制。
3. 理解面向未来的知识组织与自主智能体发展方向
从被动检索走向自主知识获取与整理,帮助听众把握智能体系统的发展趋势,以及评价与优化知识增强智能体系统的关键问题与研究空间。
东北大学副教授,博士研究生导师,清华大学自然语言处理实验室客座研究员,辽宁省优秀研究生导师团队骨干成员。入选第十届中国科协青年托举工程、兴辽英才人才计划以及东北大学卓越青年人才集聚计划。在NeurIPS、ICLR、ICML、ACL、EMNLP、NAACL、SIGIR、WebConf等国际、国内顶级会议或期刊上发表70余篇论文,累计Google Scholar引用4000余次。担任NeurIPS、ICLR、ACL ARR、COLING领域主席。现主持国家级、省部级项目多项。        
京ICP备2020039808号-4 京公网安备11011202100922号