论坛主席:丁向惠
京东云数字化效能部质量总监,深耕企业级质量体系建设与智能化测试技术落地,主导京东云全链路智能测试平台与评测体系构建。长期聚焦AI 赋能测试领域,在智能用例生成、自动化测试智能化、大模型及应用评测、研发效能度量等方向有深度实践与行业落地经验。牵头推动测试工具链智能化升级,支撑大规模分布式系统与云原生业务的高效质量保障,致力于通过智能化技术持续提升企业研发质量与效能。
京东云数字化效能部质量负责人

智能测试工具开发与应用

本论坛聚焦智能化测试工具的创新实践与价值赋能,涵盖智能自动化编排、测试效能度量、全链路协同测试等核心方向。分享在智能化场景中借助工具提升测试效率、简化测试流程的前沿实践与标杆案例,推动研发测试范式从传统人工驱动向智能工具驱动转型,助力企业实现质量与效能的双重突破。
AI驱动测试范式演进:
从辅助到自主,构建端到端AI协同交付体系
刘 敏
北京兴云数科 测试领域研发提效负责人
内容简介:
当前软件测试领域正经历AI技术的深度重构,研发范式持续迭代升级:从规则驱动、MCP、技能化到Harness体系的技术演进,从AI辅助测试迈向AI自主测试,测试载体也从自研智能体、Cursor+规则模式,逐步升级为多智能体协同(Agent Team)形态。在此背景下,测试端到端能力实现跨越式发展,从分段式测试升级为需求、架构、开发、测试全环节AI自主协同,通过自主迭代循环确保交付任务达标。同时,构建配套知识工程体系,依托全量知识反构完成存量知识0到1建设,结合增量知识实时回流与一致性校验,为AI自主交付提供坚实知识支撑,同步针对性解决长程任务落地痛点,助力测试领域实现从“工具革命”到“质量范式革命”的转型,为企业研发数字化升级提供实践路径。        

演讲提纲:
1. 测试研发范式的迭代历程:从规则、MCP、技能到Harness的技术演进,以及从AI辅助到AI自主、从单一智能体到Agent Team的形态升级,结合行业实践趋势说明演进核心逻辑。
2. AI驱动端到端测试的升级路径:从分段式测试到全流程协同,详解AI在需求、架构、开发、测试全交付场景的自主协同机制与迭代闭环逻辑。
3. 知识工程体系的构建与价值:存量知识0到1的全量反构建设、增量知识实时回流机制,以及知识一致性校验的实施方法,阐述其对AI自主交付的核心支撑作用。
4. AI自主端到端交付的痛点突破:聚焦长程任务的核心痛点,分享针对性解决方案与落地实践经验,助力企业规避落地瓶颈。
5. 实践总结与未来展望:结合当前AI测试技术成熟度,总结落地成效,展望AI在测试领域的发展方向,贴合AIDD峰会“AI+研发数字化”的核心主题。

听众收益:
1. 明晰测试领域AI驱动的范式演进路径,掌握从AI辅助到AI自主、从单一智能体到Agent Team的转型方法,借鉴技术升级经验。
2. 了解端到端AI协同交付的实现逻辑与知识工程体系的构建要点,可直接参考应用于企业自身测试流程优化,提升交付效率与质量。
3. 掌握AI自主交付中长程任务痛点的解决思路,规避技术落地误区,助力企业快速推进测试智能化转型,契合当前AI测试规模化落地的行业需求。

深耕软件测试领域十余年,先后专注测试工具研发、测试全流程研发提效、研发效能体系度量等方向;同时牵头搭建组织级知识工程体系建设。深度参与关键字驱动测试、软件研发效能国家标准、云上测试平台、智能助手(Claw)基准测试技术规范等多项行业标准与技术规范的编制工作。
基于知识库驱动的AI测试平台TestNexus
刘须华
京东科技 测试开发工程师
内容简介:
TestNexus 平台——一个基于知识图谱的 AI 测试智能分析平台。通过构建代码、业务、用例三位一体的知识图谱,结合 Agent+Skill+MCP 架构,实现测试知识沉淀、代码变更影响分析、智能用例推荐等核心能力,推动测试工作从"经验驱动"向"数据+AI 驱动"转型。        

演讲提纲:
1、平台建设背景:代码、需求、用例等测试知识分散在不同系统内,形成知识孤岛,导致AI进行测试分析结果不准确,测试经验停留在个人脑中,无法形成组织级资产。
2、平台核心理念:1+N+X (1个Agent+N个业务领域测试Know-how+X个测试Skill技能),引导测试范式转型,由传统的靠个人经验测试进阶到AI+业务knowhow驱动转测试转型。
3、测试知识库建设:公共知识库+个人知识库并轨组合建设,提供人看和AI用的双模式测试知识库。构建测试真正的护城河。
4、经验skill化:内置常用测试skill,提供一句话生成skill的能力,让测试同学的测试经验沉淀成组织级资产。

听众收益:
1. AI驱动测试工具开发
2. 测试知识库建设
主要负责智能化搜推、数据应用产品和AI原生产品工具的质量保障,同时在AI测试领域积极探索,尝试使用AI技术进行测试范式的更新。
大模型驱动:从需求到用例的 AI 自动生成平台实践
赵丽艳
北银金科 信息安全部部门负责人
内容简介:
随着研发迭代加速,需求碎片化、用例编写成本高、覆盖率难保障成为测试团队核心痛点。为此我们自研了AI 驱动的需求分析与测试用例自动生成平台,深度融合大语言模型与 RAG 知识库,支持多格式需求文档一键上传,自动完成需求结构化解析、歧义识别、功能点拆解、场景推导,并生成覆盖功能、边界、异常的标准化测试用例,支持导出 Excel/Markdown/ 禅道格式。平台已在多条业务线落地,简单需求用例生成效率提升,复杂需求覆盖率提升,显著降低人工成本、减少遗漏。本次将分享平台架构、关键技术、落地效果与避坑经验。        

演讲提纲:
1、背景与痛点:当前金融科技高速迭代下,软件测试面临的行业现状,重点剖析传统测试模式依赖人工经验、标准不统一、效率偏低、质量管控难等普遍痛点,大模型赋能测试的行业诉求愈加强烈。
2、AI智能测试设计:大模型驱动 AI 测试平台,介绍平台整体设计理念,展示一套覆盖测试全流程的智能化解决方案。
3、关键技术突破:揭秘平台落地背后的核心技术体系,分享大模型、规则引擎、智能测算、数据分析、可视化管控五大关键技术,分享AI技术如何支撑智能测试落地。
4、落地成效:展示量化落地成果,分享平台为业务带来的实际价值与竞争力提升。
5、未来规划:结合行业发展趋势,分享平台后续迭代方向与发展蓝图。

听众收益:
1. 可复用的平台建设方案:掌握从 0 到 1 搭建 “AI 需求解析 + 用例自动生成” 平台的完整架构、技术选型与落地流程,可直接参考回团队建设。
2. 效率提升的量化方法:获得真实业务场景下的效率、覆盖率数据与评估指标,帮助听众说服团队引入 AI 测试工具,明确投入产出比。
3. 避坑与最佳实践:了解大模型在测试用例生成中的常见问题及解决方案,掌握人机协同的高效工作模式,少走弯路。

具备 20 年丰富的质量实践管理经验,专注于质量风险预测模型的构建与优化,主导北银金科大模型测试项目,积极探索 AI 智能在测试领域的应用,推动测试技术的创新升级,实现智能化测试的落地实践,建立科学合理的质量效能指标体系,通过数据驱动的决策方式,精准识别质量改进机会,助力企业实现质量效能的持续提升。
复杂ToB业务场景下的AI Native Test Harness 架构和实践:
以跨代码仓库知识图谱为知识底座
吴武辉
京东云 高级测试专家
内容简介:
我们对 AI Native Test 的理解,落在一个具体选择上:让测试同学在本地为Code Agent(LLM + 内建 Harness)配备一套由 agents / assets / skills / specs 四件套构成的 User-Defined Harness,把测试领域知识、流程纪律与工具能力沉淀其中,按业务演进的节奏在本地持续热迭代。
这套 Harness 立在两根支柱上。
1. 一套可自演进的多 Agent 测试架构:从编排准入、代码级静态 review,到 E2E 分析、用例生成与执行,再到执行反思,各 Agent 单一职责、显式契约;反思 Agent 把改进需求回流,测试同学在本地热迭代 agents/skills/specs,让整个架构形成自我进化的 Agentic loop。
2.跨代码仓库知识图谱:复杂 ToB SaaS 是多端多服务的分布式系统,影响面、合约、调用链天然跨仓,单仓视野不足以支撑测试判断,因此我们用全局合约级图谱作为 Agent 的知识底座。本议题完整分享这套架构,并以一次脱敏的真实跨端变更复盘其端到端链路。

演讲提纲:
1.痛点与架构选择:复杂 ToB 业务系统测试的真实痛点——一次改动牵动多端多服务、影响面跨仓、回归难覆盖难定位;以及我们的选择——测试同学在本地给Code Agent,配一套包括agents / assets / skills / specs 四件套的 User-Defined Harness,按业务节奏在本地持续热迭代
2. 测试 Agent 架构:职责清晰的 6 个测试 Agent——编排准入、代码级静态 review、E2E 测试分析、E2E 用例生成、E2E 执行、执行反思每个单一职责、显式 I/O 契约;执行反思 Agent 把改进需求回流、测试同学在本地热迭代,使整套架构成为可自演进的 Agentic loop,并配以""独立产出、不维护跨 Agent 中间账本、少通信""的协作纪律
3. 知识底座:上述 Agent 要做准确的影响面判断,就必须有跨仓全局视图——为什么""跨代码仓库知识图谱""不可绕过:复杂 ToB SaaS 下影响面、合约、调用链天然跨仓,全局合约级图谱是单仓视野必须补齐的一环,也是测试 Agent 静态分析与用例设计的知识来源
4. 脱敏落地复盘:一次资金/账务类的真实跨端变更走完整 loop——牵动多个服务、多条跨仓合约边,从代码 diff 到最终准入结论,配合量化结果(识别出的风险点 / 高优问题计数)谈实战取舍与坑

听众收益:
1. 拿到一套可自演进的多 Agent 测试架构参考:6 个 Agent 的职责切分与显式 I/O 契约,以及"执行反思 → 本地热迭代"的闭环怎么让架构持续进化,可直接作为团队 Harness 建设蓝本
2.看到「本地 Code Agent + User-Defined Harness」范式的完整样貌,理解四件套(agents / assets / skills / specs)如何承载测试知识、并随业务热迭代
3. 跨代码仓库知识图谱的方案选型、工具构建、为什么把ta作为复杂分布式系统 AI Native Test 的知识底座,以及测试 Agent 如何把全局合约级视图转化为可执行的测试判断
深耕质量工程与测试开发多年:曾在高德、蚂蚁先后任职测试开和效能工具架构师。2019 年加入京东,历任测试架构师、测试开发团队负责人,主导多条核心业务线的测试体系与效能建设。目前聚焦 AI Native Test 方向,在复杂 ToB SaaS 业务下探索 AI Native 的测试范式,以跨代码仓库知识图谱为底座构建可自演进的多 Agent 测试架构,推动测试从人工驱动向 Agent 驱动持续演进。
京ICP备2020039808号-4 京公网安备11011202100922号