硕士毕业于北京航空航天大学,一直从事自然语言处理、信息检索相关的研究和应用落地,研究方向主要包括基础词法、信息检索、预训练语言模型等,在相关领域国际会议ACL/EMNLP/SIGIR上发表多篇学术论文。目前致力于大模型检索增强(RAG)相关的算法研发,包括检索增强核心模块的开发和全链路高性能解决方案的探索。GTE embedding系列模型开源项目负责人。
内容简介:
大模型的崛起催生RAG应用的爆发,开源框架的流行如Langchain和LammaIndex也为开发者提供了低成本开发定制RAG应用的可能。本次技术分享将深入探讨大模型RAG链路中部分核心算法模块的优化和实践, 重点包括Embedding、ReRanking模块等。我们将以RAG的背景介绍作为开端,介绍其在大模型应用的基础范式。针对RAG在实际场景中的应用,我们将介绍RAG链路的具体构成及其在处理复杂查询、提升信息检索精度、提升端到端问答质量等方面的可能优化策略。本次分享将重点讨论这些常见问题,并分享我们在核心链路优化实践中的经验和解决方案,旨在跟大家探讨更有效地利用RAG链路解决实际问题的解决方案。最后,我们会讨论RAG链路面临的未来挑战和发展方向,探索一些可能的研究方向和技术动态,以期为参与者提供启发和思考,共同促进大模型RAG技术的发展与创新。
演讲提纲:
1、RAG背景介绍
2、面相实际落地的RAG链路介绍
3、RAG链路在实际落地场景中遇到问题以及核心模块优化实践: 包括检索Agent/Embedding/ReRank/离线doc理解等模块
4、案例介绍
听众受益:
1、了解当前面相落地应用RAG链路存在的问题
2、了解RAG链路核心模块优化的策略和方案