开发者/工程师: 具备Python基础,希望将大型语言模型高效、低成本地应用于企业特定场景(如智能客服、知识库问答、代码助手)的开发者。
算法工程师/数据科学家: 希望深入理解RAG前沿技术,掌握其高级优化技巧和微调方法,以构建更精准、更可靠的AI应用。
技术负责人/架构师: 需要为团队技术选型,规划RAG系统架构,并理解其技术边界、成本与性能权衡的决策者。
学员前提:
熟练掌握Python编程。
对机器学习/深度学习有基本概念。
对LangChain、LlamaIndex等框架有初步了解更佳(非必须)。
体系化掌握RAG核心原理: 深入理解RAG的工作流程、核心组件及其背后的技术细节,不再停留在“黑盒”使用层面。
精通高级知识增强技巧: 掌握从向量检索优化到图数据库、关键词混合查询等进阶检索方案,显著提升检索精度与召回率。
掌握RAG全链路微调能力: 学习如何微调检索器、重排器乃至大模型本身,使整个RAG系统与专属知识深度融合,实现最佳性能。
具备构建生产级RAG系统能力: 能够处理复杂查询、解决幻觉问题、进行系统评估与监控,打造真正可用的企业级应用。
1.1 RAG技术演进与核心价值
RAG vs. 微调:场景与成本分析
RAG系统核心组件详解:检索器、生成器
1.2 DeepSeek模型家族介绍
DeepSeek-V2模型架构、特点及优势
DeepSeek API及开源模型部署
1.3 基础RAG管道搭建实战
使用LangChain/LlamaIndex + DeepSeek搭建第一个知识问答系统
文档加载、文本分割、向量化索引入门
2.1 索引优化策略
高级文本分割策略:句感分割、递归分割
元数据过滤与多索引策略
2.2 检索器优化实战
混合检索策略:结合向量检索与关键词检索(BM25)
多向量检索器:图数据库知识关联检索
从小召回到大精度:重排模型原理与应用
2.3 应对复杂查询
智能路由设计:查询分类与改写
多跳问答实现:递归检索与子查询
3.1 RAG微调策略总览
何时需要微调?微调检索器 vs. 微调生成器
训练数据构造方法论
3.2 检索器微调
指令微调:让Embedding模型更好理解领域查询
对比学习与难负例挖掘技巧
3.3 生成器微调
指令微调:让DeepSeek学会基于上下文作答
防止“遗忘”与“幻觉”的微调技巧
低成本微调实战:LoRA/QLoRA应用
3.4 端到端联合优化
高级技术导读:RA-DIT、PROD等前沿思路
4.1 提示工程与输出控制
高级提示模板设计:思维链、少样本、指令强化
上下文压缩与信息优先级排序
4.2 RAG系统评估体系
评估指标详解:忠实度、答案相关性、上下文相关性
使用RAGAS、TruEra进行自动化评估
人工评估方案设计
4.3 系统架构与部署考量
高并发、可扩展的RAG服务架构设计
缓存、异步处理等性能优化技巧