(1)知识库建设步骤
①数据收集与整理:从企业文档、FAQ中提取知识
②知识表示:表格知识、向量表示、树状结构、知识图谱等
(2)知识库的使用
(3)知识库与大模型的结合
①知识库如何增强大模型性能
②实时知识更新与模型同步
(4)知识图谱介绍(原理、设计与实现)
(5)KAG应用
2.RAG技术实践
(1)RAG技术概述
①RAG(Retrieval - Augmented Generation)的定义与优势
②RAG的应用场景:问答系统、文档分析
③RAG应用的评价方式与指标
(2)词嵌入技术
①词嵌入与语义空间
②高维向量的快速模糊匹配
(3)向量数据库
①混合检索与多路召回
②Rerank
(4)RAG实战技巧
①基模选择(qwen、DS、GLM、书生等)
②RAG与微调的适用场景
③数据准备技巧(OCR、理解表格、半结构化)
④chunk技巧(摘要、重叠、长度选择、构造问题)
⑤Agentic chunking
⑥查询扩展与改写(指代消解、HyDE)
⑦向量数据库使用技巧(标题、正负向情感)
⑧提示词优化技巧:(RTGO、Costar、CRISPE、BROKE等)
⑨多轮问答技巧(任务框架、信息提取、追问策略、可信度)
(5)RAG(Agent)工具
(6)Agentic RAG工具介绍
3.RAG案例分析
(1)通用知识库问答场景(协同办公)
(2)复杂知识库问答场景(临床辅助决策)
(3)基于语义和空间的聚类(市民热线多诉合并)
(4)术语提取场景(中医知识图谱构建)
(5)多轮对话场景(酒店客服)
(6)综合应用(自动生成报告文档)
4.多模态大模型原理与实践
(1)基于Transformer的视觉模型
(2)多模态大模型介绍
(3)数据集准备:标注与预处理
(4)模型训练与优化:超参数调整、正则化技术
(5)多模态大模型的训练
(6)多模态数据集准备:标注与预处理
(7)模型训练与优化:超参调整等