一、高质量数据集与数字化转型
1高质量数据集
1) 政策解读、定义与评估标准(准确、完整、一致、时效、可追溯)
2) 可用性与合规性(个人信息保护影响、数据出境安全、伦理)
3) 采集、整合与标注(授权链哈希+区块链时间戳;双盲+AI预标)
4) 公平性与偏见审计(Demographic Parity、Equal Opportunity)
5) 前沿趋势说明(合成、多模态、隐私保护等)
2数字化转型案例分析
1) 为达成共识的第一个案例
2) 华为数字化转型历程与经验教训
3数字化转型的实施路径
1) 企业数字化转型的难点与应对策略
2) 业务变革趋势与背景
3) 行业数字化转型的实践(医疗领域的控费与流程优化)
4) 实践案例:某集团的数字化转型(“1+3+4+N”系统架构等)
5) 实现路径总结(摸清家底、整体规划、局部先行、渐进推广)
4数据治理与管理
1) 数据治理的定义与重要性
2) 数据管理体系(DAMA、DCMM、信通院体系等)的对比与应用
3) 数据管理与数据资产的关系
4) 数据资产管理体系的构建思路
5AI赋能数据治理
1) 标准化对齐(消除口径差异、标准化映射、主数据匹配、数据质控)
2) 效率提升(数据清洗、数据提取、血缘发现、ETL脚本、辅助测试)
3) 智能发现与洞察(异常发现与溯源、智能去重、分级分类、自动化标注)
4) 智能交互式赋能(智能问数、可视化)
二、大模型技术与应用
1大模型发展现状与技术概览
① 国内外大模型厂商、产品及动态
② 硬件厂商的发展(国内GPU厂商、公有云服务商等)
③ 关键技术点(适应低配条件的技术、处理复杂任务的技术)
④ 提示词工程与思维链(Chain-of-Thought)方法
⑤ 技术路线选择:微调、RAG、agent、MCP?
2微调实践(可选)
① Llama-factory支持的模型
② 数据准备:Alpaca和ShareGPT格式的数据集。
③ SFT微调步骤(加载数据集、设置参数、保存模型等)。
④ 强化学习的微调步骤(PPO、DPO特定数据集、RM等)
⑤ 微调参数详解
3基于大模型的知识库建设步骤
① 需求分析:明确知识库的目标和应用场景。
② 数据收集与整理:从企业文档、FAQ中提取知识。
③ 知识表示:表格知识、向量表示、树状结构、知识图谱等。
④ 知识库如何增强大模型性能。
⑤ 实时知识更新与模型同步。
⑥ 案例分析:知识库在客服场景中的应用。
4RAG技术概述
① RAG(Retrieval-Augmented Generation)的定义与优势
② 词嵌入技术基础
③ RAG技术实践
6大模型(知识库)应用案例
① 大模型应用落地场景(舆情分析、政策问答、辅助立法、酒店客服等)
② 基于大模型的卫生应用(临床辅助决策、智能流调系统、中医图谱等)
③ 基于语义和空间的聚类(市民热线多诉合并)
④ 多模态大模型的发展(图像生成、视频生成等)
⑤ Agent技术的应用与最新发展(MCP接口等)
7智能应用产品的落地
① 核心价值(真实场景与业务闭环、有所不为才能有所为)
② 对标与门槛(资源/行业/技术/生态/标准/成本)
③ 持续改进的动力(体验、黏性、个性化、第三方)
三、讨论(不限于以下主题)
1数字化转型与大模型技术的融合趋势与发展方向
2企业如何在数字化转型中应用大模型技术,提升竞争力
3智能应用产品化的实现要素