课程大纲:
深入理解NLP的中文分词:从原理到实践培训
1
开篇:深入理解中文分词原理及实现的意义
2
基础知识:中文分词的四大难题
3
基础知识:N-Gram简单易懂的切词法
4
基础知识:解决中文分词歧义问题(上)
5
基础知识:解决中文分词歧义问题(下)
6
基础知识:解决未登录词问题(上)
7
基础知识:解决未登录词问题(下)
8
进阶知识:HMM — 隐马尔可夫模型
9
进阶知识:CRF — 条件随机场(上)
10
进阶知识:CRF — 条件随机场(下)
11
应用实践:中文分词评测方法
12
应用实践:jieba — 使用说明
13
应用实践:jieba — 源码分析(上)
14
应用实践:jieba — 源码分析(中)
15
应用实践:jieba — 源码分析(下)
16
业务案例:关键词挖掘
17
业务案例:文本相似度
18
业务案例:自动摘要
19
彩蛋:Word2vec