Course 1 (2015.9.10)
- 课程介绍 (slides)
- 汉字编码
- 概要介绍 (slides)(内含6分编程作业,汉语文本切分为单个字或字母,截止时间:第9周(含)上机课前,chinese-char-seg)
Course 2 (2015.9.17)
- 汉字编码
- 汉语分词
- 前向后向最大匹配 (slides)(内含19分编程作业,截止时间:第11周(含)上机课前,chinese-word-seg-max-match)
- 数据下载地址,数据均采用UTF-8编码
Course 3 (2015.9.24, week 3)
- 汉字编码
- 补充一些内容:字节序标记,UTF-16编码等(课件同Course 1)
- 几个不同编码的文件 下载链接,可以用hexdump查看
- ngram语言模型
- 我的课件 (slides),介绍至最大似然估计(内含10分编程作业,截止时间:第13周(含)上机课前,3元语言模型建立、评价、生成句子,ngram-lm)
- 数据下载 链接,数据均采用UTF-8编码
Course 4 (2015.10.8, week 5)
- ngram语言模型
- Columbia University的Michael Collins教授Coursera公开课的课件(slides)
Course 5 (2015.10.15, week 6)
- ngram语言模型
- 隐马尔科夫模型(HMM)
- Collins教授的课件(slides),介绍至三元HMM模型最大似然参数估计,未讲Viterbi解码
- 我的课件(slides)(内含15分编程作业,截止时间:15周(含)上机课前,2元HMM词性标注,hmm-viterbi)
- 编程作业使用的数据同Course 3
Course 6 (2015.10.22, week 7)
- 隐马尔科夫模型(HMM)
- 继续讲Collins教授的课件:Viterbi解码(课件同Course 5)
- Viterbi解码的一个动画例子(slides)
- HMM模型中极大似然估计的由来,公式推导见 (pdf)
Course 7 (2015.10.29, week 8)
- 隐马尔科夫模型(HMM)
- 无监督学习:EM算法,Forward-Backward算法,讲义见(pdf)
- 我的课件(同Course 5)(内含15分编程作业,截止时间:15周(含)上机课前,2元HMM词性标注之EM算法,hmm-em)
- 概率上下文无关文法(Probabilistic Context-Free Grammar,PCFG)
Course 8 (2015.11.5, week 9)
- 概率上下文无关文法(Probabilistic Context-Free Grammar,PCFG)
- Collins教授的课件:PCFG、参数估计、CKY算法(slides)
- Collins教授的课件,PCFG存在的问题(slides)
- 我的补充材料(pdf)(内含30分编程作业,截止时间:15周(含)上机课前,PCFG模型,pcfg)
- 数据下载 链接,数据均采用UTF-8编码
Course 9 (2015.11.12, week 10)
- 概率上下文无关文法(Probabilistic Context-Free Grammar,PCFG)
- Collins教授的课件,简要介绍词汇化PCFG,了解即可(slides)
- Linear Model(词性标注作为多元分类问题)
- 我的讲义(pdf)(内含13分编程作业,截止时间:15周(含)上机课前,Linear
Model实现,linear-model)
Course 10 (2015.11.19, week 11)
- Linear Model(词性标注作为多元分类问题)
- 进一步解释,以同学的代码为例 (GitHub代码链接)
- 进一步优化,Averaged Perceptron,特征序列化,公用特征向量
Course 11 (2015.11.26, week 12)
- 最大熵与对数线性模型(词性标注作为多元分类问题)
- 我的讲义(pdf)(内含15分编程作业,截止时间:15周(含)上机课前,Log-linear
Model实现,loglinear-model)
- Collins教授的课件(slides)
Course 12 (2015.12.3, week 13)
- Global Linear Model(词性标注作为序列标注问题,结构化分类)
- 我的讲义(pdf)(内含10分编程作业,截止时间:15周(含)上机课前,Global
Linear Model实现, global-linear-model)
Course 13 (2015.12.10, week 14)
- Log-Linear Model, CRF(词性标注作为序列标注问题,结构化分类)
- 我的讲义(pdf)建议大家在Global Linear
Model的基础上实现CRF
Course 14 (2015.12.17, week 15)
- Global Linear Model(依存句法分析,短语结构句法分析,基于图、基于转移的方法,结构化分类)
- 讲义参考我们在COLING-2014做的Tutorial中的part-a(前半部分):(pptx)。有兴趣的同学可以实现Transition-based和Graph-based
parser,需要额外资料可以找我要。
Course 15 (2015.12.24, week 16)
Course 16 (2015.12.31, week 17)
平行班的课件下载地址
Last modified at (UTC/GMT):