前一篇中介紹了用HMM做中文分詞,對于未登錄詞(out-of-vocabulary, OOV)有良好的識別效果,但是缺點也十分明顯——對于詞典中的(in-vocabulary, IV)詞卻未能很好地識別。主要是因為,HMM本質(zhì)上是一個Bigram的語法模型,未能深層次地考慮上下文(context)。對于此,本文將介紹更為復(fù)雜的二階HMM以及開源實現(xiàn)。

1. 前言

n-gram語法模型

n-gram語法模型用來:在已知前面

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運,軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式