Xue & Shen '2003 [2]用兩種序列標注模型——MEMM (Maximum Entropy Markov Model)與CRF (Conditional Random Field)——用于中文分詞;看原論文感覺作者更像用的是maxent (Maximum Entropy) 模型而非MEMM。MEMM是由McCallum et al. '2000 [1]提出MEMM,針對于HMM的兩個痛點:一是其為生成模型(generative model),二是不能做feature的擴展。

1. 前言

首先,將簡要地介紹HMM與maxent模型。

HMM

概率圖模型(probabilistic graphical model, PGM)指用圖表示變量相關(guān)(依賴)關(guān)系的概率模型,主要分為兩類:

  • 有向圖模型或貝葉斯網(wǎng)(Bayesian network),使用有向圖表示變量間的依賴關(guān)系;

  • 無向圖模型或馬爾可夫網(wǎng)(Markov network),使用無向圖表示變量間相關(guān)關(guān)系。

監(jiān)督學(xué)習的任務(wù)就是學(xué)習一個模型,對于給定的輸入

網(wǎng)友評論