摘要:結巴中文分詞的特點如下:支持三種分詞模式:(精確模式,試圖將句子最精確地切開,適合文本分析;全模式,把句子中所有的可以成詞的詞語都掃描出來, 速度非常快,但是不能解決歧義;搜索引擎模式,在精確模式的基礎上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞。)、支持繁體分詞、支持自定義詞典、MIT 授權協(xié)議。本文系列文章一是對官方文檔的介紹,文章二是引用收集網友對結巴分詞源碼的分析,文章三是對基本操作代碼示例演示。(本文原創(chuàng)匯編而成,轉載請標明出處【結巴分詞資料匯編】結巴中文分詞基本操作(3)

目錄:

【結巴分詞資料匯編】結巴中文分詞官方文檔分析(1)

【結巴分詞資料匯編】結巴中文分詞源碼分析(2)

【結巴分詞資料匯編】結巴中文分詞基本操作(3)

1 結巴中文分詞:幾種不同模式的分詞設置


安裝結巴分詞:

  • 全自動安裝:easy_install jieba 或者 pip install jieba / pip3 install jieba
  • 半自動安裝:先下載 http://pypi.python.org/pypi/jieba/ ,解壓后運行 python setup.py install
  • 手動安裝:將 jieba 目錄放置于當前目錄或者 site-packages 目錄
  • 通過 import jieba 來引用

本機是win10 64位,已經安裝了pip工具,關于pip下載安裝(here),然后win+R,輸入pip install jieba,效果如下:

延伸閱讀

學習是年輕人改變自己的最好方式-Java培訓,做最負責任的教育,學習改變命運,軟件學習,再就業(yè),大學生如何就業(yè),幫大學生找到好工作,lphotoshop培訓,電腦培訓,電腦維修培訓,移動軟件開發(fā)培訓,網站設計培訓,網站建設培訓學習是年輕人改變自己的最好方式