ホームページ  >  記事  >  バックエンド開発  >  Python中国語単語分割実装方法(pymmsegのインストール)

Python中国語単語分割実装方法(pymmsegのインストール)

WBOY
WBOYオリジナル
2016-06-16 08:47:521125ブラウズ

この記事の例では、Python での中国語単語の分割の実装方法を説明します。参考のために皆さんと共有してください。詳細は次のとおりです:

Pythonではpymmseg-cppがとても便利です!

環境 ubuntu10.04、python2.65

手順:

1 mmseg-cpp のソース コードをダウンロードします http://code.google.com/p/pymmseg-cpp/

2 実行:

tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录
cd pymmseg\mmseg-cpp
python build.py   #生成 mmseg.so文件

3 pymmseg ディレクトリを /usr/local/lib/python2.6/dist-packages にコピーします

4 テストが成功したかどうか:

test.py ファイル:

from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '今天的天气真好啊,我们一起出去玩一下吧'
algor = mmseg.Algorithm(text)
for tok in algor:
  print '%s [%d..%d]' % (tok.text, tok.start, tok.end)

Python 関連のコンテンツにさらに興味がある読者は、このサイトの特別トピックをチェックしてください: 「Python 画像操作スキルの概要」、「Python データ構造とアルゴリズムのチュートリアル」、「Python ソケット プログラミング スキルの概要」、「 Python 関数の使用スキルのまとめ」、「Python の文字列操作のスキルのまとめ」、「Python 入門と上級の古典的なチュートリアル」、および「Python ファイルとディレクトリの操作のスキルのまとめ」

この記事が Python プログラミングのすべての人に役立つことを願っています。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。