ホームページ >バックエンド開発 >Python チュートリアル >[Python NLTK] 品詞タグ付け、単語の品詞を簡単に識別します
品詞タグ付けとは、名詞、動詞、形容詞、副詞など、文内の各単語の品詞を識別することを指します。品詞タグ付けは、構文分析、意味分析、機械 翻訳 など、多くの 自然言語処理タスクにとって非常に重要です。
NLTK は、文内の単語の品詞に簡単にタグ付けできるさまざまな品詞タグ付けツールを提供します。これらの品詞タガーは統計モデルでトレーニングされているため、大規模なコーパスのデータに基づいて単語の品詞を識別する方法を 学習 できます。
NLTK の pos_tag()
関数を使用して、文内の単語の品詞をマークできます。この関数は、文のリストを入力として受け取り、単語と品詞のペアのリストを出力として返します。たとえば、次のコードを使用して、「素早い茶色のキツネが怠惰な犬を飛び越える」という文内の単語を品詞としてラベル付けできます。
リーリー
品詞タグ付けの精度
NLTK の
accuracy() 関数を使用して、品詞タガーの精度を評価できます。この関数は、単語と品詞のペアのリストを入力として受け取り、精度を表す浮動小数点数を返します。たとえば、次のコードを使用して、上記の例の POS タガーの精度を評価できます。
リーリー
出力結果は、品詞タグ付けの精度が 90% であることを示しています。
NLTK 品詞タグ付けは、文内の単語の品詞に簡単にタグ付けできる非常に強力な
ツール以上が[Python NLTK] 品詞タグ付け、単語の品詞を簡単に識別しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。