NMT または NLP のニューラル機械翻訳を使用すると、テキストを特定の言語からターゲット言語に翻訳できます。翻訳のパフォーマンスを評価するために、Python での BLEU またはバイリンガル評価の学生スコアを使用しました。
BLEU スコアは、どちらも N グラムを使用して、機械翻訳された文と人間が翻訳した文を比較することによって機能します。さらに、文の長さが長くなると、BLEU スコアは低下します。一般に、BLEU スコアの範囲は 0 から 1 であり、値が高いほど品質が高いことを示します。ただし、満点を獲得することは非常にまれです。評価は部分文字列の一致に基づいて行われ、一貫性、時制、文法などの言語の他の側面は考慮されないことに注意してください。
###式### リーリー
です
リーリー
###アルゴリズム###
ステップ 2
ステップ 3
ステップ 4
ステップ 5
例 1
ソーステキスト (英語) - 今日は雨が降っています
機械翻訳されたテキスト - 今日は雨が降ります
必須テキスト - 今日は雨が降っています、今日は雨が降っています
翻訳が正しく行われていないことがわかりますが、青色のスコアを探すことで翻訳の品質をよりよく知ることができます。
###例### リーリー ###出力### リーリー例 2
ソーステキスト (ドイツ語) - 私たちは旅行に行きます
機械翻訳されたテキスト - 私たちは旅行に行く予定です
必須テキスト - 旅行に行きます、旅行に行きます
今回は、翻訳されたテキストが目的のテキストに近づいていることがわかります。 BLEU スコアを確認してみましょう。
###例### リーリー ###出力### リーリーBLEU スコアは、翻訳モデルの効率をチェックするための優れたツールであり、翻訳モデルをさらに改善してより良い結果を生み出すことができます。 BLEU スコアはモデルの大まかなアイデアを得るために使用できますが、特定の語彙に限定されており、言語のニュアンスが無視されることがよくあります。 BLEU スコアが人間の判断と一致することがほとんどないのはこのためです。ただし、ROUGE スコア、METEOR メトリック、CIDEr メトリックなどの代替手段を試すことはできます。
以上がPython を使用したニューラル機械翻訳の BLEU スコアの計算の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。