ホームページ  >  記事  >  テクノロジー周辺機器  >  機械学習評価のF1スコア指標について詳しく解説

機械学習評価のF1スコア指標について詳しく解説

PHPz
PHPz転載
2024-01-23 17:06:051340ブラウズ

精度メトリクスは、データセット全体にわたってモデルが正しく予測した回数を測定します。ただし、このメトリックは、データ セットがクラスのバランスがとれている場合にのみ信頼できます。つまり、データセット内の各カテゴリには同じ数のサンプルが存在します。ただし、現実世界のデータセットは多くの場合、著しく不均衡が生じており、精度の指標をレンダリングすることはもはや不可能です。 この問題を解決するために、より包括的で完全な機械学習の評価指標として F1 スコアが導入されました。 F1 スコアはモデルの精度と再現率を組み合わせたもので、モデルの精度をより適切に評価できます。適合率は、モデルによって陽性と予測されたサンプルのうち真陽性であるサンプルの数を指します。一方、再現率は、モデルが正しく予測できる真陽性の数を指します。 F1 スコアの計算式は、2 * (正解率 * 再現率) / (正解率 再現率) です。 F1 スコアは、精度と再現率を包括的に考慮することで、特に

#F1 スコアの概念

F1 においてモデルのパフォーマンスをより正確に評価できます。スコアは混同行列と密接に関連しており、分類器の精度、精度、再現率などの指標を評価するために使用されます。精度と再現率を組み合わせることで、F1 スコアはモデルの全体的なパフォーマンスの評価を提供します。

精度は、モデルが行った「肯定的な」予測がどれだけ正しかったかを測定します。

リコールは、データセット内に存在する陽性サンプルの数がモデルによって正しく認識されたかを測定します。

精度と再現率にはトレードオフの関係があり、一方の指標を改善するともう一方の指標が犠牲になります。精度が高いということは、データセット内の実際の陽性サンプルを疑うより厳密な分類器を意味するため、再現率が低くなります。一方、再現率を高めるには、陽性クラスに類似したサンプルを通過させる緩和された分類器が必要です。これにより、一部のエッジケースの陰性サンプルが「陽性クラス」として誤分類され、精度が低下します。理想的には、精度と再現率メトリクスを最大化して、完璧な分類子を取得したいと考えています。

F1 スコアは、調和平均を使用して適合率と再現率を組み合わせたもので、F1 スコアを最大化することは、適合率と再現率を同時に最大化することを意味します。

F1 スコアを計算するにはどうすればよいですか?

F1 スコアの計算を理解するには、まず混同行列を理解する必要があります。上で、F1 スコアは精度と再現率の観点から定義されると述べました。式は次のとおりです。

精度

機械学習評価のF1スコア指標について詳しく解説F1 スコアは、以下に示すように、精度スコアと再現率スコアの調和平均として計算されます。範囲は 0 ~ 100% で、F1 スコアが高いほど分類子の品質が高いことを示します。

機械学習評価のF1スコア指標について詳しく解説マルチクラス データセットの F1 スコアを計算するには、1 対 1 の手法を使用して、データセット内の各クラスの個別のスコアを計算します。クラス精度の調和平均を取得し、値を再現します。次に、さまざまな平均化手法を使用して正味の F1 スコアが計算されます。

マクロ平均 F1 スコア

機械学習評価のF1スコア指標について詳しく解説ミクロ平均 F1 スコアは、マルチクラスのデータ分布にとって意味のある指標です。 「正味」TP、FP、FN 値を使用してインジケーターを計算します。

ネット TP は、データセットのクラス TP スコアの合計を指します。これは、混同行列を各クラスに対応する 1 対全行列に分解することによって計算されます。

サンプル加重 F1 スコア

機械学習評価のF1スコア指標について詳しく解説Fβ スコアは、F1 スコアの汎用バージョンです。 F1 スコアと同様に調和平均を計算しますが、精度または再現率が優先されます。 「β」は重み係数を表し、ユーザーが設定するハイパーパラメータであり、常に 0 より大きくなります。

以上が機械学習評価のF1スコア指標について詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は163.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。