ホームページ > 記事 > テクノロジー周辺機器 > ロジスティック回帰におけるOR値の定義・意味・計算方法を詳しく解説
ロジスティック回帰は、分類問題に使用される線形モデルであり、主に二項分類問題の確率値を予測するために使用されます。シグモイド関数を使用して線形予測値を確率値に変換し、しきい値に基づいて分類の決定を行います。ロジスティック回帰では、OR 値は、モデル内のさまざまな変数が結果に与える影響を測定するために使用される重要な指標です。 OR 値は、独立変数の単位変化に対して発生する従属変数の確率の複数の変化を表します。 OR 値を計算することで、モデルに対する特定の変数の寄与を判断できます。 OR 値の計算方法は、指数関数 (exp) の自然対数 (ln) の係数を取ることです。つまり、OR = exp(β) です。ここで、β はロジスティック回帰の独立変数の係数です。モデル。具体的には、OR 値が 1 より大きい場合、独立変数の増加により従属変数の確率が増加することを意味し、OR 値が 1 未満の場合、独立変数の増加により従属変数の確率が減少することを意味します。従属変数の確率。OR 値が 1 に等しい場合、独立変数が従属変数の確率を増加させることを意味します。増加は従属変数の確率には影響しません。 要約すると、ロジスティック回帰は分類問題に使用される線形モデルであり、シグモイド関数を使用して線形予測値を確率値に変換し、OR 値を使用して結果に対するさまざまな変数の影響を測定します。 OR 値を計算することで、
OR 値は、次の値を比較するために使用される指標です。 2 つの事象の発生率。異なるグループ間または異なる条件下で特定の事象が発生する確率を比較するためによく使用されます。ロジスティック回帰では、独立変数の 2 つの値が従属変数に及ぼす影響を測定するために OR 値が使用されます。従属変数 y が 0 と 1 の 2 つの値のみを持ち、独立変数 x が 2 つの異なる値 x1 と x2 を取ることができるという二項分類問題に直面するとします。 OR 値を定義して、x が x1 と x2 の値を取るときの y=1 の確率比を比較できます。具体的には、OR 値は次の式で計算できます。
OR=\frac{P(y=1|x=x1)}{P(y=0|x=) x1 )}\div\frac{P(y=1|x=x2)}{P(y=0|x=x2)}
P(y=1|x = x1) は、独立変数 x の値が x1 であるときに、従属変数 y の値が 1 である確率を表します; P(y=0|x=x1) は、独立変数 x の値が x1 である場合、従属変数 y の値は確率 0 です。同様に、P(y=1|x=x2) および P(y=0|x=x2) は、独立変数 x が値 x2 をとるときに、従属変数 y が値 1 および 0 をとる確率をそれぞれ表します。
OR 値の意味は、x が x1 と x2 の値を取るときの y=1 と y=0 の比率を比較することです。 OR 値が 1 より大きい場合は、x1 が x2 よりも y=1 を引き起こす可能性が高いことを意味します。OR 値が 1 未満の場合は、x2 が x1 よりも y=1 を引き起こす可能性が高いことを意味します。 OR 値は 1 に等しく、x1 と x2 が y に同じ影響を与えることを意味します。
ロジスティック回帰では、通常、最尤法を使用してモデルのパラメーターを推定します。 , そのため、各独立変数の係数を取得します。係数を取得したら、OR 値を使用して、従属変数に対する各独立変数の影響を測定できます。具体的には、各独立変数の係数にインデックスを付けて、OR 値の推定値を取得できます。つまり、
\hat{OR}=\exp(\hat{\ beta} )
このうち、\hat{\beta} は各独立変数の係数推定値を表します。上記の OR 値の定義に従って、次のように書き換えることができます:
\hat{OR}=\frac{P(y=1|x=x1)}{P( y =0|x=x1)}\div\frac{P(y=1|x=x2)}{P(y=0|x=x2)}=\exp(\hat{\beta}\cdot\ Delta x)
このうち、\Delta x は独立変数 x1 と x2 の差を表します。上の式からわかるように、独立変数 x1 が x2 より 1 単位大きい場合、OR 値は \exp(\hat{\beta}) で乗算されます。つまり、x1 が x2 に与える影響は次のとおりです。 y=1 の確率は x2 より \exp(\hat{\beta}) 倍増加します。同様に、独立変数 x1 が x2 より 1 単位小さい場合、OR 値は \exp(\hat{\beta}) で除算されます。つまり、y=1 の確率に対する x1 の影響は小さくなります。 x2\exp (\hat{\beta}) 倍よりも。
ロジスティック回帰では、OR 値のサイズと方向は、結果に対する各独立変数の影響の程度と方向を理解するのに役立ちます。たとえば、OR 値が 1 より大きい場合、独立変数が y=1 の確率にプラスの影響を与えることを意味し、OR 値が 1 未満の場合、独立変数が y=1 の確率にマイナスの影響を与えることを意味します。 y=1 の確率; OR 値が 1 に等しい場合、y に対する独立変数の影響が重要ではないことを意味します。さらに、95% 信頼区間を計算することで、OR 値の信頼性を評価することもできます。
つまり、OR 値は、従属変数に対する独立変数の影響を測定するロジスティック回帰における重要な指標です。 OR 値を計算することで、結果に対する各独立変数の影響の方向や程度を把握することができ、信頼区間を計算することでその信頼性を評価することができます。
以上がロジスティック回帰におけるOR値の定義・意味・計算方法を詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。