ホームページ  >  記事  >  テクノロジー周辺機器  >  初心者レベルの機械学習に必要なアルゴリズムは何ですか?

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

PHPz
PHPz転載
2023-05-02 20:19:05814ブラウズ

K 最近傍アルゴリズム

k 最近傍アルゴリズムとは何ですか?

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

# は、近隣のカテゴリに基づいてカテゴリを推測することです。

コンセプト :

K 最近傍アルゴリズムは、KNN アルゴリズムとも呼ばれ、機械学習では比較的古典的なアルゴリズムであり、一般に KNN アルゴリズムは比較的理解しやすいアルゴリズムです。

定義

サンプルが k 個の最も類似した (つまり、特徴空間内の最近傍の) サンプルの中で最大である場合、特徴空間 それらのほとんどが特定のカテゴリに属する​​場合、サンプルもこのカテゴリに属します。

#出典: KNN アルゴリズムは、Cover と Hart によって分類アルゴリズムとして最初に提案されました

距離公式

2 つのサンプル間の距離は、ユークリッド距離とも呼ばれる次の式で計算できます。距離の式については後で説明します

線形回帰

アプリケーション シナリオ用途: 住宅価格の予測、販売額の予測、ローン額の予測

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

#線形回帰とは何ですか?

(1) 定義と式

線形回帰は、回帰方程式 (関数) を使用して 1 つ以上の独立変数を予測することです。 (固有値) と従属変数 (ターゲット値) の間の関係をモデル化する方法。

特徴: 独立変数が 1 つだけある状況は単変量回帰と呼ばれ、独立変数が 2 つ以上ある状況は重回帰と呼ばれます。

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

線形回帰は、たとえば次のような行列で表されます。それで、どうやって理解しますか??いくつかの例を見てみましょう:

最終成績: 0.7×試験成績 0.3×日常成績

住宅価格 = 0.02×中心部の距離0.04×都市の一酸化窒素濃度 (-0.12×平均住宅価格) 0.254×都市犯罪率

上記 2 つの例では、特性値と目標値の関係がわかります。関係が成立しており、線形モデルとして理解できます。

ロジスティック回帰

ロジスティック回帰は、機械学習における分類モデルです。ロジスティック回帰は、分類アルゴリズムです。名前には回帰が含まれていますが、 。アルゴリズムの単純さと効率のため、実際に広く使用されています。

アプリケーション シナリオ: 広告のクリック率、スパムかどうか、病気かどうか、金融詐欺、偽アカウントかどうか。

ここで特徴を見つけることができます。つまり、両方のカテゴリが判断に属しており、ロジスティック回帰は 2 分類問題を解決するための強力なツールです。

ロジスティック回帰をマスターするには、次の 2 つのポイントをマスターする必要があります。

ロジスティック回帰の入力値は何ですか?

ロジスティック回帰の出力をどのように判断するか?

#入力:

##アクティベーション関数: シグモイド関数

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

判定基準

初心者レベルの機械学習に必要なアルゴリズムは何ですか?回帰結果をシグモイド関数に入力し、結果を出力しますは: [ 区間 0, 1 の確率値]、デフォルトはしきい値として 0.5 です。

ロジスティック回帰の最終的な分類は、特定のカテゴリに属する​​確率値を通じて、特定のカテゴリに属する​​かどうかを判断するもので、このカテゴリはデフォルトで 1 (正の例) としてマークされ、その他のカテゴリはデフォルトでマークされます。カテゴリは 0 (負の例) としてマークされます)。 (損失計算に便利)

#出力結果の説明(重要): カテゴリ A とカテゴリ B の 2 つがあり、確率値がカテゴリ A( 1) 。ここで、ロジスティック回帰出力結果 0.55 へのサンプル入力があり、この確率値は 0.5 を超えます。これは、トレーニングまたは予測の結果が A(1) カテゴリであることを意味します。逆に、結果が 0.3 の場合、トレーニングまたは予測の結果は B(0) カテゴリになります。

ロジスティック回帰のしきい値は変更できます。たとえば、上記の例でしきい値を 0.6 に設定すると、出力結果は 0.55 となり、カテゴリ B に属します。

意思決定木のアルゴリズム

意思決定木の考え方の起源は非常に単純で、プログラミングにおける条件分岐構造は if-else 構造です。 . 最も初期のデシジョン ツリーは、このような構造を使用してデータを分割する分類学習手法です。

デシジョン ツリー: 内部の各ノードが属性の判断を表す木構造ですそれぞれの枝が判定結果の出力を表し、最後に各葉ノードが分類結果を表しており、本質的には複数の判定ノードから構成されるツリーです。

この文をどう理解しますか?会話例を通して

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

#上記のケースは、定性的主観意識によって年齢を最上位に置いた女性の場合、このプロセスは定量化する必要がありますが、どのように対処すればよいでしょうか?

現時点では、情報理論の知識、つまり情報エントロピーと情報ゲインを使用する必要があります。

#アンサンブル アルゴリズム

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

##アンサンブル学習は、複数のモデルを構築することで 1 つの予測問題を解決します。これは、複数の分類子/モデルを生成し、それぞれが個別に学習して予測を行うことによって機能します。これらの予測は最終的に結合されて、単一の分類予測よりも優れた複合予測になります。

#クラスタリング アルゴリズム

初心者レベルの機械学習に必要なアルゴリズムは何ですか?

##実用的なアプリケーション:

#Userポートレート、広告の推奨、データ セグメンテーション、検索エンジンのトラフィックの推奨、悪意のあるトラフィックの特定

位置情報に基づくビジネス プッシュ、ニュースのクラスタリング、フィルタリングと並べ替え。

画像の分割、次元削減、識別、外れ値の検出、クレジットカードの異常消費、同じ機能を持つ遺伝子断片の発見。

クラスタリング アルゴリズム:

典型的な教師なし学習アルゴリズム。主に、類似したサンプルをカテゴリに自動的に分類するために使用されます。

クラスタリング アルゴリズムでは、サンプル間の類似性に基づいてサンプルがさまざまなカテゴリに分類されます。類似度の計算方法が異なると、クラスタリングの結果も異なります。一般的に使用される類似度の計算方法には、ユークリッド距離が含まれます方法。

以上が初心者レベルの機械学習に必要なアルゴリズムは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。