ホームページ > 記事 > テクノロジー周辺機器 > 初心者レベルの機械学習に必要なアルゴリズムは何ですか?
k 最近傍アルゴリズムとは何ですか?
K 最近傍アルゴリズムは、KNN アルゴリズムとも呼ばれ、機械学習では比較的古典的なアルゴリズムであり、一般に KNN アルゴリズムは比較的理解しやすいアルゴリズムです。
サンプルが k 個の最も類似した (つまり、特徴空間内の最近傍の) サンプルの中で最大である場合、特徴空間 それらのほとんどが特定のカテゴリに属する場合、サンプルもこのカテゴリに属します。
#出典: KNN アルゴリズムは、Cover と Hart によって分類アルゴリズムとして最初に提案されました距離公式
線形回帰
アプリケーション シナリオ用途: 住宅価格の予測、販売額の予測、ローン額の予測#線形回帰とは何ですか?
(1) 定義と式
特徴: 独立変数が 1 つだけある状況は単変量回帰と呼ばれ、独立変数が 2 つ以上ある状況は重回帰と呼ばれます。
線形回帰は、たとえば次のような行列で表されます。それで、どうやって理解しますか??いくつかの例を見てみましょう:
最終成績: 0.7×試験成績 0.3×日常成績
住宅価格 = 0.02×中心部の距離0.04×都市の一酸化窒素濃度 (-0.12×平均住宅価格) 0.254×都市犯罪率
上記 2 つの例では、特性値と目標値の関係がわかります。関係が成立しており、線形モデルとして理解できます。
ロジスティック回帰
ロジスティック回帰は、機械学習における分類モデルです。ロジスティック回帰は、分類アルゴリズムです。名前には回帰が含まれていますが、 。アルゴリズムの単純さと効率のため、実際に広く使用されています。
ここで特徴を見つけることができます。つまり、両方のカテゴリが判断に属しており、ロジスティック回帰は 2 分類問題を解決するための強力なツールです。
ロジスティック回帰をマスターするには、次の 2 つのポイントをマスターする必要があります。
ロジスティック回帰の入力値は何ですか?
ロジスティック回帰の出力をどのように判断するか?
#入力:
##アクティベーション関数: シグモイド関数
判定基準
回帰結果をシグモイド関数に入力し、結果を出力しますは: [ 区間 0, 1 の確率値]、デフォルトはしきい値として 0.5 です。
ロジスティック回帰の最終的な分類は、特定のカテゴリに属する確率値を通じて、特定のカテゴリに属するかどうかを判断するもので、このカテゴリはデフォルトで 1 (正の例) としてマークされ、その他のカテゴリはデフォルトでマークされます。カテゴリは 0 (負の例) としてマークされます)。 (損失計算に便利)
#出力結果の説明(重要): カテゴリ A とカテゴリ B の 2 つがあり、確率値がカテゴリ A( 1) 。ここで、ロジスティック回帰出力結果 0.55 へのサンプル入力があり、この確率値は 0.5 を超えます。これは、トレーニングまたは予測の結果が A(1) カテゴリであることを意味します。逆に、結果が 0.3 の場合、トレーニングまたは予測の結果は B(0) カテゴリになります。
ロジスティック回帰のしきい値は変更できます。たとえば、上記の例でしきい値を 0.6 に設定すると、出力結果は 0.55 となり、カテゴリ B に属します。
意思決定木の考え方の起源は非常に単純で、プログラミングにおける条件分岐構造は if-else 構造です。 . 最も初期のデシジョン ツリーは、このような構造を使用してデータを分割する分類学習手法です。
デシジョン ツリー: 内部の各ノードが属性の判断を表す木構造ですそれぞれの枝が判定結果の出力を表し、最後に各葉ノードが分類結果を表しており、本質的には複数の判定ノードから構成されるツリーです。
この文をどう理解しますか?会話例を通して
#上記のケースは、定性的主観意識によって年齢を最上位に置いた女性の場合、このプロセスは定量化する必要がありますが、どのように対処すればよいでしょうか?
現時点では、情報理論の知識、つまり情報エントロピーと情報ゲインを使用する必要があります。
#アンサンブル アルゴリズム ##アンサンブル学習は、複数のモデルを構築することで 1 つの予測問題を解決します。これは、複数の分類子/モデルを生成し、それぞれが個別に学習して予測を行うことによって機能します。これらの予測は最終的に結合されて、単一の分類予測よりも優れた複合予測になります。#クラスタリング アルゴリズム
##実用的なアプリケーション:位置情報に基づくビジネス プッシュ、ニュースのクラスタリング、フィルタリングと並べ替え。
画像の分割、次元削減、識別、外れ値の検出、クレジットカードの異常消費、同じ機能を持つ遺伝子断片の発見。
クラスタリング アルゴリズム:
クラスタリング アルゴリズムでは、サンプル間の類似性に基づいてサンプルがさまざまなカテゴリに分類されます。類似度の計算方法が異なると、クラスタリングの結果も異なります。一般的に使用される類似度の計算方法には、ユークリッド距離が含まれます方法。
以上が初心者レベルの機械学習に必要なアルゴリズムは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。