検索
ホームページテクノロジー周辺機器AI教師あり学習と教師なし学習: 専門家がギャップを定義

教師あり学習と教師なし学習: 専門家がギャップを定義

Nov 23, 2023 pm 06:09 PM
AI教師なし学習教師あり学習

書き直す必要があるのは、教師あり学習、教師なし学習、半教師あり学習の特性と、それらが機械学習プロジェクトにどのように適用されるかを理解することです。

教師あり学習と教師なし学習: 専門家がギャップを定義

##人工知能テクノロジーについて議論するとき、教師あり学習は、通常、人工知能モデル作成の最後のステップであり、画像認識、より良い予測、側面に使用できるため、最も注目を集める方法です。

対照的に、教師なし学習は、AI 開発ライフサイクルの初期段階で舞台裏で機能する傾向があります。多くの場合、教師あり学習の基礎を提供するために使用されます。マネージャーが輝けるようになるための地味な仕事と同じように、魔法は基礎を築くために展開されます。後で説明するように、どちらの機械学習モデルもビジネス上の問題に効果的に適用できます。

技術レベルでは、教師あり学習と教師なし学習の違いは、アルゴリズムの作成に使用される生データが事前にラベル付けされているかどうか (教師あり学習)、またはそうでない (教師なし学習) です。

始めましょう

教師あり学習とは何ですか?

#教師あり学習では、データ サイエンティストはラベル付きトレーニング データをアルゴリズムに提供し、アルゴリズムに関連性を評価してもらいたい変数を定義します。

##アルゴリズムの入力データと出力変数はトレーニング データを通じて指定されます。たとえば、教師あり学習を使用して画像に猫が含まれているかどうかを判断するアルゴリズムをトレーニングする場合、トレーニング データで使用される画像ごとにラベルを作成して、画像に猫が含まれているかどうかを示すことができます

教師あり学習の定義で説明しているように、「[A] コンピューター アルゴリズムは、特定の出力用にラベル付けされた入力データでトレーニングされます。モデルは、基礎となるパターンと入力データと入力データ間の関係を検出できるようになるまでトレーニングされます。出力ラベルを使用すると、これまでに見たことのないデータを提示するときに正確なラベル付け結果を生成できます。教師ありアルゴリズムの一般的なタイプには、分類、デシジョン ツリー、回帰、予測モデリングが含まれます。これについては、Arcitura Education の機械学習チュートリアルで学習できます。

教師あり機械学習手法は、

  • パーソナライズド マーケティングなど、さまざまなビジネス アプリケーションで使用されています。
  • #保険/信用引受に関する決定。
  • 不正行為の検出。
  • #スパム フィルタリング。
  • 教師なし学習とは何ですか?

教師なし学習では、この方法に適したアルゴリズム (K 平均法クラスタリングなど) があり、ラベルのないデータをトレーニングします。アルゴリズムはデータセットをスキャンして、データセット内の意味のある関連性を探します。言い換えれば、教師なし学習はパターンを識別します外部の測定値と相関させるのではなく、データ内の類似点を特定します

このアプローチは、探しているものがわからない場合には便利ですが、探しているものがわかっている場合にはあまり役に立ちません。教師なしアルゴリズムに数千または数百万の画像を表示すると、画像のサブセットが人間が猫として識別するものとして分類される可能性があります。対照的に、猫と犬のラベル付きデータで訓練された教師ありアルゴリズムは、高い信頼度を達成でき、正確に判断できます。ただし、このアプローチにはトレードオフが伴います: 教師あり学習プロジェクトでモデルを開発するために何百万ものラベル付き画像が必要な場合、機械生成の予測には多大な人間の労力が必要です。

中間点があります: 半教師あり学習です。

半教師あり学習とは何ですか?

半教師あり学習とは、教師なし学習と教師あり学習の組み合わせ学習を組み合わせる効果的な方法です。教師なし学習アルゴリズムを使用して、特定のワークフローを通じて自動的にラベルを生成し、そのラベルを教師あり学習アルゴリズムに入力します。この方法では、人間が手動でいくつかの画像にラベルを付けます。 、教師なし学習中、アルゴリズムは他の画像のラベルを推測し、最終的にすべてのラベルと画像を教師あり学習アルゴリズムに入力して AI モデルを作成します

半教師あり学習の利点の 1 つは次のとおりです。機械学習のコストを削減できるということ 予測精度を大幅に向上させるために 2020 タグで大規模なデータセットを使用するコスト

#

教師あり学習と教師なし学習: 専門家がギャップを定義

#強化学習とは何ですか?

#もう 1 つの機械学習手法は強化学習です。強化学習は通常、一連のステップを完了するように機械に教えるために使用され、教師あり学習や教師なし学習とは異なります。データ サイエンティストは、タスクを実行するアルゴリズムをプログラムし、タスクの完了方法を決定する際に肯定的または否定的な合図や補強を与えます。プログラマーは報酬のルールを設定しますが、タスクを完了するために報酬を最大化するために必要な手順はアルゴリズムに決定させます。

教師あり学習と教師なし学習のどちらを使用すべきか?

LinkedIn の機械学習マネージャーである Shivani Rao 氏は、教師ありまたは教師なしの機械学習アプローチを採用するためのベスト プラクティスは、多くの場合、環境、データとアプリケーションに関して立てられる仮定に依存すると述べています。 。

教師あり機械学習アルゴリズムと教師なし機械学習アルゴリズムのどちらを使用するかの選択も、時間の経過とともに変化するとラオ氏は述べています。モデル構築プロセスの初期段階ではデータにラベルが付けられていないことがよくありますが、モデリングの後の段階ではラベル付きデータが出現する可能性があります。

たとえば、LinkedIn メンバーがコースビデオを視聴するかどうかを予測する問題では、最初のモデルは教師なし手法を使用します。これらの提案が提供されると、誰かがその提案をクリックしたかどうかを記録する指標によって、タグを生成するための新しいデータが提供されます。

LinkedIn では、この手法を使用して、学生が習得したいと思われるスキルにタグを付けることもできます。 . オンラインコース。著者、出版社、学生などの人間のタグ付け者は、コースで教えられるスキルの正確かつ正確なリストを提供できますが、そのようなスキルの完全なリストを提供する可能性は低いです。したがって、これらのデータ ラベルは不完全であると考えることができます。このようなタイプの問題では、半教師あり手法を使用して、より網羅的なラベルのセットを構築できます。

データ サイエンスと高度な分析の専門家であり、コンサルティング会社カーニーのパートナーであるバラス トータ氏は、彼のチームは教師あり学習を使用することを選択した、または教師なし学習を行う場合、実践的な要素が考慮されることが多いと述べました。考慮に入れます。

Thota 氏は次のように述べています。「将来の観測を予測または分類するという目的で、利用可能なラベル付きデータがある場合、アプリケーションとして教師あり学習を選択します。利用可能なラベル付きデータがない場合は、 「教師なし学習であり、目標はデータからパターンや断片を特定して戦略を開発することです。」カルブ氏は、Alation のデータ サイエンティストはさまざまなアプリケーション プログラムで教師なし学習を内部で使用していると述べました。たとえば、彼らは、あいまいなデータ オブジェクト名を人間の言語に翻訳するための人間と機械の共同プロセスを開発しました。たとえば、「na_gr_rvnu_ps」を「北米のプロフェッショナル サービスの総収益」に変換します。この場合、機械が推測し、人間が確認し、機械学習が行われます。

#「これは、反復ループでの半教師あり学習と考えることができ、精度が向上するという好循環が生まれます。」カルブ言った。

5 教師なし学習テクニック

高レベルでは、教師あり学習テクニックは線形回帰 (グループ データへのモデルの適合) に焦点を当てる傾向があります。予測を行うためのポイント)や分類問題(画像には猫がいますか?

教師なし学習手法では、教師を補うために元のデータセットをスライスおよびダイシングする複数の方法がよく使用されます。学習はこれらの分野で機能します。

データ クラスタリング。

同様の特性を持つデータ ポイントがグループ化され、データをより効果的に理解して探索できるようになります。たとえば、企業はデータを使用します。人口統計、興味、購買行動、その他の要因に基づいて顧客をグループに分類するクラスタリング手法。

次元削減。データセット内の各変数は次のように扱われます。別の次元です。ただし、多くのモデルは、変数間の特定の関係を分析することでより適切に機能します。次元削減の簡単な例は、収益を 1 つの次元として使用することです。これは、収入から支出を差し引いた 2 つの別の次元を表します。ただし、新しい、より複雑な変数タイプは、主成分分析、オートエンコーダー、テキストをベクトルに変換するアルゴリズム、T 分布確率的近傍埋め込みなどのアルゴリズムを使用して生成できます。次元削減は、モデルが適切に機能する過学習の問題を軽減するのに役立ちます。データ セットは小さいですが、新しいデータには一般化できません。この技術を使用すると、企業は 2D または 3D フォームでモデルをモデル化し、人間が容易に理解できる高次元データを視覚化することもできます。 ## 異常または外れ値の検出。

教師なし学習は、通常のデータ分布から外れたデータ ポイントを特定するのに役立ちます。データ準備ステップとして異常を特定して削除すると、機械学習モデルのパフォーマンスが向上する可能性があります。

転移学習。 これらのアルゴリズムは、関連する異なるタスクでトレーニングされたモデルを利用します。たとえば、転移学習技術を使用すると、ウィキペディアの記事でトレーニングされた分類器を簡単に微調整して、あらゆるタイプの新しいテキストに正しいトピックのラベルを付けることができます。 LinkedIn の Rao 氏は、これがラベルのないデータの問題を解決する最も効果的かつ迅速な方法の 1 つであると述べています。

#グラフベースのアルゴリズム。 これらの技術は、データポイント間の関係を捉えるグラフを構築しようとしている、とラオ氏は言いました。たとえば、各データ ポイントがスキルを持つ LinkedIn メンバーを表す場合、エッジがメンバー間のスキルの重複を表すグラフを使用してメンバーを表すことができます。グラフ アルゴリズムは、既知のデータ ポイントから未知だが密接に関連しているデータ ポイントにラベルを転送するのにも役立ちます。教師なし学習を使用して、さまざまなタイプのエンティティ (ソースとターゲット) 間のグラフを構築することもできます。エッジが強いほど、ターゲット ノードに対するソース ノードの親和性が高くなります。たとえば、LinkedIn は、スキルベースのコースを持つメンバーをマッチングするためにこれらを使用します。

以上が教師あり学習と教師なし学習: 専門家がギャップを定義の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
10生成AIコーディング拡張機能とコードのコードを探る必要があります10生成AIコーディング拡張機能とコードのコードを探る必要がありますApr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

革新を調理する:人工知能がフードサービスを変革する方法革新を調理する:人工知能がフードサービスを変革する方法Apr 12, 2025 pm 12:09 PM

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

Pythonネームスペースと可変スコープに関する包括的なガイドPythonネームスペースと可変スコープに関する包括的なガイドApr 12, 2025 pm 12:00 PM

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

ビジョン言語モデル(VLM)の包括的なガイドビジョン言語モデル(VLM)の包括的なガイドApr 12, 2025 am 11:58 AM

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

MediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますMediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますApr 12, 2025 am 11:52 AM

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

今週のAIで:Walmartがファッションのトレンドを設定する前に設定します今週のAIで:Walmartがファッションのトレンドを設定する前に設定しますApr 12, 2025 am 11:51 AM

#1 GoogleはAgent2Agentを起動しました 物語:月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

生成AIは精神障害に会います生成AIは精神障害に会いますApr 12, 2025 am 11:50 AM

私はあなたがそうであるに違いないと思います。 私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

プロトタイプ:科学者は紙をプラスチックに変えますプロトタイプ:科学者は紙をプラスチックに変えますApr 12, 2025 am 11:49 AM

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5%のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。 しかし、助けが近づいています。エンジンのチーム

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール