Pythonでの機械学習の紹介

William Shakespeare
William Shakespeareオリジナル
2025-02-27 11:18:20990ブラウズ

機械学習とは、コンピューターに明示的にプログラミングすることなく学習する能力を提供する行為です。これは、データをコンピューターに提供し、データを決定モデルに変換してから将来の予測に使用することによって行われます。

このチュートリアルでは、機械学習と機械学習を開始するために必要な基本的な概念について説明します。また、特定の要素またはイベントを予測するためにいくつかのPythonの例を考案します。

機械学習の紹介

機械学習は、経験から学ぶことを目的とするテクノロジーの一種です。たとえば、人間として、他の人がチェスをしていることを観察することで、チェスをする方法を学ぶことができます。同様に、コンピューターは、将来の要素や条件を学習し、その後の条件を予測できるデータを提供することでプログラムされます。たとえば、特定のタイプの果物がオレンジ色かレモンかを知ることができるプログラムを書きたいと考えてみましょう。このようなプログラムを簡単に作成することができ、必要な結果が得られるかもしれませんが、プログラムが大規模なデータセットで効果的に機能しないこともあることがあります。これは機械学習が行われる場所です。

機械学習に関係するさまざまな手順があります。予測

    機械学習はさまざまな種類のアルゴリズムを使用してパターンを見つけます。これらのアルゴリズムは2つのグループに分類されます。その後、コンピューターはそれから学習し、学習したデータに基づいて将来のデータセットを予測できます。たとえば、コンピューターをトレーニングして過去の情報に基づいてスパムメッセージをフィルタリングできます。 Facebook、特定の説明に基づいて画像を検索します。写真の内容を説明する言葉でFacebookで画像を検索できるようになりました。ソーシャルネットワーキングサイトにはすでにキャプション画像のデータベースがあるため、ある程度の正確さで写真から説明を検索して一致させることができます。
  • 決定木
  • サポートベクターマシン
  • ナイーブベイズ
  • k-nearest Neighbor
  • 線形回帰
Sklearnは、NumpyおよびScipy Librariesともよく相互操作します。いくつかの依存関係が必要です:

python(> = 3.6)、

numpy(minバージョン1.17.3)

scipy(minバージョン1.3.2)

    Sklearnが適切に実行されているかどうかをテストするには、次のようにPythonインタープリターからインポートするだけです。私たちは異なる動物を区別できるようにしたいと思っています。したがって、特定の動物が馬か鶏のいずれかであるかを具体的に伝えることができるアルゴリズムを設計します。いくつかのサンプルデータを以下の表に示します。
  • 動物を分類するために使用する機能を定義します。鶏肉は0で表され、馬は1で表されます。

次に、決定ツリーに基づいている分類子を定義します。高さ7インチ、重量0.6 kg、温度41の動物を予測する方法は次のとおりです。これは、38インチの高さ、体重600 kg、温度37.5:

pip install -U scikit-learn<br>

の温度38インチの動物を予測する方法です。このデータの知識は、新しい動物のテストに使用されます。

大規模なデータセットでの線形回帰

 Python 3.9.12 (main, Apr  5 2022, 06:56:58) <br>[GCC 7.5.0] :: Anaconda, Inc. on linux<br>Type "help", "copyright", "credits" or "license" for more information.<br>>>> import sklearn<br>>>> <br>
2番目の例では、はるかに大きなデータセットを使用して線形回帰を実行します。 

Wikipediaによると:

統計において、

線形回帰
from sklearn import tree<br>
は、スカラー応答と1つ以上の説明変数(従属変数と独立変数としても知られる)の関係をモデル化するための線形アプローチです。

データセットはここにあります。 csvファイルをワーキングディレクトリにダウンロードします

必要な依存関係をインポートすることから始めましょう。次に、CSVデータをパンダデータフレームにロードします。出力:

pip install -U scikit-learn<br>

上記のように、データには1960年から2016年までのさまざまな国のGDPが含まれています。次のステップは、xおよびy次元の配列を作成することです。モデル。

 Python 3.9.12 (main, Apr  5 2022, 06:56:58) <br>[GCC 7.5.0] :: Anaconda, Inc. on linux<br>Type "help", "copyright", "credits" or "license" for more information.<br>>>> import sklearn<br>>>> <br>

ここにプロットは次のとおりです。その後、マシンは、入力データと予測したい他のデータとの関係を見つけることができます。トレーニングするデータを備えたマシンを提示する監視された学習とは異なり、監視されていない学習は、コンピューターに異なるデータセット間のパターンまたは関係を見つけさせることを目的としています。データは本質的に。たとえば、消費者のショッピング習慣を分類し、消費者の購入とショッピング習慣に基づいて消費者をターゲットにすることで広告にデータを使用できます。このタイプの学習は、動機付け、架空の、または教育書にかかわらず、著者またはカテゴリに基づいた本の関連付けに適用できます。機械学習を始めるのに役立ちました。これは単なる紹介です。マシン学習には多くのカバーがあり、これは機械学習ができることのほんの一部です。 Sklearnは、機械学習で使用されるライブラリの1つにすぎません。他のライブラリには、TensorflowとKerasが含まれます。 

さらに、私たちが販売されているものを見て、envato市場で研究するために躊躇しないでください。
from sklearn import tree<br>

監視済みまたは監督されていない機械学習アルゴリズムのいずれかを使用するという決定は、データの構造やサイズなど、さまざまな要因に依存します。詐欺防止では、ソーシャルメディアサイトでニュースフィードをパーソナライズして、ユーザーの好み、電子メールとマルウェアのフィルタリング、気象予測、さらには消費者のショッピング習慣を予測するための電子商取引セクターでさえ。

以上がPythonでの機械学習の紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。