ホームページ > 記事 > テクノロジー周辺機器 > 機械学習のライフサイクルのステップについて話しましょう
過去数年間、機械学習について考えてきたのはあなただけではありません。これは大規模なビジネスであり、企業の業績に重大な影響を与える可能性があり、切望されている競争上の優位性をもたらします。
統計がこれを証明しています。たとえば、Markets and Markets によると、世界の ML 市場は 2027 年までに 1,150 億ドル以上の価値があると予想されており、AI と ML の進歩により、2019 年から 2030 年にかけて世界の GDP は 14% 増加すると予想されています。さらに、Netflix は機械学習を使用することで 10 億ドルを節約できたと述べています。 ML が不可欠な理由がわかったので、ML ライフサイクルの 7 つのステップについて説明する前に、機械学習とは正確には何なのかを簡単に確認しましょう。
機械学習は人工知能のサブセットであり、データ、アルゴリズム、人工知能を使用して人間の学習方法を模倣し、時間の経過とともに徐々に精度を向上させることを目的としています。
たとえば、Netflix は機械学習を使用して推奨アルゴリズムを強化し、アクセスできる膨大な量の視聴データを活用し、その数値を計算して、他の同様のユーザーが楽しんだコンテンツを人々に表示します。
機械学習が機能するには、強力なモデルと大量のデータへのアクセスが必要です。ほとんどの ML アルゴリズムは、入力情報のフラッドゲートにもアクセスできるため、より多くのデータが入力されるほど、パフォーマンスが向上します。
機械学習には、パーソナライズされたヘルスケアの提供から自動運転車やスマートシティの実現に至るまで、多くの潜在的な用途があります。機械学習はあらゆる業界に応用できるため、問題はあなたの会社が機械学習から恩恵を受けることができるかどうかではなく、あなたの専門分野で最初にそれを実現できるかどうかです。
さあ、機械学習のライフサイクルを見てみましょう。これには 7 つのステップがあり、最初の数ステップが最も集中するので、最後まで続けてください。
あらゆる ML アクティビティの最初のステップは、データの収集を開始することです。結局のところ、データがなければ、機械学習モデルは何も処理できません。データ収集はさらに 3 つの段階に分類できます:
データの収集を開始する前に、データの取得元を知る必要があります。構築しているモデルの種類に応じて、独自のデータを操作したり、(ソーシャル ネットワーキング サイトなどを介して) 公開データにアクセスしたり、あるいはその両方を行うことになる場合があります。また、明示的なデータ (ユーザーによって具体的に提供される) が必要か、それとも暗黙的なデータ (ユーザーの閲覧習慣やアクティビティに基づいて特定される) が必要かを検討する価値があります。
データ ソースとキャプチャするデータの種類がわかったので、次のステップはデータの収集を開始することです。
適切なデータを適切なソースから確実に収集する必要があり、ここで前のステップが役に立ちます。データの整理については後で行うので、心配する必要はありません。
次のステップは、収集したデータをワークフローと統合し、最終的には機械学習モデルと統合することです。これは、独自のデータベースにデータをインポートすること、または API を使用してサードパーティ ソースからの自動データ フィードを設定することを意味する場合があります。
データ ソースを特定し、収集してシステムに統合したので、次のステップは、モデルを開始できるようにデータを準備することです。それを使って。このプロセスには 4 つのステップがあります:
まず、手持ちのデータを調べて、そのデータがどの程度完成しているのか、どの程度の作業が必要なのかを理解する必要があります。あなたの使用のためにそれを機能させるために。
ここでは、アルゴリズムに向けてすべての準備が整っていることを確認するために、次の 2 つのステップで実行するアプローチを決定します。
前処理には、存在する可能性のある書式設定をクリーンアップし、空白のエントリやその他の異常な要素をデータから削除することが含まれます。
ここで話しているのは、単一のエントリに焦点を当てるのではなく、データ セット全体に対して実行してさらなる処理の準備をするための操作についてです。
これらを使用して、個人の記録を処理できます。データ ラングリングでは、会社が処理できるように、所有するデータを手動で調べ、更新する必要があるデータを更新する必要があります。
ここでは、データを読みやすく、構築するモデルの処理を容易にするためにデータに変更を加えることができます。
これまでのところ、データは非常に良好な状態になっているはずなので、次のステップでは、手持ちのデータを詳しく調べて分析し、どのように対処するかを決定します。それを処理してモデルを構築します。
データを整理し、どのようなデータがあるかを詳しく調べたので、次のステップでは、モデルを選択して開始できるようにします。そのデータを処理し、最終的な目標に向かって取り組みます。
モデルの選択にはさまざまなオプションがあるため、利用可能なものを調べて、ニーズに最適なアドバイスを提供できる開発者を見つけることが最善の策です。
モデルを選択したので、次のステップはモデルの開発を開始し、トレーニングを開始できるように手持ちのデータをモデルに供給することです。
モデルのトレーニングについて話すとき、それは機械学習アルゴリズムが自ら学習することで機能するためです。
犬や猫がどのようなものかを教える代わりに、犬や猫に関する大量のラベル付きデータを与え、モデルをトレーニングして独自の結論を導き出します。
テストと評価を通じて、モデルを微調整し、確実にモデルを調整するためにどのような変更を加える必要があるかを明確に理解できるようになりました。目標の達成にさらに役立ちます。
提供したデータでモデル自体がトレーニングされると、テストを開始して、設定した目標を達成するかどうかの評価を開始できます。
テストは評価の重要な部分であり、物事が機能しているかどうかを判断するのに役立つため、テストと評価は密接に関連しています。テストが完了したら、次のステップに進むことができます。
最後のステップ 7 に進む準備ができるまで、ステップ 5 と 6 を順番に何度も繰り返すことができます。
評価、テスト、微調整が完了したので、モデルをリアルタイムにデプロイする準備が整いました。
これをデプロイすると、アクセスできるデータを使用して予測と実行を開始でき、それに応じて意思決定を行うことができるようになります。
また、いつでも戻ってさらに微調整したり、新しいデータ ソースを追加したりすることもできるので、ライブだからといってビルドが完了したと考えないでください。
機械学習が私たちに示したことが 1 つあるとすれば、それは常に改善の余地があるということです。
機械学習の開始方法がわかったので、社内に機械学習を導入して次のステップに進むことができます。
以上が機械学習のライフサイクルのステップについて話しましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。