翻訳者 | Zhu Xianzhong
査読者 | Sun Shujuan
はじめに
今日、データ サイエンスはデジタル ツイン (デジタル ツイン)、つまりデジタル ツインを作成するために広く使用されています。現実世界の物理システムまたはプロセスのデジタル版であり、入力動作のシミュレーションと予測、監視、メンテナンス、計画などに使用できます。コグニティブ カスタマー サービス ボットなどのデジタル ツインは日常的なアプリケーションで一般的ですが、この記事では、業界のツイン データ サイエンス テクノロジにおける 2 つの異なるタイプのデジタル ツインを示し、モデリングのために 2 つの異なるタイプを比較します。
この記事で説明するデジタル ツインの 2 つの広く使用されているデータ サイエンス分野は次のとおりです:
a) 診断分析と予測分析: この分析方法では、A シリーズが与えられているとします。デジタルツインが原因を診断したり、システムの将来の動作を予測したりするために使用される入力の数。 IoT ベースの機械学習モデルは、スマートなマシンや工場を構築するために使用されます。このモデルにより、センサー入力をリアルタイムで分析して、将来の問題や障害が発生する前に診断、予測、防止することができます。
b) 規範的分析: この分析方法はネットワーク全体をシミュレートするため、遵守すべき一連の変数と制約を考慮して、多数のソリューションの中から最適なソリューションまたは実現可能なソリューションを決定します。通常、スループット、使用率、生産量などの定められたビジネス目標を最大化することを目的としています。これらの最適化問題は、物流プロバイダーが納期厳守を最大化するためにリソース (車両、人員) のスケジュールを作成する場合や、メーカーがスケジュールを作成する場合など、サプライ チェーンの計画とスケジューリングの分野で広く使用されています。機械とオペレーターの使用を最適化し、最大限の OTIF (On Time In Full) 納品を達成します。ここで使用されるデータ サイエンスの手法は、制約付き数学的最適化であり、強力なソルバーを使用して複雑な意思決定主導の問題を解決するアルゴリズムです。
要約すると、ML モデルは、履歴データに基づいて、特定の入力特徴セットに対して起こり得る結果を予測します。また、最適化モデルは、予測された結果が発生した場合に、それをどのように解決/軽減/活用する計画を立てるかを決定するのに役立ちます。なぜなら、あなたのビジネスには、限られたリソースの中で追求することを選択する可能性のある競合する可能性のある目標がいくつかあるからです。
データ サイエンスのこれら 2 つの分野は、一部のツール (Python ライブラリなど) を共有していますが、まったく異なるスキル セットを備えたデータ サイエンティストを動員しています。多くの場合、異なる考え方やビジネス問題のモデル化方法が必要です。したがって、あるドメインで経験を積んだデータ サイエンティストが、別のドメインで適用できる可能性のあるスキルやテクニックを理解し、相互利用できるように、関連する手法を理解して比較してみましょう。
デジタル ツイン モデルの適用ケース
比較のために、ML ベースの実稼働根本原因分析 (RCA: Root Cause Analysis) プロセスのツイン モデルを考えてみましょう。その目的は次のとおりです。完成品を診断するか、製造中に発見された欠陥や異常の根本原因を診断します。これにより、部門管理者はツールの予測に基づいて最も可能性の高い根本原因を排除し、最終的に問題を特定してCAPA(Corrective & Preventive action:是正措置と予防措置)を実行し、多くの人手を費やすことなくすべての機械保守記録を迅速に閲覧できるようになります。, オペレーター履歴記録、プロセスSOP(Standard Operation Procedure:標準作業手順書)、IoTセンサー入力など目標は、機械のダウンタイムと生産損失を最小限に抑え、リソースの利用率を向上させることです。
技術的には、これは複数カテゴリの分類問題と考えることができます。この問題では、特定の欠陥が存在すると仮定して、モデルは、機械関連、オペレーター関連、プロセス指示関連、原材料関連、などの考えられる一連の根本原因ラベルのそれぞれの確率を予測しようとします。これらの第 1 レベルの分類ラベルには、機械の校正、機械のメンテナンス、オペレーターのスキル、オペレーターのトレーニングなどの詳細な理由も含まれます。この状況に対する最適な解決策には、いくつかの複雑な ML モデルの評価が必要ですが、この記事の目的を強調するために、少し単純化してみましょう。これは多項ロジスティック回帰問題であると仮定します (理由は次のセクションで明らかになります)。
比較のために、生産計画プロセスの最適化されたツイン モデルを考えてみましょう。このモデルは、機械、オペレーター、プロセス ステップ、期間、原材料の到着スケジュール、期日などに基づいてスケジュールを生成します。生産高や収益などの目標を最大化します。このような自動化されたタイムラインは、組織が市場からの新たな機会 (新型コロナウイルス感染症による医薬品需要など) に対応するため、または原材料、サプライヤー、物流プロバイダー、顧客と市場の組み合わせの影響を最大化するためにリソースを迅速に調整するのに役立ちます。最近のサプライチェーンのボトルネックなど、予期せぬ出来事の影響を最小限に抑えます。
ビジネス上の問題をモデル化するための基本レベルでは、このようなデジタル ツインを開発するには次の要素を考慮する必要があります:
A. 入力機能またはディメンション
B. 入力データ— —これらの次元の値
C、入力から出力への変換ルール
D、出力またはターゲット
次に、機械学習をさらに詳しく分析して比較してみましょう(ML) を使用して、制約の下でモデル内のこれらの要素を最適化します:
A. 入力特徴: これらはシステム内のデータ ディメンションであり、ML と最適化の両方に適しています。生産プロセスの問題を診断しようとする ML モデルの場合、考慮すべき機能には、IoT 入力、機械保守データの履歴、オペレータのスキルとトレーニング情報、原材料の品質情報、従った SOP (標準作業手順)、およびその他のコンテンツが含まれます。 。
同様に、制約のある最適化環境では、考慮する必要がある特性には、機器の可用性、オペレーターの可用性、原材料の可用性、労働時間、生産性、スキルなどが含まれます。これらは、製品の開発に通常必要となります。最適生産計画機能。
B. 入力データ: これは、上記の 2 つの方法が大幅に異なる方法で固有値を使用する場所です。その中でも、ML モデルはトレーニングのために大量の履歴データを必要とします。ただし、多くの場合、データをモデルにフィードする前に、データの準備、管理、正規化に関連する多大な作業が必要になります。履歴は、実際に発生したイベント (不十分な出力をもたらした機械の故障やオペレーターのスキルの問題など) の記録ですが、通常は、これらの値がすべて考えられる単純な組み合わせではないことに注意することが重要です。特性が得られます。つまり、トランザクション履歴には、頻繁に発生するシナリオではより多くのレコードが含まれますが、他の一部のシナリオでは比較的少数のレコードが含まれます (まれに発生するシナリオではおそらく少なくなります)。モデルをトレーニングする目的は、トレーニング データに特徴値または特徴値の組み合わせがほとんどまたはまったくない場合でも、特徴と出力ラベルの間の関係を学習し、正確なラベルを予測することです。
一方、最適化手法の場合、特性値は通常、日数、バッチ、期限、日付ごとの原材料の入手可能性、メンテナンススケジュール、機械の切り替え時間、プロセスなどの実際のデータに維持されます。手順、オペレーターのスキルなど。 ML モデルとの主な違いは、入力データ処理では、マスター データの特徴値 (日数、スキル、マシン、オペレーター、プロセス タイプなど) の考えられるすべての有効な組み合わせに対してインデックス テーブルを生成して、リストを形成する必要があることです。実現可能な解決策の部分。たとえば、オペレータ A が週の初日にマシン M1 を使用して、プロセスのステップ 1 をスキル レベル S1 で実行するか、オペレータ B が週の 2 日目にマシン M1 を使用して、ステップ 1 をスキル レベル S2 で実行します。オペレーター、マシン、スキルレベル、日付などの考えられるすべての組み合わせについても、それらの組み合わせが過去に実際に発生したかどうかは関係ありません。これにより、非常に大規模な入力データ レコードのセットが最適化エンジンに提供されることになります。最適化モデルの目標は、目的の方程式を最大化 (または最小化) しながら、指定された制約を満たす固有値の特定の組み合わせを選択することです。
C. 入力から出力への変換ルール: これも 2 つの方法の大きな違いです。 ML モデルと最適化モデルはどちらも高度な数学理論に基づいていますが、最適化手法における複雑なビジネス問題の数学的モデリングとプログラミングには、通常、ML と比べてより多くの労力が必要であり、これについては次の概要で反映されます。
その理由は、ML では、scikit-learn などのオープンソース ライブラリ、Pytorch や Tensorflow などのフレームワーク、さらにはクラウド サービス プロバイダーの ML/深層学習モデルの助けを借りて、入力をこれには、最適なルール (重み、バイアス、活性化関数など) を導出するために損失を修正するタスクも含まれます。データ サイエンティストの主な責任は、入力特徴とその値の品質と完全性を保証することです。
これは、最適化メソッドの場合には当てはまりません。入力がどのように相互作用し、出力に変換されるかについてのルールは、詳細な方程式を使用して記述し、Gurobi、CPLEX などのソルバーに順番に入力する必要があるからです。最適な解決策または可能な解決策を見つけるため。さらに、ビジネス上の問題を数式として定式化するには、モデリング プロセスの相互関係を深く理解し、データ サイエンティストがビジネス アナリストと緊密に連携する必要があります。
以下では、問題のある RCA (根本原因分析) アプリケーションのロジスティック回帰モデルの概略図を使用してこれを説明します。
ロジスティック回帰 MLモデル
この場合、入力データに基づいて結果を生成するためのルール (Zᵢ) を計算するタスクは推定するモデルに任されており、データ サイエンティストは通常、明確に定義された混同行列を使用することに忙しいことに注意してください。 、RMSE およびその他の測定技術を視覚的にアプローチして、正確な予測を実現します。
これを、最適化手法を通じて生産計画が生成される方法と比較できます。
(I) 最初のステップは、計画プロセスをカプセル化するビジネス ルール (制約) を定義することです。 。
以下は生産計画の例です:
まず、いくつかの入力変数を定義します (その一部は目標を達成するために使用される決定変数になる可能性があります):
- Bᵦ,p,ᵢ——製品 p (製品テーブル内) のバッチ β (バッチ テーブル内) が i 日目にスケジュールされているかどうかを示すバイナリ変数。
- Oₒ,p,ᵢ - (演算子テーブル内の) インデックス o の演算子が i 日に製品 p のバッチを処理するようにスケジュールされているかどうかを示すバイナリ変数。
- Mm,p,ᵢ——(マシン テーブル内の) インデックス m を持つマシンが i でバッチを処理するようにスケジュールされているかどうかを示すバイナリ変数-日目 商品ページ
およびいくつかの係数:
- TOₒ,p - オペレーター o が製品 p のバッチを処理するのにかかる時間。
- TMm,p——マシン m が製品 p のバッチを処理するのにかかる時間。
- OAvₒ,ᵢ——i 日目にオペレーター インデックス o が使用できる時間数。
- MAvm,ᵢ——インデックス m のマシンが i 日に利用できる時間数。
この場合、いくつかの制約 (ルール) は以下を使用して実装できます:
a) プランでは、特定のバッチは 1 回だけ開始できます。
ここで、製品の各バッチについて、Bt はバッチの合計数、Pr は製品の合計数、D は計画の日数です。
b) 1 つの製品 オペレーターまたはマシンで 1 日に 1 回のみ起動できます。
各製品の毎日。ここで、Op はすべてのオペレーターのセット、Mc はすべてのマシンのセットです。
##c) バッチ (すべての製品) に費やされる合計時間は、その日に利用可能なオペレーターおよび機械の時間数を超えてはなりません。
各オペレーターには次の制約があります:
各マシンの毎日には次の制約があります:
d) オペレーターがスケジュールの最初の 5 日以内に製品のバッチを処理する場合、同じ製品の他のすべてのバッチを同じオペレーターに割り当てる必要があります。これにより、オペレーターの継続性と生産性が維持されます。
各事業者および各製品について、各日 d (6 日目以降) に次の制約が存在します。
上記は、プログラム 実際の生産スケジューリング シナリオのビジネス ルールを数式で形成するために記述された数百の制約のうちのいくつか。これらの制約は線形方程式 (より具体的には混合整数方程式) であることに注意してください。ただし、それらとロジスティック回帰 ML モデルの間の複雑さの違いは依然として非常に明白です。
(II) 制約が決定したら、出力ターゲットを定義する必要があります。 これは重要なステップであり、次のセクションで説明するように、複雑なプロセスになる可能性があります。
(III) 最後に、入力された決定変数、制約、および目的がソルバーに送信され、解決策 (スケジュール) が取得されます。
#最適化手法に基づいたデジタル ツインを説明する概略図は次のとおりです。
最適化モデル
D、出力または目標: ML モデルの場合、問題の種類 (分類、回帰、クラスタリング) に応じて、出力とその精度を測定するための指標を適切に確立することができます。入手可能な情報が豊富にあるため、この記事ではこれらの問題については詳しく説明しませんが、主要な CSP (AWS Sagemaker、Azure など) のような高度な自動化により、さまざまなモデルの出力を評価できることは注目に値します。 MLなど)。
最適化されたモデルが正しい出力を生成するかどうかを評価することは、より困難です。最適化モデルは、「目的」と呼ばれる計算式を最大化または最小化しようとすることによって機能します。制約と同様に、目標セクションは、ビジネスが達成しようとしている内容に基づいてデータ サイエンティストによって設計されます。より具体的には、これは、オプティマイザがその合計を最大化しようとする決定変数に報酬条件とペナルティ条件を付加することによって実現されます。現実の問題では、場合によっては矛盾する目標の間で適切なバランスを見つけるために、さまざまな目標に適切な重みを見つけるには多くの反復が必要です。
上記の生産スケジュールの例をさらに詳しく説明するには、次の 2 つの目標を設計することもできます:
a) スケジュールは事前にロードする必要があり、バッチはできるだけ早くスケジュールする必要があります。可能であり、プランの残りの容量はプランの最後にある必要があります。これを行うには、バッチに 1 日のペナルティを付加し、スケジュール内で毎日徐々にペナルティを増やします。
b) 一方、同じ製品のバッチをグループ化して、バッチが納期を守り、グループが 1 回の実行であれば、リソース (オペレーターとマシン) が部分的に最適に利用されるようにしたいとも考えています。機械の能力を超えないこと。したがって、バッチが小さなグループではなく大きなグループに配置されている場合に、より高いボーナス (したがって、以下の式の指数関数) を提供する Batch_group_bonus を定義します。今日開始される一部のバッチは、数日以内に利用可能になるさらに多くのバッチで開始され、スケジュールの早い段階で未達成のリソースが残る可能性があるため、これは以前の目標と交差する場合があることに注意することが重要です。
#ソルバーの動作方法に応じて、実際の実装ではバッチ グループ決定変数が必要になることがよくあります。ただし、これは次の概念を表しています:
ソルバーは目標を最大化します。つまり:
Objective=Batch_group_bonus Day_penalty
目標の上記 2 つのコンポーネントのうち、どれスケジュールの特定の日に大きな影響を与える方法は、重み W₁、W₂、およびスケジュールの日付に依存します。これは、日ペナルティ値がスケジュールの後半段階で徐々に大きくなる (i 値が高くなるほど) ためです。ある時点で日数ペナルティ値が Batch_group_bonus よりも大きい場合、計画ソルバーはバッチをスケジュールしないことが賢明であると判断します。したがって、計画にリソース キャパシティがある場合でも、ペナルティはゼロになります。正味マイナスのペナルティとなり、目標が最大化されます。これらの問題は、データ サイエンティストによってトラブルシューティングされ、解決される必要があります。
ML 手法と最適化手法の間の相対的な作業負荷の比較
上記の議論に基づいて、一般的に、最適化プロジェクトは ML プロジェクトよりも多くの労力を必要とすることが推測できます。最適化には、開発プロセスのほぼすべての段階で広範なデータ サイエンス作業が必要です。具体的な概要は次のとおりです:
a) 入力データ処理: ML と最適化では、これはデータ サイエンティストによって行われます。 ML データ処理には、関連する機能の選択、標準化、離散化などが必要です。テキストなどの非構造化データの場合、特徴抽出、トークン化などの NLP ベースの手法を含めることができます。現在、特徴の統計分析や PCA などの次元削減手法に使用できる複数の言語に基づくライブラリがあります。
最適化では、すべてのビジネスと計画に、モデルに組み込む必要のあるニュアンスがあります。最適化問題は履歴データを扱うのではなく、考えられるすべてのデータ変更と識別された特徴を、決定変数と制約が依存する必要があるインデックスに結合します。ただし、ML とは異なり、データ処理には多くの開発作業が必要です。
b) モデル開発: 上で述べたように、最適化ソリューションのモデルを定式化するには、データ サイエンティストとビジネス アナリストが制約と目標を定式化するために多大な労力を必要とします。ソルバーは数学的アルゴリズムを実行し、数百、場合によっては数千の方程式を同時に解いて解を見つけるという任務を負っていますが、ビジネスの背景はありません。
ML では、モデルのトレーニングが高度に自動化されており、アルゴリズムはオープンソース ライブラリ API としてパッケージ化されるか、クラウド サービス プロバイダーによってパッケージ化されます。ビジネス固有のデータに基づいた、非常に複雑な事前トレーニング済みのニューラル ネットワーク モデルにより、トレーニング タスクが最後の数層まで簡素化されます。 AWS Sagemaker Autopilot や Azure AutoML などのツールを使用すると、入力データの処理、特徴の選択、さまざまなモデルのトレーニングと評価、および出力生成のプロセス全体を自動化することもできます。
c) テストと出力処理: ML では、モデルの出力を最小限の処理で利用できます。結果の解釈可能性など、他の側面を導入するには多少の努力が必要な場合もありますが、一般に理解するのは簡単です (さまざまなラベルの確率など)。出力とエラーの視覚化にもある程度の労力が必要になる場合がありますが、入力処理に比べればそれほど大きなことではありません。
ここでも、最適化の問題では、進捗状況を評価するために、計画専門家の訓練された目による反復的な手動テストと検証が必要です。ソルバーは目的を最大化しようとしますが、これ自体はスケジュール品質の観点からはほとんど意味がありません。 ML とは異なり、しきい値を上回るか下回る目標値に、正しい計画が含まれているのか、間違った計画が含まれているのかを判断することはできません。スケジュールがビジネス目標と矛盾していることが判明した場合、その問題は制約、決定変数、または目的関数に関連している可能性があり、大規模で複雑なスケジュールの異常の原因を見つけるには慎重な分析が必要です。
さらに、考慮すべき点は、ソルバーの出力を人間が読める形式に解釈するために必要な開発です。ソルバーは、バッチ グループ インデックス、バッチ優先順位インデックス、オペレーターおよびマシン インデックスなど、計画内の実際の物理エンティティのインデックス値である入力決定変数を受け取り、選択された値を返します。これらのインデックス値をそれぞれのデータ フレームから、専門家が視覚的に表示および分析できる一貫したタイムラインに変換するには、逆処理が必要です。
d) 最後に、運用フェーズであっても、ML モデルはトレーニング フェーズと比較して、観測予測を生成するために必要な計算量と時間が大幅に少なくなります。ただし、スケジュールは毎回最初から作成されるため、実行ごとに同じリソースが必要になります。
次の図は、ML および最適化プロジェクトの各段階における相対的なワークロードの大まかな図です。
ML と最適化の相対的なワークロードを比較する概略図
#ML と最適化は連携できますか?
機械学習と最適化は企業にとって相補的な問題を解決するため、ML モデルの出力と最適化は相互に強化し合い、その逆も同様です。 IoT の予知保全や障害検出、AR/VR リモート メンテナンス、前述の生産プロセス RCA などの AI/ML アプリケーションは、メーカーのコネクテッド ファクトリー戦略の一部を形成しています。
最適化アプリケーションはサプライ チェーン計画の基礎を形成し、ビジネス戦略を運用に結び付けるものと考えることができます。これらは、組織が予期せぬイベントに対応し、計画を立てるのに役立ちます。たとえば、生産ラインで問題が検出された場合、RCA (根本原因分析) ツールは、生産ライン管理者が考えられる原因を迅速に絞り込み、必要な措置を講じるのに役立ちます。ただし、これにより、予期しないマシンのシャットダウンや操作命令の再割り当てが発生する場合があります。したがって、削減された利用可能な容量を使用して生産計画を再作成する必要がある場合があります。
ML の一部のテクニックは最適化に適用できますか?またその逆も可能ですか?
ML プロジェクトの経験は最適化プロジェクトに適用でき、その逆も同様です。たとえば、出力の最適化に重要な目的関数の場合、ビジネス ユニットが数学的モデリングの観点から制約ほど明確に定義されていない場合があります。制約は従う必要があるルールであり、したがって通常はよく知られています。たとえば、ビジネス目標は次のとおりです。
a) 納期を厳守しながら、バッチの優先順位をできるだけ早く設定する必要があります。
b) スケジュールは事前にロードする必要があります。時間間隔はできるだけ短く、リソース使用率を低く設定する必要があります。
c) 容量を効率的に利用するには、バッチをグループ化する必要があります。
d) 高価値製品に関してより高いスキル レベルを持つオペレータには、そのようなバッチを割り当てるのが最適です。
これらの目標の中には、適切にバランスを取る必要がある競合する優先順位がある場合があります。そのため、データ サイエンティストは、影響を与える要素 (ボーナスや罰金など) の複雑な組み合わせを記述するときに、どの目標に当てはまりそうなものに焦点を当てることがよくあります。最も一般的な計画シナリオは試行錯誤によって達成されますが、欠陥が発生すると、ロジックの理解や維持が困難になる場合があります。最適化ソルバーはサードパーティ製品を使用することが多いため、デバッグ対象のモデルを構築するデータ サイエンティストがそのコードを利用できないことがよくあります。これにより、スケジュール生成プロセスの特定の時点で特定のボーナスやペナルティがどのような値になったかを確認することができなくなります。これらの値によってスケジュールが正しく動作するため、説得力のあるターゲット表現を作成することが非常に重要になります。
したがって、上記のアプローチは、ML で広く使用されているボーナスと罰金の標準化を採用するのに役立ちます。正規化された値は、構成パラメーターまたはその他の手段を使用して、制御された方法でスケーリングし、各要素の影響、相互の関係、および各要素内の前後の要素の値を制御できます。
結論
要約すると、機械学習と制約付き最適化はどちらも、組織や日常生活におけるさまざまな問題を解決するための高度な数学的手法です。これらはすべて、物理機器、プロセス、またはネットワーク リソースのデジタル ツインを展開するために使用できます。どちらのタイプのアプリケーションも同様の高レベルの開発プロセスに従いますが、ML プロジェクトはライブラリやクラウドネイティブ アルゴリズムで利用可能な高度な自動化を活用できますが、最適化には複雑な計画プロセスを完全に実装するためにビジネス サイエンティストとデータ サイエンティストの緊密な連携が必要です。モデリング。一般的に、最適化プロジェクトはより多くの開発作業を必要とし、リソースを大量に消費します。実際の開発では、企業内で ML ツールと最適化ツールを連携させる必要があることが多く、どちらのテクノロジーもデータ サイエンティストにとって役立ちます。
翻訳者紹介
Zhu Xianzhong 氏、51CTO コミュニティ編集者、51CTO エキスパートブロガー、講師、濰坊市の大学のコンピューター教師、フリーランスプログラミング業界のベテラン。
原題: 機械学習と制約付き最適化を使用したデジタル ツイン モデリング 、著者: Partha Sarkar
以上が機械学習と制約付き最適化に基づくデジタル ツイン モデリングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

译者 | 布加迪审校 | 孙淑娟目前,没有用于构建和管理机器学习(ML)应用程序的标准实践。机器学习项目组织得不好,缺乏可重复性,而且从长远来看容易彻底失败。因此,我们需要一套流程来帮助自己在整个机器学习生命周期中保持质量、可持续性、稳健性和成本管理。图1. 机器学习开发生命周期流程使用质量保证方法开发机器学习应用程序的跨行业标准流程(CRISP-ML(Q))是CRISP-DM的升级版,以确保机器学习产品的质量。CRISP-ML(Q)有六个单独的阶段:1. 业务和数据理解2. 数据准备3. 模型

机器学习是一个不断发展的学科,一直在创造新的想法和技术。本文罗列了2023年机器学习的十大概念和技术。 本文罗列了2023年机器学习的十大概念和技术。2023年机器学习的十大概念和技术是一个教计算机从数据中学习的过程,无需明确的编程。机器学习是一个不断发展的学科,一直在创造新的想法和技术。为了保持领先,数据科学家应该关注其中一些网站,以跟上最新的发展。这将有助于了解机器学习中的技术如何在实践中使用,并为自己的业务或工作领域中的可能应用提供想法。2023年机器学习的十大概念和技术:1. 深度神经网

译者 | 朱先忠审校 | 孙淑娟在我之前的博客中,我们已经了解了如何使用因果树来评估政策的异质处理效应。如果你还没有阅读过,我建议你在阅读本文前先读一遍,因为我们在本文中认为你已经了解了此文中的部分与本文相关的内容。为什么是异质处理效应(HTE:heterogenous treatment effects)呢?首先,对异质处理效应的估计允许我们根据它们的预期结果(疾病、公司收入、客户满意度等)选择提供处理(药物、广告、产品等)的用户(患者、用户、客户等)。换句话说,估计HTE有助于我

近年来,基于深度学习的模型在目标检测和图像识别等任务中表现出色。像ImageNet这样具有挑战性的图像分类数据集,包含1000种不同的对象分类,现在一些模型已经超过了人类水平上。但是这些模型依赖于监督训练流程,标记训练数据的可用性对它们有重大影响,并且模型能够检测到的类别也仅限于它们接受训练的类。由于在训练过程中没有足够的标记图像用于所有类,这些模型在现实环境中可能不太有用。并且我们希望的模型能够识别它在训练期间没有见到过的类,因为几乎不可能在所有潜在对象的图像上进行训练。我们将从几个样本中学习

本文讨论使用LazyPredict来创建简单的ML模型。LazyPredict创建机器学习模型的特点是不需要大量的代码,同时在不修改参数的情况下进行多模型拟合,从而在众多模型中选出性能最佳的一个。 摘要本文讨论使用LazyPredict来创建简单的ML模型。LazyPredict创建机器学习模型的特点是不需要大量的代码,同时在不修改参数的情况下进行多模型拟合,从而在众多模型中选出性能最佳的一个。本文包括的内容如下:简介LazyPredict模块的安装在分类模型中实施LazyPredict

译者 | 朱先忠审校 | 孙淑娟引言模型超参数(或模型设置)的优化可能是训练机器学习算法中最重要的一步,因为它可以找到最小化模型损失函数的最佳参数。这一步对于构建不易过拟合的泛化模型也是必不可少的。优化模型超参数的最著名技术是穷举网格搜索和随机网格搜索。在第一种方法中,搜索空间被定义为跨越每个模型超参数的域的网格。通过在网格的每个点上训练模型来获得最优超参数。尽管网格搜索非常容易实现,但它在计算上变得昂贵,尤其是当要优化的变量数量很大时。另一方面,随机网格搜索是一种更快的优化方法,可以提供更好的

实现自我完善的过程是“机器学习”。机器学习是人工智能核心,是使计算机具有智能的根本途径;它使计算机能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善。机器学习主要研究三方面问题:1、学习机理,人类获取知识、技能和抽象概念的天赋能力;2、学习方法,对生物学习机理进行简化的基础上,用计算的方法进行再现;3、学习系统,能够在一定程度上实现机器学习的系统。

本文将详细介绍用来提高机器学习效果的最常见的超参数优化方法。 译者 | 朱先忠审校 | 孙淑娟简介通常,在尝试改进机器学习模型时,人们首先想到的解决方案是添加更多的训练数据。额外的数据通常是有帮助(在某些情况下除外)的,但生成高质量的数据可能非常昂贵。通过使用现有数据获得最佳模型性能,超参数优化可以节省我们的时间和资源。顾名思义,超参数优化是为机器学习模型确定最佳超参数组合以满足优化函数(即,给定研究中的数据集,最大化模型的性能)的过程。换句话说,每个模型都会提供多个有关选项的调整“按钮


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

ドリームウィーバー CS6
ビジュアル Web 開発ツール

WebStorm Mac版
便利なJavaScript開発ツール

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ホットトピック



