ホームページ >テクノロジー周辺機器 >AI >強化学習は誇張されすぎていませんか?

強化学習は誇張されすぎていませんか?

PHPz転載: 2023-04-13 09:31:021206ブラウズ

翻訳者 | Li Rui

レビュアー | Sun Shujuan

わかりました #友達と一緒に行く準備をしているところを想像してください遊ぶチェス、しかし彼は人間ではなく、チェスのルールを理解していない人です。ゲームコンピュータープログラム。しかし、このアプリケーションは、が 1 つの目標、つまり get を達成することに取り組んでいることを理解しています。ゲームでは勝ちます。

コンピュータープログラムはルールを知らないため、チェスを開始するためのの動きはランダムです。これらのトリックの中にはまったく意味をなさないものもありますが、あなたが勝つのは簡単でしょう。ここで、あなたはこの友人とチェスをするのがとても楽しくて、そのゲームに夢中になっていると仮定します。しかし、コンピュータプログラムは最終的には

勝利します。なぜなら、コンピュータプログラムは徐々に学習するからです。あなたの方法とトリックを打ち負かしてください番号。この仮説シナリオは突飛に思えるかもしれませんが、強化学習 (機械学習の分野) がどのように機能するかについての一般的なアイデアが得られるはずです。強化学習はどの程度インテリジェントですか? 人間の知能には、知識の獲得などの多くの特性が含まれます、知的能力と直観的思考を拡大したいという欲求。チェスのチャンピオン、ガルリ・カスパロフがディープ・ブルーと呼ばれるIBMコンピューターに負けたとき、人間の知性は疑問にさらされました。ロボットが人類を支配する未来を描く終末的なシナリオは、大衆の注目を集めただけでなく、主流の意識も支配しています。

強化学習は誇張されすぎていませんか?

しかし、「ディープ・ブルー」

は並大抵の相手ではありません。この計算プログラム

を使用してチェスをプレイすることは、千歳の老人とチェスをプレイするようなものです old ゲームをプレイする, そして彼は生涯ずっとチェスをプレーしてきました。しかし、「ディープブルー」は、楽器の演奏や本を書くなどの他の知的活動よりも、特定のゲームをプレイするのが得意です。、理科の実験、子育て、または車の修理。このは決して「ディープ・ブルー」の内容を軽視するためのものではありませんの成果を達成しました。とは反対に、コンピューターが知的能力において人間を超えることができるという考えは、強化学習がどのように機能するかを分析することから始めて、注意深く検討する必要があります。。

強化学習の仕組みで述べたように、強化学習は次のサブセットです。機械学習。これには、インテリジェントエージェントが環境内でどのように行動して累積報酬を最大化するかという概念が含まれます。

簡単に言えば、強化学習ロボットは報酬と罰のメカニズムによって訓練され、ロボットは正しい行動をとります。報酬を獲得し、make間違った行動は罰せられます。強化学習ロボットは「考える」ことはありませんより良い行動を取る方法 # は、成功の可能性を最大化するためにすべてのアクションを可能にするだけです。強化学習の欠点

強化学習の主な欠点は、大量の数が必要になることです。目標を達成するためのリソースの確保。囲碁ゲームにおける強化学習の成功は、この点を示しています。これは人気のある 2 人用ゲームで、目標は駒を失わずに自分の駒を使ってボード上の最大領域を占めることです。

強化学習は誇張されすぎていませんか?

AlphaGo Master は、囲碁ゲームで人間のプレイヤーに勝つコンピュータープログラムです。多くのエンジニアを含む多大な資金と人材を消費し、非常にリッチなゲームです。 256 個の GPU と 128,000 個の CPU の経験。

競争で勝つ方法を学ぶプロセスには、多くのリソースとエネルギーを投資する必要があります。ここから疑問が生じます: 直感的に考えることができない人工知能を設計するのは合理的でしょうか? 人工知能の研究は人間の知能を模倣するべきではないでしょうか?

サポートの強化学習に関する議論の 1 つは、AI システムが人間のように機能することを期待すべきではなく、複雑な問題を解決するために AI を使用するにはさらなる開発が必要であるということです。一方で、強化学習に反対する議論は、AI 研究は現在人間と動物にしかできないことを機械にやらせることに焦点を当てるべきだというものです。この観点から、人工知能と人間の知能の比較は適切です。

量子強化学習強化学習は、上記の問題のいくつかを解決できると言われている新興分野です。量子強化学習 (QRL) は、コンピューティングを高速化する方法です。

まず、量子強化学習 (QRL) は、探索 (戦略の発見) フェーズと活用 (最適な戦略の選択) フェーズを最適化することで学習を加速すると考えられています。現在のアプリケーションと提案されている量子コンピューティングの一部は、データベース検索を改善し、大きな数値を素数に因数分解するなどの機能を備えています。

量子強化学習 (QRL) は画期的な方法で登場したわけではありませんが、従来の強化学習の主要な課題のいくつかを解決できる可能性を秘めています。

#強化学習のビジネスケース

前述したように、強化学習の研究開発は非常に重要です。以下は、McKinsey & Company の調査から得た強化学習の実践例です。

強化学習は誇張されすぎていませんか?

半導体とチップの設計を最適化し、製造プロセスを最適化し、半導体業界の生産量を増加します。
#工場の生産量を増やし、物流を最適化して廃棄物とコストを削減し、農業の利益を増やします。
# 航空宇宙および防衛産業における新しいシステムの市場投入までの時間を短縮します。
#設計プロセスを最適化し、自動車産業の生産効率を向上させます。
収益を拡大し、リアルタイムのトランザクションと価格設定戦略を通じて顧客エクスペリエンスを向上させ、金融サービスにおける高度なパーソナライゼーションを顧客に提供します。
鉱山の設計を最適化し、発電を管理し、全体的な物流スケジュールを適用し、運用を最適化し、コストを削減し、生産量を増加します。
リアルタイム監視と正確な掘削を通じて生産量を増やし、タンカールートを最適化し、予知保全を実現し、石油・ガス業界の設備故障を防ぎます。
製薬業界向けに、創薬を促進し、研究プロセスを最適化し、生産を自動化し、バイオメソッドを最適化します。
サプライチェーンを最適化し、高度な在庫モデリングを実装し、小売業界の顧客に高度なパーソナライズされたサービスを提供します。
#電気通信業界における顧客のパーソナライゼーションを適用して、ネットワークを最適化および管理します。
#輸送物流ルート、ネットワーク計画、倉庫運営を最適化します。
次世代プロキシを使用して、Web サイトからデータを抽出します。

#強化学習についての考察

強化学習の力は限られているかもしれませんが、過大評価することはできません。さらに、強化学習の研究開発プロジェクトが増加するにつれて、経済のほぼすべての分野で潜在的なユースケースも増加しています。

強化学習の大規模な導入は、最適なアルゴリズム設計、構成された学習環境、コンピューティング能力の可用性など、いくつかの要因に依存します。

元のタイトル: 強化学習は誇張されすぎていますか? , 著者: Aleksandras Šulženko

以上が強化学習は誇張されすぎていませんか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：人工知能は「目は魂への窓」をどう解釈するか次の記事：人工知能は「目は魂への窓」をどう解釈するか

続きを見る