ホームページ  >  記事  >  人工知能の核心とは何か

人工知能の核心とは何か

coldplay.xixi
coldplay.xixiオリジナル
2020-12-25 15:02:0179404ブラウズ

人工知能の中核: 1. コンピューター ビジョンとは、画像からオブジェクト、シーン、アクティビティを認識するコンピューターの能力を指します; 2. 機械学習とは、コンピューター システムが明示的なプログラムに従う必要がないという事実を指します命令、3. 自然言語処理、4. ロボット、5. 音声認識、主に人間の音声の自動かつ正確な転写技術に焦点を当てています。

人工知能の核心とは何か

#この記事の動作環境: Windows 7 システム、Dell G3 コンピューター。

人工知能の核心:

1. コンピューター ビジョン

コンピューター ビジョンとは、画像からオブジェクトを識別するコンピューターを指します。シーンとアクティビティの機能。コンピューター ビジョン技術では、一連の画像処理操作やその他の技術を使用して、画像分析タスクを管理可能なチャンクに分割します。たとえば、一部の技術では画像からオブジェクトのエッジとテクスチャを検出でき、分類技術を使用して、識別された特徴がシステムに既知のオブジェクトのクラスを表すかどうかを判断できます。

コンピューター ビジョンは、病気の予測、診断、治療を改善するために医療画像分析が使用されている、写真内の人物を自動的に識別するために Facebook で使用されている顔認識、セキュリティに使用されているなど、幅広い用途があります。容疑者を特定するために使用される監視フィールドや、ショッピングに関しては、消費者はスマートフォンで製品の写真を撮ることができ、より多くの購入オプションを得ることができます。

マシン ビジョンは、関連分野として、一般に産業オートメーションの分野におけるビジョン アプリケーションを指します。これらのアプリケーションでは、コンピューターは高度に制約された工場環境で生産部品などのオブジェクトを識別するため、制約のない環境での動作を求めるコンピューター ビジョンよりも目標が簡単になります。コンピューター ビジョンは現在進行中の研究ですが、マシン ビジョンは「解決された問題」であり、研究レベルのトピックではなくシステム エンジニアリングのトピックです。アプリケーションが拡大し続ける中、2011 年以来、一部のコンピューター ビジョン スタートアップ企業がベンチャー キャピタルから数億ドルを集めています。

人工知能の核心とは何か

#2. 機械学習

機械学習とは、コンピューター システムが明示的なプログラム命令に従う必要がないという事実を指します。 , しかし、データに依存するのは自分自身のパフォーマンスを向上させるためだけです。機械学習の中心となるのは、データ内のパターンを自動的に発見することであり、一度発見されると、そのパターンを使用して予測を行うことができます。たとえば、取引時刻、販売者、場所、価格、取引が正当かどうかなどのクレジット カード取引情報のデータベースが機械学習システムに与えられた場合、システムはクレジット カード詐欺を予測するために使用できるパターンを学習します。処理されるトランザクション データが増えるほど、予測の精度が高まります。

機械学習には幅広い用途があり、大量のデータを生成するほぼすべてのアクティビティのパフォーマンスを向上させる可能性があります。これらの活動には、不正行為の検査に加えて、販売予測、在庫管理、石油とガスの探査、公衆衛生などが含まれます。機械学習テクノロジーは、コンピューター ビジョンなどの他の認知テクノロジー分野でも重要な役割を果たしており、大規模な画像内の視覚モデルを継続的にトレーニングおよび改善することで、物体を認識する能力を向上させることができます。

今日、機械学習はコグニティブ テクノロジーの中で最も注目されている研究分野の 1 つとなっており、2011 年から 2014 年の間に 10 億米ドル近くのベンチャー キャピタルが集まりました。 Googleは2014年にも4億ドルを投じて機械学習技術を研究する企業ディープマインドを買収した。

人工知能の核心とは何か

#3. 自然言語処理

自然言語処理とは、コンピューターが持つ人間のようなテキスト処理機能を指します。たとえば、テキストから意味を抽出し、読みやすく、スタイルが自然で、文法的に正しいテキストから意味を独自に解釈することもできます。自然言語処理システムは人間がテキストを処理する方法を理解していませんが、非常に複雑かつ洗練された方法でテキストを巧みに処理できます。たとえば、文書内で言及されているすべての人物と場所を自動的に識別し、文書の中核となるトピックを識別し、人間が読める契約の山からさまざまな契約条件を抽出して表を作成します。これらのタスクは、単純なテキスト マッチングとパターンのみを実行する従来のテキスト処理ソフトウェアでは実行できません。

自然言語処理は、コンピューター ビジョン テクノロジと同様、目標の達成に役立つさまざまなテクノロジを統合します。言語モデルは、言語表現の確率分布、たとえば、特定の文字列または単語が特定の意味論的意味を表現する最大の可能性を予測するために構築されます。選択した特徴をテキスト内の特定の要素と組み合わせてテキストを識別することができ、これらの要素を識別することで、特定の種類のテキストを他のテキスト (通常の電子メールとスパム メールなど) から区別できます。機械学習による分類方法は、電子メールがスパムであるかどうかを判断するためのフィルタリング基準になります。

因為語境對於理解「timeflies」(時光飛逝)和「fruitflies」(果蠅)的區別是如此重要,所以自然語言處理技術的實際應用領域相對較窄,這些領域包括分析顧客對某項特定產品和服務的回饋,自動發現民事訴訟或政府調查中的某些含義,自動書寫諸如企業營收和體育運動的公式化範文,等等。

人工知能の核心とは何か

4、機器人

將機器視覺、自動規劃等認知技術整合至極小卻高效能的感測器、煞車以及設計巧妙的硬體中,這催生了新一代的機器人,它有能力與人類一起工作,並能在各種未知環境中靈活處理不同的任務。例如,無人機、可以在車間為人類分擔工作的「cobots」等。

5、語音辨識

語音辨識主要是專注於自動且準確地轉錄人類的語音技術。該技術必須面對一些與自然語言處理類似的問題,在不同口音的處理、背景噪音、區分同音異形/異義詞(“buy”和“by”聽起來是一樣的)方面存在一些困難,同時還需要具有跟上正常語速的工作速度。語音辨識系統使用一些與自然語言處理系統相同的技術,再輔以其他技術,例如描述聲音和其出現在特定序列與語言中機率的聲學模型等。語音辨識的主要應用包括醫療聽寫、語音書寫、電腦系統聲控、電話客服等。例如Domino 抯Pizza,最近推出了一個允許使用者透過語音下單的行動APP。

更多相關知識,請造訪常見問題欄位!

以上が人工知能の核心とは何かの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。