コーヒー買ってきて☕
コンピュータービジョンは、コンピューターが画像やビデオなどの視覚的なものを理解し、分析できるようにするテクノロジーです。
以下に示すように、多くのコンピューター ビジョン テクノロジがあります:
(1) 分類(認識):
- 画像、ビデオなど全体を 1 つまたは複数のクラス (ラベル) から 1 つまたは複数のクラス (ラベル) に分類できます。
- は、より具体的には、画像分類(認識)、ビデオ分類(認識)、オブジェクト分類(認識)などと呼ばれます。
- には、二値分類と多クラス分類の2つの方法がある単一ラベル分類があります。
- には、マルチラベル分類というメソッドがあります。
*メモ:
-
二値分類は、画像やビデオなど全体を 2 つのクラス (ラベル) から 1 つのクラス (ラベル) に分類できます。
-
マルチクラス分類 は、画像やビデオなど全体を 2 つ以上のクラス (ラベル) から 1 つのクラス (ラベル) に分類できます。
-
マルチラベル分類 は、画像やビデオなど全体を 3 つ以上のクラス (ラベル) から複数のクラス (ラベル) に分類できます。
(2) ローカリゼーション:
- 境界ボックスを使用して、画像やビデオなど内の複数のオブジェクトや興味深い領域を位置特定できます。
- は、より具体的には、画像ローカリゼーション、ビデオ ローカリゼーション、オブジェクト ローカリゼーションなどと呼ばれます。
(3) 検出:
- クラス(ラベル)と境界ボックスを使用して、画像、ビデオなど内のオブジェクトと興味深い領域を位置特定し、分類できます。
- は、オブジェクトの位置特定 と 分類 (認識) の組み合わせです。
- は、より具体的には、画像検出、ビデオ検出、オブジェクト検出 などと呼ばれます。
(4) セグメンテーション:
- は、物体と物を色で区別することで、より正確に物体検出を実行できます。
*メモ:
-
ものとは、空、海、森、道、草、風景など、数え切れないほどのもの(クラス)です。
-
物は、車、木、人、動物、花などの可算な物(クラス)です。
- は、より具体的には、画像セグメンテーション や ビデオ セグメンテーション、オブジェクト セグメンテーション などと呼ばれます。
- には、セマンティック セグメンテーション、インスタンス セグメンテーション、および パノプティック セグメンテーション という一般的なメソッドがあります。
*メモ:
-
セマンティックセグメンテーションは、ものを区別するのは得意ですが、ものを区別するのは苦手です。
-
インスタンスのセグメンテーションは、ものを区別するのは得意ですが、ものを区別するのは苦手です。
-
パノプティックセグメンテーション:
- は、物と物の両方を区別するのが得意です。
- は、セマンティック セグメンテーション と インスタンス セグメンテーション の組み合わせです。
以上がコンピュータービジョンとは何ですか? (1)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。