画像分類におけるクラスの不均衡の問題-AI-php.cn

ホームページ

テクノロジー周辺機器

画像分類におけるクラスの不均衡の問題

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 08, 2023 am 08:41 AM

解決画像分類カテゴリの不均衡

画像分類におけるクラスの不均衡の問題

画像分類におけるカテゴリの不均衡の問題、特定のコード例が必要です

要約: 画像分類タスクでは、データセット内のカテゴリの不均衡が発生する可能性があります。 , 一部のカテゴリには、他のカテゴリよりもはるかに多くのサンプルがあります。このクラスの不均衡は、モデルのトレーニングとパフォーマンスに悪影響を与える可能性があります。この記事では、クラスの不均衡問題の原因と影響について説明し、問題を解決するための具体的なコード例をいくつか示します。

はじめに
画像分類はコンピュータビジョンの分野における重要なタスクであり、顔認識、ターゲット検出、画像検索などの複数のアプリケーションシナリオに適用できます。画像分類タスクにおける一般的な問題は、一部のクラスが他のクラスよりもはるかに多くのサンプルを持っている、データセット内のクラスの不均衡です。たとえば、100 個のカテゴリを含むデータセットでは、10 個のカテゴリのサンプルサイズは 1,000 ですが、他の 90 個のカテゴリのサンプルサイズはわずか 10 です。このクラスの不均衡は、モデルのトレーニングとパフォーマンスに悪影響を与える可能性があります。
クラスの不均衡問題の原因と影響
カテゴリの不均衡問題は、さまざまな理由によって発生する可能性があります。まず、一部のカテゴリのサンプルは収集が容易なため、それらのサンプルサイズが比較的大きくなる場合があります。たとえば、動物カテゴリのデータセットでは、猫と犬は家庭用ペットであり、写真に撮られる可能性が高いため、より多くのサンプルが存在する可能性があります。さらに、サンプルのカテゴリによっては、入手がより困難な場合があります。たとえば、異常検出タスクでは、異常なサンプルの数が正常なサンプルの数よりもはるかに少ない場合があります。さらに、データセットの分布が不均一になる可能性があり、その結果、一部のカテゴリのサンプル数が少なくなります。

クラスの不均衡の問題は、モデルのトレーニングとパフォーマンスに悪影響を及ぼします。まず、一部のカテゴリではサンプル数が少ないため、モデルがこれらのカテゴリを誤って判断する可能性があります。たとえば、2 分類問題では、2 つのカテゴリのサンプル数はそれぞれ 10 と 1000 です。モデルが学習を行わず、すべてのサンプルをより多くのサンプル数を持つカテゴリとして直接予測した場合、精度は次のようになります。非常に高いですが、実際にはサンプルは効果的に分類されていません。第 2 に、サンプル分布の不均衡により、モデルがサンプル数の多いカテゴリの予測に偏り、他のカテゴリの分類パフォーマンスが低下する可能性があります。最後に、カテゴリ分布の不均衡により、少数派カテゴリに対するモデルのトレーニングサンプルが不十分になり、学習されたモデルの少数派カテゴリに対する汎化能力が低下する可能性があります。

クラスの不均衡問題を解決する方法
クラスの不均衡問題に対処するために、いくつかの方法を採用してモデルのパフォーマンスを向上させることができます。一般的な方法には、アンダーサンプリング、オーバーサンプリング、重み調整などがあります。

アンダーサンプリングとは、各カテゴリのサンプル数が近くなるように、サンプル数が多いカテゴリからいくつかのサンプルをランダムに削除することを指します。この方法はシンプルで簡単ですが、サンプルを削除すると一部の重要な特徴が失われる可能性があるため、情報が失われる可能性があります。

オーバーサンプリングとは、各カテゴリのサンプル数のバランスを整えるために、サンプル数が少ないカテゴリから一部のサンプルをコピーすることを指します。この方法ではサンプル数を増やすことができますが、サンプルをコピーするとモデルがトレーニングセットに過剰適合し、汎化能力が低下する可能性があるため、過剰適合の問題が発生する可能性があります。

重み調整とは、モデルがサンプル数の少ないカテゴリにより多くの注意を払うように、損失関数内のさまざまなカテゴリのサンプルに異なる重みを与えることを指します。この方法は、追加のサンプルを導入することなく、クラスの不均衡の問題を効果的に解決できます。具体的なアプローチは、サンプル数が少ないカテゴリの重みが大きくなるように重みベクトルを指定して、損失関数内の各カテゴリの重みを調整することです。

以下は、PyTorch フレームワークを使用したコード例で、重み調整メソッドを使用してクラスの不均衡の問題を解決する方法を示しています。

import torch
import torch.nn as nn
import torch.optim as optim

# 定义分类网络
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(784, 100)
        self.fc2 = nn.Linear(100, 10)
    
    def forward(self, x):
        x = x.view(-1, 784)
        x = self.fc1(x)
        x = self.fc2(x)
        return x

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss(weight=torch.tensor([0.1, 0.9]))  # 根据样本数量设置权重
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

# 训练模型
for epoch in range(10):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        
        optimizer.zero_grad()
        
        outputs = net(inputs)
        
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        if i % 2000 == 1999:
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0

print('Finished Training')

上記のコードでは、torch を使用しています。 tensor([ 0.1, 0.9])2 つのカテゴリの重みを指定します。サンプル数が少ないカテゴリの重みは 0.1、サンプル数が多いカテゴリの重みは 0.9 です。これにより、モデルはサンプル数が少ないカテゴリにより多くの注意を払うことができます。

結論
カテゴリの不均衡は画像分類タスクにおける一般的な問題であり、モデルのトレーニングとパフォーマンスに悪影響を与える可能性があります。この問題を解決するには、アンダーサンプリング、オーバーサンプリング、重み調整などの方法を使用できます。その中でも、重み調整法は、追加のサンプルを導入することなくクラス不均衡問題を解決できる簡単かつ効果的な方法である。この記事では、重み調整メソッドを使用してクラスの不均衡の問題を解決する方法を、特定のコード例を通じて説明します。

参考文献:
[1] He, H., & Garcia, E. A. (2009). 不均衡なデータからの学習. 知識とデータエンジニアリングに関する IEEE トランザクション、21(9)、1263 - 1284.

[2] Chawla, N.V.、Bowyer, K.W.、Hall, L.O.、および Kegelmeyer, W.P. (2002). SMOTE: 合成少数派オーバーサンプリング技術. 人工知能研究ジャーナル、16、321 - 357.

以上が画像分類におけるクラスの不均衡の問題の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

LM Studioを使用してLLMをローカルに実行する方法は？ - 分析VidhyaApr 19, 2025 am 11:38 AM

自宅で大規模な言語モデルを簡単に実行する：LM Studioユーザーガイド近年、ソフトウェアとハードウェアの進歩により、パーソナルコンピューターで大きな言語モデル（LLM）を実行することが可能になりました。 LM Studioは、このプロセスを簡単かつ便利にするための優れたツールです。この記事では、LM Studioを使用してLLMをローカルに実行する方法に飛び込み、重要なステップ、潜在的な課題、LLMをローカルに配置することの利点をカバーします。あなたが技術愛好家であろうと、最新のAIテクノロジーに興味があるかどうかにかかわらず、このガイドは貴重な洞察と実用的なヒントを提供します。始めましょう！概要 LLMをローカルに実行するための基本的な要件を理解してください。コンピューターにLM Studiをセットアップします

Guy Periは、データ変換を通じてMcCormickの未来のフレーバーを支援しますApr 19, 2025 am 11:35 AM

Guy Periは、McCormickの最高情報およびデジタルオフィサーです。彼の役割からわずか7か月後ですが、ペリは同社のデジタル能力の包括的な変革を急速に進めています。データと分析に焦点を当てている彼のキャリアに焦点が当てられています

迅速なエンジニアリングの感情の連鎖は何ですか？ - 分析VidhyaApr 19, 2025 am 11:33 AM

導入人工知能（AI）は、言葉だけでなく感情も理解し、人間のタッチで反応するように進化しています。この洗練された相互作用は、AIおよび自然言語処理の急速に進む分野で重要です。 th

データサイエンスワークフローのための12のベストAIツール-AnalyticsVidhyaApr 19, 2025 am 11:31 AM

導入今日のデータ中心の世界では、競争力と効率の向上を求める企業にとって、高度なAIテクノロジーを活用することが重要です。さまざまな強力なツールにより、データサイエンティスト、アナリスト、開発者が構築、Deplを作成することができます。

AV BYTE：OpenAIのGPT-4O MINIおよびその他のAIイノベーションApr 19, 2025 am 11:30 AM

今週のAIの風景は、Openai、Mistral AI、Nvidia、Deepseek、Hugging Faceなどの業界の巨人からの画期的なリリースで爆発しました。これらの新しいモデルは、TRの進歩によって促進された電力、手頃な価格、アクセシビリティの向上を約束します

PerplexityのAndroidアプリにはセキュリティの欠陥が感染しているとレポートApr 19, 2025 am 11:24 AM

しかし、検索機能を提供するだけでなくAIアシスタントとしても機能する同社のAndroidアプリは、ユーザーをデータの盗難、アカウントの買収、および悪意のある攻撃にさらす可能性のある多くのセキュリティ問題に悩まされています。

誰もがAIの使用が上手になっています：バイブコーディングに関する考えApr 19, 2025 am 11:17 AM

会議や展示会で何が起こっているのかを見ることができます。エンジニアに何をしているのか尋ねたり、CEOに相談したりできます。あなたが見ているところはどこでも、物事は猛烈な速度で変化しています。エンジニア、および非エンジニア違いは何ですか

Rocketpyを使用したロケットの起動シミュレーションと分析-AnalyticsVidhyaApr 19, 2025 am 11:12 AM

Rocketpy：A包括的なガイドでロケット発売をシミュレートしますこの記事では、強力なPythonライブラリであるRocketpyを使用して、高出力ロケット発売をシミュレートすることをガイドします。ロケットコンポーネントの定義からシミュラの分析まで、すべてをカバーします

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、