画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます-AI-php.cn

ホームページ

テクノロジー周辺機器

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

PHPz

Apr 08, 2023 pm 06:51 PM

アルゴリズム画像商品

1. 製品レビューの背景紹介

Zhuanzhuan は、主に中古品の取引を行う電子商取引プラットフォームです。取引エンティティに応じて、C2C、C2B、B2C、およびその他の取引関係を形成できます。例えば、個人ユーザーが Zhuanzhuan アプリのフリーマーケットで販売する商品を公開する C2C モデルであり、Zhuanzhuan 社は携帯電話やその他の電子製品の郵送と戸別訪問リサイクルの C2B サービスを提供しています。正規検品・保証・アフターサービス付きの中古B2C商品です。この記事では、Zhuanzhuan B2C ストアの商品リストのレビュープロセスにおける画像アルゴリズムの適用に焦点を当てます。

中古品は規格外であるため、同じSKU内の異なる在庫品であっても品質に差がございます。ユーザーエクスペリエンスを向上させ、製品情報の透明性を高めるため、プラットフォームでは中古品を表示する際に実際に撮影された製品画像を使用し、標準品のレンダリング画像の使用を避けています。これには、棚にある各商品の関連する展示写真を、情報の正確性や画質などのさまざまな観点からレビューすることが含まれます。

ビジネス開発の初期段階では、棚にある商品の関連する展示写真を手動でレビューして、写真の品質と正確性を確認します。レビューの内容には主に次の側面が含まれます:

表示画像「商品が基板上にない」という状況を避けるために実際の製品と一致しているかどうか;
表示画像の写真が鮮明かどうか、カメラの焦点エラーが発生する可能性があります
携帯電話やタブレットなどの電子製品には、汚れがないことを保証し、重要な部分に改ざん防止ラベルを貼り付ける必要があります。
アプリで商品画像を表示するには、商品がアプリ内で画像の中央に表示されるように、商品画像を適切にトリミングする必要があります。

ビジネスの発展に伴い、日々多くの製品が店頭に並べられ、手作業によるレビューではレビューの効率と精度におけるいくつかの問題が徐々に明らかになります。レビュー作業は退屈で、疲労しやすく、手動レビューではエラーが発生する可能性が高くなります。

レビュー内容の繰り返し作業を考慮し、画像分野に関連する分類、回帰、検出などの技術を使用し、アルゴリズムモデルの出力を使用して手動判断を補助し、精度を向上させます。同時に、レビュープロセスの効率も大幅に向上しました。

2. 自動レビュー計画

棚レビューでのレビュー内容は以下の点が含まれます。対応する SKU 情報。

商品写真が鮮明かどうか。

製品に改ざん防止ラベルが付いているかどうか。

製品が汚れているかどうか。
商品が画像の中央領域にあるかどうか。
レビューの必要性を考慮して、次のソリューションを設計しました。
レビューが必要なプロジェクトソリューション製品の表示画像と対応する SKU が一致しているかどうか画像が商品写真と一致しているか明確な返品計画商品に改ざん防止ラベルが付いているかどうか検出計画商品が汚れているかどうか検出計画商品が画像の中央領域にあるかどうか検出計画

# 次の図は、B2C 製品棚レビューの主なレビュー項目の概略図を示しています:

監査サンプル画像

2.1. 製品に画像が表示されるかどうか

#モールで販売されるすべての商品はレビューする必要があります。実際の商品は写真に撮られ、展示されていますが、モールの棚に商品を並べる過程で手作業によるミスが発生するため、その他の状況により、製品表示画像と対応する SKU 情報が一致しない場合があります。簡単な例を挙げると、製品のSKU情報はiphone11-redですが、表示画像はiphoneX-greenです。この問題は、画像情報に基づいて商品カテゴリを決定することに相当する画像分類問題に相当する。しかし、単に分類アルゴリズムを使用するだけでは問題を十分に解決できません。分類を直接使用すると、次のような問題があります。。

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちますカテゴリが固定されているため、新しく追加された SKU は処理できません。

分類方法に関する上記の問題のため、戦略を変更し、画像マッチングスキームを使用しました。より優れた特徴抽出器をトレーニングし、画像マッチングスキームを使用することで、新しいカテゴリを追加する問題をより適切に解決できます。私たちが選択したソリューションは、顔認識、人物再識別、画像検索などの学術ソリューションと基本的に一致しており、主なプロセスには画像特徴抽出、画像類似度計算、ソート、結果出力が含まれます。その中でも画像特徴抽出が私たちの研究の焦点です. 従来の画像マッチング特徴には SIFT, SURF, ORB 特徴などが含まれます. ディープラーニングに基づく画像特徴抽出では主に CNN ニューラルネットワークを特徴抽出に使用します.下の図は私たちの計画を示しています:

商品のレビュー計画

トレーニングフェーズ: トレーニングフェーズでは、主にクロスエントロピー損失と三重項損失を組み合わせて分類ネットワークをトレーニングします。バックボーンネットワークでは、MobileNet、ResNet、ShuffleNet、OSNet などが試行されています。実験の結果、ResNet モデルの精度がわずかに高いことが示されたため、バックボーンネットワークとして ResNet が選択されました。

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

#トリプルの例

式 1 はバイナリのクロスエントロピー損失関数を示します。ここで、は出力を表します。サンプルの値であり、サンプルに対応するラベルを表します。式 2 は、アンカーサンプルに対応する特徴ベクトルを表し、アンカーサンプルと同じカテゴリのサンプルに対応する特徴ベクトルを表し、アンカーサンプルとは異なるカテゴリのサンプルに対応する特徴ベクトルを表す三重項損失関数を与えます。アンカーサンプル。特徴空間では、ネガティブサンプルとアンカーポイントサンプルの間の距離からポジティブサンプルとアンカーポイントの間の距離を引いた値がより大きくなければなりません。

クロスエントロピー損失関数は一般的な分類損失関数であり、トリプレット損失関数は顔認識や歩行者の再識別で一般的に使用される損失関数です。三重項損失関数を使用すると、特徴空間内で特徴をクラスターとして表示できるため、より堅牢な特徴を取得できるという利点があります。三重項損失関数を単独で使用するとモデルの収束が遅くなるため、共同教師あり学習にクロスエントロピー損失と三重項損失を使用してモデルの収束を加速し、モデルの精度を向上させます。

テスト段階: テスト段階では、トレーニングされたバックボーンが、埋め込み特徴を抽出する特徴抽出器として選択されます。クエリ画像の特徴を抽出し、ギャラリーライブラリ内の特徴とのコサイン類似度を計算して類似度ソートリストを取得し、ソートリスト内の上位 1 画像に対応するカテゴリをクエリ画像のカテゴリ出力として選択します。しかし、ギャラリーを構築していたとき、1 つの SKU にさまざまな撮影シーンに対応する 3 つの画像が保存されていたため、top5 出力に対して knn を実行し、クエリ画像に対応する SKU を取得しました。

オンライン操作: 照合アルゴリズムによる SKU 出力が正確であることを保証するために、ソートされたリストの上位 1 位の類似度を出力します。類似度が特定のしきい値未満の場合、アラームメッセージが表示されます。手動レビュー用に出力されます。この戦略により、アルゴリズムによって出力される SKU 情報の正確さが保証されます。

2.2. 商品は鮮明に撮影されていますか?

商品の撮影中に商品が動いたり、ピントが合わなかったりして、商品がぼやけて撮影されます。ユーザーにより良いショッピング体験を提供するために、レビュープロセス中にこれらの商品を返品し、要件を満たす商品の写真を撮り直してから棚に並べます。画像が鮮明であるかどうかに注目するだけでも、画像分類の問題として理解できます。画像がぼやけているかどうかのラベル付けは主観的なものであり、二値分類では画像のぼやけ具合をうまく表現できないため、実際のレビューでは、少しぼやけた画像に対して第一線のレビュー担当者が異なる判定結果を与えることが多く、このような状況が大きく影響します。レビュー結果の一貫性が、モール内での商品表示効果の良し悪しにつながります。

上記の問題を解決するために、画像のぼやけ度を、高いぼけから低いぼけまで、明らかにぼけている、少しぼやけている、はっきりしているという 3 つのレベルに分けます。そして、対応する点をそれぞれ 2 点、1 点、0 点として与えます。複数の人が同じ画像を評価し、明らかにぼやけている画像と鮮明な画像を同時に削除し、残りの画像を数値的に正規化して画像のぼやけスコアを取得します。もちろん、ぼやけの程度を明らかなぼやけ、わずかなぼやけ、微妙なぼやけ、鮮明などの 4 つのカテゴリに細分化し、より多くのアノテーターが同じ画像をマークできるようにすることで、より詳細なラベル値を取得できます。より良い予測結果をもたらします。ただし、限られたリソースを考慮して、あいまいさを 3 つのレベルに分け、3 人の学生に注釈を付けるように依頼しただけでした。これから、バイナリ分類問題を回帰問題に変換し、ビジネス標準を適切に分離できます。以下の表は、分類タスクを回帰タスクに変換する方法を示しています。

写真名: クラスメイト 1 点クラスメイト 2 点クラスメイト 3 点合計スコア (0-6) 正規化スコア写真 1 は明らかにぼやけている、わずかにぼやけている、明らかにぼやけている 55/6=0.83 写真 2、わずかにぼやけているぼやけ、わずかにぼやけている明らかなぼやけ 44/6=0.67 写真 3 鮮明わずかにぼやけている鮮明 10.17....

同じ、まだ畳み込みニューラルネットワークを使用し、分類損失関数を回帰損失関数に変更します。回帰タスクの損失関数として MSE を選択します。これはサンプルの予測値を表し、サンプルのラベルを表します。

モデルの出力値は画像のぼやけ度を表します。二項分類タスクを回帰タスクに変えると、多くの利点が得られます。 1 つ目は、アルゴリズム開発とビジネスを切り離すことで、ビジネス標準の変更によってアルゴリズムモデルが無効にならないようにすると同時に、ビジネス側がビジネスニーズに応じて異なるファジーしきい値を設定し、アルゴリズムの明確さを制御できるようにすることです。商店街のイメージ。

2.3. 製品に改ざん防止ラベルが付いているかどうか、汚れているかどうか、中央エリアにあるかどうか

製品に改ざん防止ラベルが付いているかどうかに対処するために、検出ソリューションを使用しています。ラベル、汚れの有無、中央部の有無。これら 3 つのアイテムの中で、改ざん防止ラベルとアイテムの検出は比較的簡単です。改ざん防止ラベルの検出では、改ざん防止ラベルの特徴が単一であるため、検出精度の高いモデルの学習が比較的容易であり、検出時に製品が中央にあれば、アイテムが大きく、データが収集が容易で、精度の高い製品の学習も可能検出モデル。

一部の汚染ターゲットは小さく、サンプルの入手が容易ではないため、汚染の検出はさらに困難になります。この問題に対処するために、データ収集プロセス中にアクティブラーニング戦略を選択して、より多くの陽性サンプルを見つけます (検出タスクの陽性サンプルは、検出する必要があるサンプルクラスを指します)。この方法も非常に簡単で、初期段階でデータのバッチを使用して検出モデルをトレーニングし、次にそのモデルを使用してラベルのないデータの大規模なバッチから信頼度が非常に低い疑わしい陽性サンプルを選択し、バッチにその後、トレーニングモデルが新しいデータで更新されるというサイクルが行われます。このステップを複数回繰り返すことで、最終的に手動検出と同等の検出モデルを取得できます。

2.4. アルゴリズム適用戦略

コンピュータービジョンにおける一般的な分類、検出、その他のタスクでは、モデルの再現率と精度が同時に 100% の指標に達することを保証できません。、実際の実務申請の際には、実際の業務を踏まえて高精度な状態でモデルを選択するか、高再現率な状態でモデルを選択するかを検討する必要があります。下の図は、再現率と精度の関係を示す曲線図です (画像は、周志華先生の本から引用しています)

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

PR 曲線図

当社のレビュービジネスでは、高再現率戦略を採用しています。これは、モデルが要件を満たさない商品画像をできるだけ多く見つけられるようにすることを意味しますが、それに応じて精度が低下するというコストがかかります。写真に問題がある製品をリコールした後は、手動で介入してレビューを行うため、誤ってリコールされた例が当社のビジネスに影響を与えることはありません。

アルゴリズムのおかげで、現在項目をレビューしている学生の作業負荷は 50% 削減されました。アルゴリズムで処理された商品画像のうち、アルゴリズムを通過してモールアプリに直接掲載できる商品は50％で、残りの問題が疑われる商品はアルゴリズムで特定され、手作業で審査される。

3. まとめ

最初のセクションでは、製品レビューの背景、レビューが必要な理由、レビューの内容を紹介し、手動レビューで直面する問題点についても分析しました。次に、アルゴリズムを活用したビジネスによってもたらされるメリットについて説明します。

セクション 2 では、アルゴリズムモジュールを詳しく紹介します。レビューのためにリストされた項目に応じて、3 つの異なるタスクを解決するために 3 つの方法を採用しました。また、アルゴリズムを実装する際に高い再現率と予測精度を犠牲にする解決策と、この解決策の実現可能性についても紹介し、最後にアルゴリズムによって達成される結果を示します。

以上が画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Microsoft Work Trend Index 2025は、職場の容量の緊張を示していますApr 24, 2025 am 11:19 AM

AIの急速な統合により悪化した職場での急成長能力の危機は、増分調整を超えて戦略的な変化を要求します。これは、WTIの調査結果によって強調されています。従業員の68％がワークロードに苦労しており、BURにつながります

AIは理解できますか？中国の部屋の議論はノーと言っていますが、それは正しいですか？Apr 24, 2025 am 11:18 AM

ジョン・サールの中国の部屋の議論：AIの理解への挑戦 Searleの思考実験は、人工知能が真に言語を理解できるのか、それとも真の意識を持っているのかを直接疑問に思っています。チャインを無知な人を想像してください

中国の「スマート」AIアシスタントは、マイクロソフトのリコールのプライバシーの欠陥をエコーしますApr 24, 2025 am 11:17 AM

中国のハイテク大手は、西部のカウンターパートと比較して、AI開発の別のコースを図っています。技術的なベンチマークとAPI統合のみに焦点を当てるのではなく、「スクリーン認識」AIアシスタントを優先しています。

Dockerは、おなじみのコンテナワークフローをAIモデルとMCPツールにもたらしますApr 24, 2025 am 11:16 AM

MCP：AIシステムに外部ツールにアクセスできるようになりますモデルコンテキストプロトコル（MCP）により、AIアプリケーションは標準化されたインターフェイスを介して外部ツールとデータソースと対話できます。人類によって開発され、主要なAIプロバイダーによってサポートされているMCPは、言語モデルとエージェントが利用可能なツールを発見し、適切なパラメーターでそれらを呼び出すことができます。ただし、環境紛争、セキュリティの脆弱性、一貫性のないクロスプラットフォーム動作など、MCPサーバーの実装にはいくつかの課題があります。 Forbesの記事「人類のモデルコンテキストプロトコルは、AIエージェントの開発における大きなステップです」著者：Janakiram MSVDockerは、コンテナ化を通じてこれらの問題を解決します。 Docker Hubインフラストラクチャに基づいて構築されたドキュメント

6億ドルのスタートアップを構築するために6つのAIストリートスマート戦略を使用するApr 24, 2025 am 11:15 AM

最先端のテクノロジーと巧妙なビジネスの洞察力を活用して、コントロールを維持しながら非常に収益性の高いスケーラブルな企業を作成する先見の明のある起業家によって採用された6つの戦略。このガイドは、建設を目指している起業家向けのためのものです

Googleフォトの更新は、すべての写真の見事なウルトラHDRのロックを解除しますApr 24, 2025 am 11:14 AM

Google Photosの新しいウルトラHDRツール：画像強化のゲームチェンジャー Google Photosは、強力なウルトラHDR変換ツールを導入し、標準的な写真を活気のある高ダイナミックレンジ画像に変換しました。この強化は写真家に利益をもたらします

Descopeは、AIエージェント統合の認証フレームワークを構築しますApr 24, 2025 am 11:13 AM

技術アーキテクチャは、新たな認証の課題を解決しますエージェントアイデンティティハブは、AIエージェントの実装を開始した後にのみ多くの組織が発見した問題に取り組んでいます。

Google Cloud Next2025と現代の仕事の接続された未来Apr 24, 2025 am 11:12 AM

（注：Googleは私の会社であるMoor Insights＆Strategyのアドバイザリークライアントです。） AI：実験からエンタープライズ財団まで Google Cloud Next 2025は、実験機能からエンタープライズテクノロジーのコアコンポーネント、ストリームへのAIの進化を紹介しました

See all articles