ホームページ >テクノロジー周辺機器 >AI >画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます
Zhuanzhuan は、主に中古品の取引を行う電子商取引プラットフォームです。取引エンティティに応じて、C2C、C2B、B2C、およびその他の取引関係を形成できます。例えば、個人ユーザーが Zhuanzhuan アプリのフリーマーケットで販売する商品を公開する C2C モデルであり、Zhuanzhuan 社は携帯電話やその他の電子製品の郵送と戸別訪問リサイクルの C2B サービスを提供しています。正規検品・保証・アフターサービス付きの中古B2C商品です。この記事では、Zhuanzhuan B2C ストアの商品リストのレビュー プロセスにおける画像アルゴリズムの適用に焦点を当てます。
中古品は規格外であるため、同じSKU内の異なる在庫品であっても品質に差がございます。ユーザーエクスペリエンスを向上させ、製品情報の透明性を高めるため、プラットフォームでは中古品を表示する際に実際に撮影された製品画像を使用し、標準品のレンダリング画像の使用を避けています。これには、棚にある各商品の関連する展示写真を、情報の正確性や画質などのさまざまな観点からレビューすることが含まれます。
ビジネス開発の初期段階では、棚にある商品の関連する展示写真を手動でレビューして、写真の品質と正確性を確認します。レビューの内容には主に次の側面が含まれます:
ビジネスの発展に伴い、日々多くの製品が店頭に並べられ、手作業によるレビューではレビューの効率と精度におけるいくつかの問題が徐々に明らかになります。レビュー作業は退屈で、疲労しやすく、手動レビューではエラーが発生する可能性が高くなります。
2.1. 製品に画像が表示されるかどうか
#モールで販売されるすべての商品はレビューする必要があります。実際の商品は写真に撮られ、展示されていますが、モールの棚に商品を並べる過程で手作業によるミスが発生するため、その他の状況により、製品表示画像と対応する SKU 情報が一致しない場合があります。簡単な例を挙げると、製品のSKU情報はiphone11-redですが、表示画像はiphoneX-greenです。この問題は、画像情報に基づいて商品カテゴリを決定することに相当する画像分類問題に相当する。しかし、単に分類アルゴリズムを使用するだけでは問題を十分に解決できません。分類を直接使用すると、次のような問題があります。 。カテゴリが固定されているため、新しく追加された SKU は処理できません。
分類方法に関する上記の問題のため、戦略を変更し、画像マッチング スキームを使用しました。より優れた特徴抽出器をトレーニングし、画像マッチング スキームを使用することで、新しいカテゴリを追加する問題をより適切に解決できます。私たちが選択したソリューションは、顔認識、人物再識別、画像検索などの学術ソリューションと基本的に一致しており、主なプロセスには画像特徴抽出、画像類似度計算、ソート、結果出力が含まれます。その中でも画像特徴抽出が私たちの研究の焦点です. 従来の画像マッチング特徴には SIFT, SURF, ORB 特徴などが含まれます. ディープラーニングに基づく画像特徴抽出では主に CNN ニューラルネットワークを特徴抽出に使用します.下の図は私たちの計画を示しています:
商品のレビュー計画トレーニング フェーズ: トレーニング フェーズでは、主にクロスエントロピー損失と三重項損失を組み合わせて分類ネットワークをトレーニングします。バックボーン ネットワークでは、MobileNet、ResNet、ShuffleNet、OSNet などが試行されています。実験の結果、ResNet モデルの精度がわずかに高いことが示されたため、バックボーン ネットワークとして ResNet が選択されました。
#トリプルの例式 1 はバイナリのクロスエントロピー損失関数を示します。ここで、 は出力を表します。サンプルの値であり、サンプルに対応するラベルを表します。式 2 は、アンカー サンプルに対応する特徴ベクトルを表し、アンカー サンプルと同じカテゴリのサンプルに対応する特徴ベクトルを表し、アンカー サンプルとは異なるカテゴリのサンプルに対応する特徴ベクトルを表す三重項損失関数を与えます。アンカーサンプル。特徴空間では、ネガティブ サンプルとアンカー ポイント サンプルの間の距離からポジティブ サンプルとアンカー ポイントの間の距離を引いた値が より大きくなければなりません。 クロスエントロピー損失関数は一般的な分類損失関数であり、トリプレット損失関数は顔認識や歩行者の再識別で一般的に使用される損失関数です。三重項損失関数を使用すると、特徴空間内で特徴をクラスターとして表示できるため、より堅牢な特徴を取得できるという利点があります。三重項損失関数を単独で使用するとモデルの収束が遅くなるため、共同教師あり学習にクロスエントロピー損失と三重項損失を使用してモデルの収束を加速し、モデルの精度を向上させます。 テスト段階: テスト段階では、トレーニングされたバックボーンが、埋め込み特徴を抽出する特徴抽出器として選択されます。クエリ画像の特徴を抽出し、ギャラリー ライブラリ内の特徴とのコサイン類似度を計算して類似度ソート リストを取得し、ソート リスト内の上位 1 画像に対応するカテゴリをクエリ画像のカテゴリ出力として選択します。しかし、ギャラリーを構築していたとき、1 つの SKU にさまざまな撮影シーンに対応する 3 つの画像が保存されていたため、top5 出力に対して knn を実行し、クエリ画像に対応する SKU を取得しました。 オンライン操作: 照合アルゴリズムによる SKU 出力が正確であることを保証するために、ソートされたリストの上位 1 位の類似度を出力します。類似度が特定のしきい値未満の場合、アラーム メッセージが表示されます。手動レビュー用に出力されます。この戦略により、アルゴリズムによって出力される SKU 情報の正確さが保証されます。 2.2. 商品は鮮明に撮影されていますか? 商品の撮影中に商品が動いたり、ピントが合わなかったりして、商品がぼやけて撮影されます。ユーザーにより良いショッピング体験を提供するために、レビュープロセス中にこれらの商品を返品し、要件を満たす商品の写真を撮り直してから棚に並べます。画像が鮮明であるかどうかに注目するだけでも、画像分類の問題として理解できます。画像がぼやけているかどうかのラベル付けは主観的なものであり、二値分類では画像のぼやけ具合をうまく表現できないため、実際のレビューでは、少しぼやけた画像に対して第一線のレビュー担当者が異なる判定結果を与えることが多く、このような状況が大きく影響します。レビュー結果の一貫性が、モール内での商品表示効果の良し悪しにつながります。 上記の問題を解決するために、画像のぼやけ度を、高いぼけから低いぼけまで、明らかにぼけている、少しぼやけている、はっきりしているという 3 つのレベルに分けます。そして、対応する点をそれぞれ 2 点、1 点、0 点として与えます。複数の人が同じ画像を評価し、明らかにぼやけている画像と鮮明な画像を同時に削除し、残りの画像を数値的に正規化して画像のぼやけスコアを取得します。もちろん、ぼやけの程度を明らかなぼやけ、わずかなぼやけ、微妙なぼやけ、鮮明などの 4 つのカテゴリに細分化し、より多くのアノテーターが同じ画像をマークできるようにすることで、より詳細なラベル値を取得できます。より良い予測結果をもたらします。ただし、限られたリソースを考慮して、あいまいさを 3 つのレベルに分け、3 人の学生に注釈を付けるように依頼しただけでした。これから、バイナリ分類問題を回帰問題に変換し、ビジネス標準を適切に分離できます。以下の表は、分類タスクを回帰タスクに変換する方法を示しています。写真名: クラスメイト 1 点 クラスメイト 2 点 クラスメイト 3 点 合計スコア (0-6) 正規化スコア 写真 1 は明らかにぼやけている、わずかにぼやけている、明らかにぼやけている 55/6=0.83 写真 2、わずかにぼやけているぼやけ、わずかにぼやけている 明らかなぼやけ 44/6=0.67 写真 3 鮮明 わずかにぼやけている 鮮明 10.17....
同じ、まだ畳み込みニューラル ネットワークを使用し、分類損失関数を回帰損失関数に変更します。回帰タスクの損失関数として MSE を選択します。これはサンプルの予測値を表し、サンプルのラベルを表します。 モデルの出力値は画像のぼやけ度を表します。二項分類タスクを回帰タスクに変えると、多くの利点が得られます。 1 つ目は、アルゴリズム開発とビジネスを切り離すことで、ビジネス標準の変更によってアルゴリズム モデルが無効にならないようにすると同時に、ビジネス側がビジネス ニーズに応じて異なるファジーしきい値を設定し、アルゴリズムの明確さを制御できるようにすることです。商店街のイメージ。製品に改ざん防止ラベルが付いているかどうかに対処するために、検出ソリューションを使用しています。ラベル、汚れの有無、中央部の有無。これら 3 つのアイテムの中で、改ざん防止ラベルとアイテムの検出は比較的簡単です。改ざん防止ラベルの検出では、改ざん防止ラベルの特徴が単一であるため、検出精度の高いモデルの学習が比較的容易であり、検出時に製品が中央にあれば、アイテムが大きく、データが収集が容易で、精度の高い製品の学習も可能 検出モデル。
一部の汚染ターゲットは小さく、サンプルの入手が容易ではないため、汚染の検出はさらに困難になります。この問題に対処するために、データ収集プロセス中にアクティブ ラーニング戦略を選択して、より多くの陽性サンプルを見つけます (検出タスクの陽性サンプルは、検出する必要があるサンプル クラスを指します)。この方法も非常に簡単で、初期段階でデータのバッチを使用して検出モデルをトレーニングし、次にそのモデルを使用してラベルのないデータの大規模なバッチから信頼度が非常に低い疑わしい陽性サンプルを選択し、バッチにその後、トレーニング モデルが新しいデータで更新されるというサイクルが行われます。このステップを複数回繰り返すことで、最終的に手動検出と同等の検出モデルを取得できます。
コンピューター ビジョンにおける一般的な分類、検出、その他のタスクでは、モデルの再現率と精度が同時に 100% の指標に達することを保証できません。 、実際の実務 申請の際には、実際の業務を踏まえて高精度な状態でモデルを選択するか、高再現率な状態でモデルを選択するかを検討する必要があります。下の図は、再現率と精度の関係を示す曲線図です (画像は、周志華先生の本 から引用しています)
PR 曲線図
当社のレビュー ビジネスでは、高再現率戦略を採用しています。これは、モデルが要件を満たさない商品画像をできるだけ多く見つけられるようにすることを意味しますが、それに応じて精度が低下するというコストがかかります。写真に問題がある製品をリコールした後は、手動で介入してレビューを行うため、誤ってリコールされた例が当社のビジネスに影響を与えることはありません。
アルゴリズムのおかげで、現在項目をレビューしている学生の作業負荷は 50% 削減されました。アルゴリズムで処理された商品画像のうち、アルゴリズムを通過してモールアプリに直接掲載できる商品は50%で、残りの問題が疑われる商品はアルゴリズムで特定され、手作業で審査される。
最初のセクションでは、製品レビューの背景、レビューが必要な理由、レビューの内容を紹介し、手動レビューで直面する問題点についても分析しました。次に、アルゴリズムを活用したビジネスによってもたらされるメリットについて説明します。
セクション 2 では、アルゴリズム モジュールを詳しく紹介します。レビューのためにリストされた項目に応じて、3 つの異なるタスクを解決するために 3 つの方法を採用しました。また、アルゴリズムを実装する際に高い再現率と予測精度を犠牲にする解決策と、この解決策の実現可能性についても紹介し、最後にアルゴリズムによって達成される結果を示します。
以上が画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。