一、商品審核背景介紹
轉轉是主營二手商品交易的電商平台。根據交易主體的不同,可以形成C2C、C2B、B2C等交易關係。例如個人用戶在轉轉app的自由市場發布商品進行販售屬於C2C模式、轉公司提供手機和其他電子產品的郵寄與上門回收C2B服務,轉轉app也提供官方驗和保固與售後的二手B2C商品。本文將重點放在轉轉 B2C 賣場商品上架審核過程中影像演算法的應用。
由於二手商品的非標品性質,即使同一sku下的不同庫存商品間也存在著成色差異。平台為了提升使用者體驗,增加商品資訊的透明度,在展示二手商品時全部採用實拍商品圖,避免使用渲染的標品圖片。這涉及到對每個上架商品的相關展示圖片進行資訊準確性、圖片品質等各方面的審核問題。
業務發展初期,上架商品的相關展示圖片均由人工審核來確保圖片的品質和準確性,審核的內容主要有以下幾個面向:
- ##展示圖與實際商品是否一致,避免「貨不對板」的情況出現;
- 展示圖照片是否清晰,流水化作業的商品圖拍攝過程中偶爾會出現相機對焦失誤的情況;
- 手機、平板電腦等電子產品需要保證沒有髒污,並在重點部位貼防拆標;
- 為了商品圖片在app中的展示效果,要對商品圖進行適當剪裁使得商品在圖片中居中。
- 圖片清晰度的判斷偏主觀,不同審核人員之間的審核標準很難拉齊;
- 人工審核處理量已經逐漸落後於商品上架量,對於賣場商品的發布造成了瓶頸。
- 針對審核內容裡面的重複性工作,我們使用了影像領域相關的分類、迴歸、偵測等技術,用演算法模型輸出輔助人工判斷,在提升了審核結果的準確度的同時大幅提升了審核流程的效率。
二、自動審核方案
上架審核需要審核的內容包括以下幾點:
商品展示圖和對應的sku資訊是否一致。- 商品拍攝是否清晰。
- 商品是否貼了防拆標。
- 商品是否髒污。
- 商品是否處於影像中心區域。
- 針對需要審核需要,我們設計瞭如下解決方案:
審核範例圖
2.1、商品展示圖與對應的sku資訊是否一致
商城販售商品都需要對商品進行實體拍照展示,但是在商品上架到商城的過程中,由於人工失誤等情況,會出現商品展示圖和對應的sku資訊不符的情況。舉個簡單的例子,商品的sku資訊是iphone11-紅色,但是展示圖卻是iphoneX-綠色。這個問題可以和影像分類問題對應上,相當於根據影像訊息,判斷商品類別。但是簡單的使用分類演算法無法很好的解決我們的問題,直接使用分類存在以下問題:
類別是有限的,不管輸入圖像是否在類別中,都一定會輸出一個類別。
由於類別的固定,導致無法處理新增的sku。
由於分類方法存在上面的問題,我們改變了策略,使用圖像匹配的方案。我們訓練一個較好的特徵提取器,再使用影像匹配方案,就可以較好的解決新加類別的問題。我們選取的方案和學術中的Face Recognition 、Person Re-Identification、Image Retrieval等方向的解決方案基本上一致,主要流程包括影像特徵擷取、影像相似度計算、排序、輸出結果。其中影像特徵擷取這塊是大家研究的重點方向,傳統影像配對特徵包括SIFT、SURF、ORB特徵等,基於深度學習的影像特徵擷取主要是CNN神經網路進行特徵擷取。下圖給了我們的方案:
商品suk審核方案
訓練階段:訓練階段主要是使用交叉熵損失聯合三元組損失訓練一個分類網絡,其中骨幹網絡嘗試了MobileNet、ResNet、ShuffleNet、OSNet等。我們的實驗結果顯示ResNet模型的精確度略高,因此選取了ResNet作為我們的骨幹網路。
三元組範例
公式1給出的是二分類交叉熵損失函數,其中表示樣本的輸出值,表示樣本對應的標籤。公式2給出了三元組損失函數,表示錨點樣本對應的特徵向量,表示與錨點樣本類別相同的樣本對應的特徵向量,表示與錨點樣本不同類別的樣本對應的特徵向量。特徵空間內,負樣本距離錨點樣本的距離減去正樣本到錨點的距離應大於。
交叉熵損失函數是常見的分類損失函數,三元組損失函數是人臉辨識、行人重識別常用的損失函數。三元組損失函數,可以使特徵在特徵空間呈現一簇一簇的特徵,其帶來的好處就是可以得到更穩健的特徵。若單獨使用三元組損失函數,模型的收斂速度較慢,因此我們使用交叉熵損失和三元組損失進行聯合監督學習,以加速模型收斂,同時提升模型精確度。
測試階段:測試階段選取訓練好的backbone做特徵提取器,用來提取embedding特徵。擷取查詢影像特徵並與gallery庫中的特徵計算餘弦相似度,得到相似性排序列表,再選取排序列表中top1影像對應的類別作為查詢影像的類別輸出。但是我們在建構gallery時,一個sku存放了三張影像,對應著不同的拍攝場景,因此我們對top5輸出進行knn後得到查詢影像對應的sku。
上線運行:為了確保匹配演算法輸出的sku一定是準確的,我們輸出了排序列表中的top1相似度,當相似度小於一定值threshold時,會輸出警報訊息,進行人工審核。這個策略保證了演算法輸出的sku資訊準確性。
2.2、商品拍攝是否清晰
拍攝商品的過程中,由於商品移動或沒對好焦距,導致拍攝出的商品較為模糊。為了帶給用戶更好的購物體驗,我們會在審核的過程中打回這些商品,重新拍出符合要求的商品圖後才能上架。單純針對影像拍照是否清晰,可以理解為影像分類問題。由於影像是否模糊的標註具有主觀性,同時二分類無法很好的刻畫出影像的模糊度,因此在實際的審核過程中,一線審核人員對於輕微模糊的影像往往會給出不同的判定結果,這類情況大大的影響了審核結果的一致性,導致商城中的商品展示效果有好有壞。
為了解決上面的問題,我們把影像的模糊度分成三個級別,模糊度由高到低分別是明顯模糊、輕微模糊、清晰。並給出對應的分值,分別為2,1,0分。多人對同一張圖進行評分,並去掉同時出現打分為明顯模糊且清晰的影像,剩餘的影像進行數值歸一化,得到影像的模糊度分值。當然,我們可以把模糊程度細分為四類,例如明顯模糊,輕微模糊、細微模糊、清晰,並且讓更多的標註人員標註同一張圖,這樣我們可以得到更加細膩的標籤值,這樣也能帶來更好的預測結果。但鑑於資源有限,我們只把模糊度分成三個級別,讓三個同學來標註。由此,我們把二分類問題轉化為了回歸問題,可以很好的隔離到業務標準。下面的表格給了我們如何把分類任務變成迴歸任務。
圖片名同學一打分同學二打分同學三打分總分(0-6)歸一化得分圖片1明顯模糊輕微模糊明顯模糊55/6=0.83圖片2輕微模糊輕微模糊明顯模糊44/6=0.67圖片3清晰輕微模糊清晰10.17..................
一樣的,我們還是使用卷積神經網絡,然後把分類損失函數變成回歸損失函數,我們選用了MSE作為回歸任務的損失函數,其中表示樣本的預測值,表示樣本的標籤。
模型的輸出值代表影像的模糊程度,我們把二分類任務變成迴歸任務後,可以帶來許多好處。首先就是演算法開發與業務解耦合,不會因為業務標準的變更導致演算法模型失效;同時業務方可以根據業務需求設定不同的模糊度閾值用來控製商城影像的清晰程度。
2.3、商品是否貼了防拆標、是否髒污、是否處於中心區域
針對商品是否貼了防拆標、是否髒污、是否處於中心區域問題,我們使用檢測方案。這三個項中,防拆標和物品的偵測都較為簡單。防拆標檢測中的防拆標特徵單一,因此比較容易訓練出一個檢測準確率相當模型;商品是否居中檢測中,物品較大,且數據好收集,也能訓練出一個準確率相當高的商品檢測模型。
髒污的偵測則比較困難,因為部分髒污目標較小,且樣本不易取得。針對這個問題,我們在資料收集的過程中選取主動學習的策略去尋找到更多正樣本(檢測任務中的正樣本指的是我們需要檢測的樣本類)。其方式也很簡單,我們在初期使用一批資料訓練偵測模型,接著用該模型以非常低的置信度在大批量未標註的資料中選取可疑正樣本,再讓人工對該批次資料標註,隨後再用新資料更新訓練模型,這便是一輪。我們可以重複這個步驟,最後可以得到一個媲美人工的檢測模型。
2.4、演算法的應用策略
對於電腦視覺中常見的分類、偵測等任務,我們無法同時保證模型的召回和精確度同時達到100%的指標,因此在實際的應用過程中,需要結合實際業務,考慮選取模型是採用高精準度還是高召回的狀態。下圖給出了召回率和精確度關係的曲線圖(圖片來自週志華老師的一書)
PR曲線圖
針對我們的審核業務,我們採取的是高召回策略,也就是保證模型可以盡可能把不符合要求的商品圖都找出來,其代價就是精確度會相應的降低。我們召回有拍攝有問題商品後,會人工介入審核,因此那些被誤召回的例子不會對業務造成影響。
在演算法的輔助下,目前上架審核同學的工作量降低了50%。經過演算法的商品圖像中,有50%的商品通過演算法,可以直接上架到商城app,剩餘的疑似有問題的商品都會被演算法辨識出來,然後再人工複審。
三、總結
我們在第一節介紹了商品上架審核的背景,我們為什麼要審核以及審核的內容,同時分析了目前業務中人工審核面臨的一些問題,然後給出了演算法賦能業務帶來的好處。
在第二節,我們詳細的介紹了演算法模組。根據上架審核項的不同,我們採用了三種方式分別去解決三個不同的任務。並介紹了演算法應用落地所選取的高召回率犧牲預測精確度的方案,以及此方案的可行性,最後給出了演算法上線所取得的效果。
以上是影像演算法助力提效轉轉商品審核的詳細內容。更多資訊請關注PHP中文網其他相關文章!

由於AI的快速整合而加劇了工作場所的迅速危機危機,要求戰略轉變以外的增量調整。 WTI的調查結果強調了這一點:68%的員工在工作量上掙扎,導致BUR

約翰·塞爾(John Searle)的中國房間論點:對AI理解的挑戰 Searle的思想實驗直接質疑人工智能是否可以真正理解語言或具有真正意識。 想像一個人,對下巴一無所知

與西方同行相比,中國的科技巨頭在AI開發方面的課程不同。 他們不專注於技術基準和API集成,而是優先考慮“屏幕感知” AI助手 - AI T

MCP:賦能AI系統訪問外部工具 模型上下文協議(MCP)讓AI應用能夠通過標準化接口與外部工具和數據源交互。由Anthropic開發並得到主要AI提供商的支持,MCP允許語言模型和智能體發現可用工具並使用合適的參數調用它們。然而,實施MCP服務器存在一些挑戰,包括環境衝突、安全漏洞以及跨平台行為不一致。 Forbes文章《Anthropic的模型上下文協議是AI智能體發展的一大步》作者:Janakiram MSVDocker通過容器化解決了這些問題。基於Docker Hub基礎設施構建的Doc

有遠見的企業家採用的六種策略,他們利用尖端技術和精明的商業敏銳度來創造高利潤的可擴展公司,同時保持控制。本指南是針對有抱負的企業家的,旨在建立一個

Google Photos的新型Ultra HDR工具:改變圖像增強的遊戲規則 Google Photos推出了一個功能強大的Ultra HDR轉換工具,將標準照片轉換為充滿活力的高動態範圍圖像。這種增強功能受益於攝影師

技術架構解決了新興的身份驗證挑戰 代理身份集線器解決了許多組織僅在開始AI代理實施後發現的問題,即傳統身份驗證方法不是為機器設計的

(注意:Google是我公司的諮詢客戶,Moor Insights&Strateging。) AI:從實驗到企業基金會 Google Cloud Next 2025展示了AI從實驗功能到企業技術的核心組成部分的演變,


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

記事本++7.3.1
好用且免費的程式碼編輯器

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),