1. 상품평 배경 소개
Zhuanzhuan은 중고상품 거래를 주로 하는 전자상거래 플랫폼입니다. 거래 주체에 따라 C2C, C2B, B2C 등의 거래 관계가 형성될 수 있습니다. 예를 들어, Zhuanzhuan 앱의 자유 시장에서 판매용 제품을 개인 사용자가 게시하는 것은 C2C 모델입니다. Zhuanzhuan 회사는 휴대폰 및 기타 전자 제품의 우편 발송 및 방문 재활용 C2B 서비스도 제공합니다. 공식 검사 및 보증 및 애프터 서비스가 제공되는 중고 B2C 제품입니다. 이 기사에서는 Zhuanzhuan B2C 매장의 제품 목록 검토 프로세스에서 이미지 알고리즘을 적용하는 데 중점을 둘 것입니다.
중고품의 비표준 특성으로 인해 동일한 SKU에 속한 다른 재고 제품이라도 품질에 차이가 있습니다. 사용자 경험을 향상시키고 제품 정보의 투명성을 높이기 위해 플랫폼은 중고 제품을 진열할 때 실제 제품 이미지를 사용하고 표준 제품의 렌더링 이미지를 사용하지 않습니다. 여기에는 선반에 있는 각 제품의 관련 디스플레이 사진을 정보 정확성, 화질 등 다양한 측면에서 검토하는 작업이 포함됩니다.
사업 개발 초기 단계에서는 사진의 품질과 정확성을 보장하기 위해 진열대에 있는 제품의 관련 디스플레이 사진을 수동으로 검토합니다. 검토 내용에는 주로 다음과 같은 측면이 포함됩니다.
- 디스플레이 여부. 사진은 "상품이 맞지 않습니다" "보드"가 나타나는 것을 방지하기 위해 실제 제품과 일치합니다.
- 디스플레이 사진의 사진이 선명한지 여부 때때로 간소화된 작업으로 제품 사진을 촬영하는 동안 카메라 초점 오류가 발생할 수 있습니다.
- 휴대폰, 태블릿 등 전자 제품은 오염되지 않고 초점이 맞는지 확인해야 합니다. 변조 방지 라벨을 부품에 부착해야 합니다.
- 앱에 제품 사진을 표시하려면 제품 사진이 있어야 합니다. 제품이 사진 중앙에 오도록 적절하게 잘라야 합니다.
비즈니스가 발전함에 따라 매일 더 많은 제품이 진열되고 있으며 수동 검토로 인해 점차 검토 효율성과 정확성에 몇 가지 문제가 노출되었습니다.
- 검토 작업이 지루하고 피로해지기 쉽습니다.
- 사진의 선명도에 대한 판단은 주관적이며 다양한 리뷰어 간의 리뷰 기준을 맞추기가 어렵습니다.
- 수동 리뷰 처리량이 점점 더 많아지고 있습니다. 선반으로 인해 매장 제품 출시에 병목 현상이 발생합니다.
리뷰 내용의 반복적인 작업을 고려하여 이미지 필드와 관련된 분류, 회귀, 감지 및 기타 기술을 사용하고 알고리즘 모델 출력을 사용하여 수동 판단을 지원하여 리뷰 결과의 정확성을 향상시킬 뿐만 아니라 뿐만 아니라 검토 프로세스의 효율성도 크게 향상됩니다.
2. 자동 검토 계획
검토가 필요한 내용은 다음과 같습니다.
- 제품 표시 사진과 해당 SKU 정보가 일치하는지.
- 제품 사진이 선명한가요?
- 제품에 변조 방지 라벨이 부착되어 있는지 여부.
- 제품이 더러운지.
- 제품이 이미지 중앙에 있는지 여부.
검토의 필요성을 고려하여 다음 솔루션을 설계했습니다.
검토가 필요한 프로젝트 솔루션 제품 표시 사진과 해당 SKU가 일치하는지 여부 이미지가 일치하는지 제품 사진이 선명한지 반품 계획 여부 제품에는 변조 방지 라벨 감지 계획이 있습니다. 제품이 이미지의 중앙 영역에 있는지 여부에 대한 감지 체계입니다.
다음 그림은 해당 제품의 개략도를 보여줍니다. B2C 상품 리스팅 리뷰 주요 리뷰 항목 :
리뷰 지도 예시
2.1, 상품 디스플레이 지도 및 해당 SKU 정보가 일치하나요?
쇼핑몰에서 판매하는 모든 제품은 진열할 제품의 실제 사진을 촬영해야 합니다. 다만, 쇼핑몰에 상품을 올리는 과정에서 수작업 실수 등의 사유로 상품 디스플레이 사진과 해당 SKU 정보가 일치하지 않을 수 있습니다. 간단한 예를 들자면, 해당 제품의 SKU 정보는 iphone11-red인데, 디스플레이 사진은 iphoneX-green입니다. 이 문제는 이미지 분류 문제에 해당할 수 있는데, 이는 이미지 정보를 바탕으로 상품 카테고리를 결정하는 것과 동일하다. 그러나 단순히 분류 알고리즘을 사용하는 것만으로는 문제를 잘 해결할 수 없습니다. 분류를 직접 사용하면 다음과 같은 문제가 있습니다.
입력 이미지가 해당 카테고리에 있는지 여부에 관계없이 카테고리가 출력됩니다.
고정된 카테고리로 인해 새로 추가된 SKU는 처리할 수 없습니다.
위의 분류 방법 문제로 인해 전략을 변경하고 이미지 매칭 솔루션을 사용했습니다. 더 나은 특징 추출기를 훈련한 다음 이미지 일치 방식을 사용하면 새 카테고리를 추가하는 문제를 더 잘 해결할 수 있습니다. 우리가 선택한 솔루션은 기본적으로 얼굴 인식, 사람 재식별, 이미지 검색 및 기타 방향의 학술 솔루션과 일치합니다. 주요 프로세스에는 이미지 특징 추출, 이미지 유사성 계산, 정렬 및 결과 출력이 포함됩니다. 그 중 이미지 특징 추출이 우리 연구의 초점이다. 전통적인 이미지 매칭 특징으로는 SIFT, SURF, ORB 특징 등이 있다. 딥러닝 기반의 이미지 특징 추출은 특징 추출을 위해 주로 CNN 신경망을 사용한다. 아래 사진은 우리의 계획을 보여줍니다:
상품 석 검토 계획
훈련 단계: 훈련 단계에서는 주로 삼중항 손실과 결합된 교차 엔트로피 손실을 사용하여 분류 네트워크를 훈련했습니다. MobileNet, ResNet, ShuffleNet, OSNet 등이 시도되었습니다. 우리의 실험 결과는 ResNet 모델의 정확도가 약간 더 높음을 보여 주므로 ResNet이 백본 네트워크로 선택되었습니다.
삼중 예시
수식 1은 샘플의 출력 값을 나타내고 샘플에 해당하는 레이블을 나타내는 이진 교차 엔트로피 손실 함수를 제공합니다. 공식 2는 앵커 샘플에 해당하는 특징 벡터를 나타내는 삼중 손실 함수를 제공하고, 앵커 샘플과 동일한 카테고리의 샘플에 해당하는 특징 벡터를 나타내며, 앵커 샘플과 다른 카테고리의 샘플에 해당하는 특징 벡터를 나타냅니다. 앵커 샘플. 특징 공간에서 음성 샘플과 앵커 포인트 샘플 사이의 거리에서 양성 샘플과 앵커 포인트 사이의 거리를 뺀 값은 보다 커야 합니다.
교차 엔트로피 손실 함수는 일반적인 분류 손실 함수이고, 삼중 손실 함수는 얼굴 인식 및 보행자 재식별에서 일반적으로 사용되는 손실 함수입니다. 삼중 손실 함수는 특징이 특징 공간의 클러스터에 나타나도록 할 수 있으며, 이점은 보다 강력한 특징을 얻을 수 있다는 것입니다. 삼중항 손실 함수를 단독으로 사용하면 모델이 천천히 수렴하므로, 모델 수렴을 가속화하고 모델 정확도를 향상시키기 위해 공동 지도 학습에 교차 엔트로피 손실과 삼중항 손실을 사용합니다.
테스트 단계: 테스트 단계에서는 학습된 백본이 임베딩 특징을 추출하기 위한 특징 추출기로 선택됩니다. 쿼리 이미지 특징을 추출하고 갤러리 라이브러리에 있는 특징과 코사인 유사성을 계산하여 유사성 정렬 목록을 얻은 후, 정렬된 목록의 top1 이미지에 해당하는 카테고리를 쿼리 이미지의 카테고리 출력으로 선택합니다. 하지만 갤러리를 구축할 때 하나의 SKU는 서로 다른 촬영 장면에 해당하는 세 개의 이미지를 저장했기 때문에 top5 출력에 대해 knn을 수행하고 쿼리 이미지에 해당하는 SKU를 얻었습니다.
온라인 작업: 일치 알고리즘에 의한 SKU 출력이 정확해야 함을 보장하기 위해 정렬된 목록에서 유사도 상위 1개를 출력합니다. 유사도가 특정 임계값보다 낮을 경우 수동 검토를 위해 경보 메시지가 출력됩니다. . 이 전략은 알고리즘에 의해 출력되는 SKU 정보의 정확성을 보장합니다.
2.2.제품이 선명하게 찍히나요?
제품 촬영 과정에서 제품의 움직임이나 초점이 맞지 않아 사진이 흐릿하게 나올 수 있습니다. 사용자에게 더 나은 쇼핑 경험을 제공하기 위해 당사는 해당 제품을 검토 과정에서 반품하고 요구 사항을 충족하는 제품의 사진을 다시 촬영한 후 진열대에 올려 놓을 것입니다. 단순히 이미지가 선명한지 여부에 초점을 맞추는 것은 이미지 분류 문제로 이해될 수 있습니다. 이미지가 흐릿한지 여부에 대한 라벨링은 주관적이며 이진 분류로는 이미지의 흐릿함을 잘 설명할 수 없기 때문에 실제 검토 과정에서 일선 검토자가 약간 흐릿한 이미지에 대해 다른 판단 결과를 내리는 경우가 종종 있습니다. 감사 결과의 일관성에 큰 영향을 미쳐 쇼핑몰 내 제품 진열 효과가 좋거나 나쁠 수 있습니다.
위의 문제를 해결하기 위해 이미지의 흐릿함을 세 가지 수준으로 나눕니다. 흐릿함은 높음부터 낮음까지 뚜렷함, 약간 흐림, 선명함입니다. 그리고 각각 2점, 1점, 0점으로 대응점을 부여합니다. 여러 사람이 동일한 이미지를 평가하고 선명하고 흐릿한 이미지를 동시에 제거하고 나머지 이미지를 수치적으로 정규화하여 이미지의 블러 점수를 얻습니다. 물론 흐릿함의 정도를 뚜렷한 흐릿함, 약간 흐릿함, 미묘한 흐림, 선명함의 네 가지 범주로 세분화할 수 있으며, 더 많은 주석자가 동일한 그림에 표시하도록 하여 더 자세한 레이블 값을 얻을 수 있습니다. 더 나은 예측 결과를 가져옵니다. 그러나 제한된 자원을 고려하여 모호함을 세 가지 수준으로만 나누고 세 명의 학생에게 표시하도록 요청했습니다. 이를 통해 이진 분류 문제를 회귀 문제로 변환하고 비즈니스 표준을 효과적으로 분리할 수 있습니다. 아래 표는 분류 작업을 회귀 작업으로 전환하는 방법을 보여줍니다.
사진명 : 동급생 1점 동급생 2점 동급생 3점 총점 (0~6) 정규화 점수 사진 1은 확실히 흐릿함, 약간 흐릿함, 분명히 흐림 55/6=0.83 사진 2, 약간 흐림, 약간 흐림, 명백함 흐릿함 44/6= 0.67 그림 3은 선명함, 약간 흐릿함 및 선명함 10.17........
마찬가지로 여전히 컨볼루션 신경망을 사용하고 분류 손실을 변경합니다. 함수를 회귀 손실 함수로 변환하기 위해 회귀 작업에 대한 손실 함수로 MSE를 선택했습니다. 이는 샘플의 예측 값을 나타내고 샘플의 레이블을 나타냅니다.
모델의 출력 값은 이미지의 흐림 정도를 나타냅니다. 이진 분류 작업을 회귀 작업으로 전환하면 많은 이점을 얻을 수 있습니다. 첫 번째는 알고리즘 개발과 비즈니스의 분리로, 비즈니스 표준의 변경으로 인해 알고리즘 모델이 무효화되지 않도록 하는 동시에 비즈니스 측면에서는 비즈니스 요구에 따라 퍼지 임계값을 다르게 설정하여 명확성을 제어할 수 있습니다. 쇼핑몰 이미지.
2.3.제품에 변조방지 라벨 부착 여부, 오염 여부, 중앙에 있는지 여부
제품에 변조 방지 라벨 부착 여부, 오염 여부, 그리고 그것이 중앙 지역에 있는지 여부. 이 세 가지 항목 중 변조 방지 라벨과 항목을 감지하는 것은 비교적 간단합니다. 변조 방지 라벨 감지에서 변조 방지 라벨의 기능은 단일이므로 감지 중에 제품이 중앙에 있는지, 항목이 크고 데이터가 큰지 여부를 감지 정확도가 높은 모델을 훈련하는 것이 상대적으로 쉽습니다. 수집하기 쉽고 매우 높은 정확도의 탐지 모델을 학습하는 것도 가능합니다.
일부 먼지 대상이 작고 샘플을 얻기가 쉽지 않기 때문에 먼지 감지가 더 어렵습니다. 이 문제를 해결하기 위해 우리는 더 많은 긍정적인 샘플을 찾기 위해 데이터 수집 과정에서 능동 학습 전략을 선택합니다(탐지 작업의 긍정적인 샘플은 탐지해야 하는 샘플 클래스를 나타냅니다). 방법도 매우 간단합니다. 초기 단계에서 일련의 데이터를 사용하여 탐지 모델을 훈련한 다음, 이 모델을 사용하여 매우 낮은 신뢰도로 레이블이 지정되지 않은 대규모 데이터 배치에서 의심스러운 양성 샘플을 선택한 다음 배치를 수행합니다. 데이터의 라벨을 수동으로 지정합니다. 그런 다음 훈련 모델이 새로운 데이터로 업데이트됩니다. 이 단계를 여러 번 반복하면 최종적으로 수동 탐지와 비슷한 탐지 모델을 얻을 수 있습니다.
2.4. 알고리즘 적용 전략
컴퓨터 비전의 일반적인 분류, 감지 및 기타 작업의 경우 모델의 재현율과 정밀도가 동시에 100% 지표에 도달한다고 보장할 수 없습니다. 실제 비즈니스와 결합해야 하는 경우 정밀도가 높은 모델을 선택할지, 재현율이 높은 모델을 선택할지 고려하세요. 아래 그림은 재현율과 정밀도 사이의 관계에 대한 곡선 그래프를 보여줍니다(그림은 Zhou Zhihua 선생님의 책 에서 따옴)
PR 곡선 그래프
저희 감사 업무에서는 높은 재현율 전략을 채택합니다. 즉, 모델이 요구 사항을 충족하지 않는 제품 이미지를 최대한 많이 찾을 수 있도록 하기 위해 가격은 그에 따라 정확도가 감소한다는 것입니다. 사진 문제가 있는 제품을 리콜한 후에는 당사에서 수동으로 개입하여 검토하므로, 실수로 리콜된 사례는 당사의 비즈니스에 영향을 미치지 않습니다.
알고리즘의 도움으로 현재 항목을 검토하는 학생들의 작업량이 50% 감소했습니다. 알고리즘에 의해 처리된 상품 이미지 중 50%의 상품이 알고리즘을 통과하여 쇼핑몰 앱에 바로 올려질 수 있으며, 나머지 문제가 의심되는 상품은 알고리즘에 의해 식별된 후 수동으로 검토됩니다.
3. 요약
첫 번째 섹션에서는 제품 리뷰가 필요한 이유와 리뷰 내용을 소개했으며, 현재 비즈니스에서 수작업 리뷰가 직면하는 몇 가지 문제점을 분석했습니다. 알고리즘을 통해 비즈니스 이점을 얻을 수 있습니다.
2장에서는 알고리즘 모듈을 자세히 소개합니다. 검토를 위해 나열된 항목에 따라 세 가지 다른 작업을 해결하기 위해 세 가지 방법을 채택했습니다. 또한 알고리즘 구현을 위해 높은 재현율과 예측 정확도를 희생하는 솔루션과 이 솔루션의 타당성을 소개합니다. 마지막으로 알고리즘을 통해 달성한 결과를 제시합니다.
위 내용은 이미지 알고리즘은 효율성을 향상하고 제품 검토를 전송하는 데 도움이 됩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

<p>Windows 11 改进了系统中的个性化功能,这使用户可以查看之前所做的桌面背景更改的近期历史记录。当您进入windows系统设置应用程序中的个性化部分时,您可以看到各种选项,更改背景壁纸也是其中之一。但是现在可以看到您系统上设置的背景壁纸的最新历史。如果您不喜欢看到此内容并想清除或删除此最近的历史记录,请继续阅读这篇文章,它将帮助您详细了解如何使用注册表编辑器进行操作。</p><h2>如何使用注册表编辑

窗户从来不是一个忽视美学的人。从XP的田园绿场到Windows11的蓝色漩涡设计,默认桌面壁纸多年来一直是用户愉悦的源泉。借助WindowsSpotlight,您现在每天都可以直接访问锁屏和桌面壁纸的美丽、令人敬畏的图像。不幸的是,这些图像并没有闲逛。如果您爱上了Windows聚光灯图像之一,那么您将想知道如何下载它们,以便将它们作为背景保留一段时间。以下是您需要了解的所有信息。什么是WindowsSpotlight?窗口聚光灯是一个自动壁纸更新程序,可以从“设置”应用中的“个性化>

随着人工智能技术的不断发展,图像语义分割技术已经成为图像分析领域的热门研究方向。在图像语义分割中,我们将一张图像中的不同区域进行分割,并对每个区域进行分类,从而达到对这张图像的全面理解。Python是一种著名的编程语言,其强大的数据分析和数据可视化能力使其成为了人工智能技术研究领域的首选。本文将介绍如何在Python中使用图像语义分割技术。一、前置知识在深入

那些必须每天处理图像文件的人经常不得不调整它们的大小以适应他们的项目和工作的需求。但是,如果要处理的图像太多,则单独调整它们的大小会消耗大量时间和精力。在这种情况下,像PowerToys这样的工具可以派上用场,除其他外,可以使用其图像调整大小器实用程序批量调整图像文件的大小。以下是设置图像调整器设置并开始使用PowerToys批量调整图像大小的方法。如何使用PowerToys批量调整图像大小PowerToys是一个多合一的程序,具有各种实用程序和功能,可帮助您加快日常任务。它的实用程序之一是图像

得益于 NeRF 提供的可微渲染,近期的三维生成模型已经在静止物体上达到了很惊艳的效果。但是在人体这种更加复杂且可形变的类别上,三维生成依旧有很大的挑战。本文提出了一个高效的组合的人体 NeRF 表达,实现了高分辨率(512x256)的三维人体生成,并且没有使用超分模型。EVA3D 在四个大型人体数据集上均大幅超越了已有方案,代码已开源。论文名称:EVA3D: Compositional 3D Human Generation from 2D image Collections论文地址:http

论文链接:https://arxiv.org/pdf/2207.09519.pdf代码链接:https://github.com/gaopengcuhk/Tip-Adapter一.研究背景对比性图像语言预训练模型(CLIP)在近期展现出了强大的视觉领域迁移能力,可以在一个全新的下游数据集上进行 zero-shot 图像识别。为了进一步提升 CLIP 的迁移性能,现有方法使用了 few-shot 的设置,例如 CoOp 和 CLIP-Adapter,即提供了少量下游数据集的训练数据,使得 CLIP

新视角图像生成(NVS)是计算机视觉的一个应用领域,在1998年SuperBowl的比赛,CMU的RI曾展示过给定多摄像头立体视觉(MVS)的NVS,当时这个技术曾转让给美国一家体育电视台,但最终没有商业化;英国BBC广播公司为此做过研发投入,但是没有真正产品化。在基于图像渲染(IBR)领域,NVS应用有一个分支,即基于深度图像的渲染(DBIR)。另外,在2010年曾很火的3D TV,也是需要从单目视频中得到双目立体,但是由于技术的不成熟,最终没有流行起来。当时基于机器学习的方法已经开始研究,比

如何使用Python对图片进行图像去噪处理图像去噪是图像处理中的一项重要任务,它的目的是去除图像中的噪声,提高图像的质量和清晰度。Python是一种功能强大的编程语言,拥有丰富的图像处理库,如PIL、OpenCV等,可以帮助我们实现图像去噪的功能。本文将介绍如何使用Python对图片进行图像去噪处理,并给出相应的代码示例。导入所需的库首先,我们需要导入所需的


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

드림위버 CS6
시각적 웹 개발 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.
