>  기사  >  기술 주변기기  >  Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

王林
王林앞으로
2023-04-12 21:28:041271검색

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

이 글에서는 Taobao의 개인화된 추천 시나리오에서 적응형 및 비지도 다중 시나리오 모델링에 대한 생각과 사례를 공유합니다. 이 연구는 CIKM 2022(논문 제목: 다중 시나리오 개인화 추천을 위한 Scenario-Adaptive and Self-Supervised Model for Multi-Scenario Personalized Recommendation)에 게재되었습니다. 이 기사에서는 다중 시나리오 모델링이 도메인 적응을 달성하기 위해 전체 도메인 시나리오와 단일 시나리오 간의 마이그레이션 관계를 세분화된 방식으로 설명하는 방법과 감독되지 않은 데이터를 다중 시나리오 모델링에 도입하는 방법에 대해서도 소개합니다. 추천 및 회상의 다중 시나리오 모델링.

1. 배경 소개 및 솔루션 동기

먼저 멀티 시나리오 모델링의 사업 배경, 모델링 동기 및 솔루션 선택을 소개합니다. 이 기사에서는 추천 시스템의 다중 시나리오 모델링 문제에 중점을 둘 것입니다. 이 문제는 다양한 추천 시스템에서 흔히 발생하는 문제이며 시급히 해결해야 할 문제입니다. 구체적으로는 5문제 정도 소개될 예정이다.

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

1. 멀티 시나리오

란 무엇입니까? 비즈니스 관점과 모델 관점에서 설명할 수 있습니다. 비즈니스 관점에서 "시나리오"는 단순히 추천 플랫폼의 다양한 추천 포털 또는 추천 호스팅 페이지로 이해될 수 있습니다. 예를 들어, 광고 분야에서는 동일한 광고가 서로 다른 미디어 단말기에 게재될 수 있으며 동시에 정보 흐름 광고 또는 오픈 스크린 광고와 같은 서로 다른 전달 형태에 대응할 수 있습니다. 전자상거래 분야에서도 매우 풍부한 추천 페이지가 있을 것입니다. 타오바오를 예로 들면, 홈페이지에는 마음에 드는 제품 추천 인터페이스가 있고, 장바구니에는 추천 시나리오가 있고, 관련 추천 페이지도 있습니다. 제품 상세페이지 입니다. 우리의 실제 비즈니스인 타오바오 쇼핑과 같은 콘텐츠 추천 분야에서 추천 페이지에는 1홉, 2열 디스플레이 장면은 물론, 클릭 후 입력 후 위아래로 슬라이드되는 몰입형 끝없는 추천 흐름이 포함됩니다. 두 번째 홉. 이 예에서는 호스팅된 각 페이지를 장면으로 사용할 수 있으며 동일한 추천 플랫폼에도 여러 추천 장면이 있어 여러 장면의 특성을 보여줍니다.

모델 모델링의 관점에서 다중 시나리오 문제는 동일한 기능 공간과 레이블 공간을 공유하지만 데이터 분포가 다른 여러 데이터 세트로 간단히 정의할 수 있습니다. 각 추천 시나리오에 기록된 데이터는 해당 데이터 세트를 형성할 수 있습니다. 각 데이터 세트는 서로 다른 소스에서 제공되지만 해당 기능 시스템과 레이블 공간은 일관됩니다.

2. 다중 시나리오의 특징

​첫 번째는 사용자 관점에서 보면 동일한 사용자에 대해 추천 상품이나 시나리오 기반의 추천 시스템에서 서로 다른 상품에 접근할 수 있다는 것입니다. , 탐색 및 클릭과 같은 일부 대화형 동작은 여러 시나리오에 남아 있습니다.

두 번째 포인트는 광고든, 제품이든, 콘텐츠든 공급이 서로 다른 장면에 배치되고 표시될 수 있다는 것입니다.

세 번째 요점은 행동 모델에서 동일한 사용자가 여러 다른 시나리오를 방문하고 동일한 광고, 제품에 대해 공급 측면에서도 마찬가지로 사용자의 행동이 다를 수 있다는 것입니다. 또는 콘텐츠에 따라 다른 장면에서 표시되는 노출 성능과 상호 작용 성능도 다릅니다. 따라서 데이터 배포 측면에서 시나리오마다 차이가 있습니다. 따라서 현재 우리가 직면하고 있는 다중 시나리오 추천 문제는 시나리오의 공통성과 특성에 대한 특성화를 구현합니다. 즉, 사용자는 지속 가능한 관심을 가질 수 있지만 서로 다른 시나리오에서 표현이 다를 수 있습니다.

네 번째 요점은 장면 간 특징 공간과 목표가 일관적이라는 것입니다. 장면이 다르면 데이터 분포의 차이가 더 많이 반영되지만, 특징 시스템은 실제로 상대적으로 일관됩니다. 또한 장면 간의 레이블 공간이 동일합니다. 이는 여러 장면 간의 모델링 작업이 실제로 동일하다는 것을 의미합니다. 예를 들어 제품 장면에서 클릭 작업을 모델링하거나 콘텐츠 장면에서 완료 또는 장시간 재생 작업을 모델링합니다. ​

3. 질문 3: 다중 시나리오 모델링의 목표

​구체적인 사업 배경을 바탕으로 다중 시나리오 문제 모델링을 통해 다음 두 가지 목표를 달성하는 데 중점을 두고 싶습니다.

첫 번째는 데이터 희박 문제를 최적화하는 데 중점을 둔 성능 목표입니다. 단일 추천 시나리오는 일반적으로 사용자 행동 데이터가 부족하다는 문제에 직면하며, 이 현상은 일부 소규모 시나리오나 새로운 시나리오에서 특히 두드러집니다. 다중 시나리오 문제의 중요한 목표 중 하나는 여러 시나리오 간의 정보 공유를 통해 데이터 희박 문제를 완화하고 모든 시나리오의 비즈니스 지표를 개선하는 것입니다.

두 번째 목표는 반복과 운영 및 유지 관리 비용 측면입니다. 기존의 최적화 방법은 각 시나리오에 대해 독립적인 모델을 유지하고 최적화하기 위해 전담 인력을 할당하는 것입니다. 일부 새로운 시나리오가 연결되면 전체를 반복해야 할 수도 있습니다. 액세스 프로세스 및 모델 교육 프로세스. 이는 모든 인력 할당, 모델 배포 작업 및 유지 관리 비용이 시나리오 수와 긍정적으로 관련되어 있어 전체 유지 관리 비용과 반복 비용이 상대적으로 높아진다는 것을 의미합니다.

실제 비용을 고려하여 다양한 시나리오를 동시에 제공하고 새로운 시나리오에 대한 신속한 접근을 지원할 수 있는 통합 알고리즘 프레임워크 세트를 구축하는 것이 다중 시나리오 모델링을 통해 달성하고자 하는 또 다른 목표입니다.

다중 시나리오 문제는 현재 알려진 다중 목표 및 교차 도메인 문제와 다르다는 점도 강조해야 합니다. 다중 시나리오 문제의 초점은 동일한 기능 시스템을 공유하고, 다양한 데이터 소스를 갖고, 동일한 목표를 갖는 것입니다. 다중 목표는 동일한 데이터 소스에 대해 여러 가지 다른 최적화 목표를 갖는 것을 의미합니다. 크로스 도메인 문제는 일반적으로 소스 도메인과 대상 도메인으로 구분됩니다. 일반적으로 소스 도메인의 데이터 양과 효과가 우수하다고 가정하고 소스 도메인을 사용하여 대상 도메인의 효과를 향상시킵니다. . 다중 시나리오 문제에서는 각 시나리오의 장점과 단점 사이에 관계가 없습니다. 모델링 목표는 모든 시나리오의 효과를 향상시키는 것입니다. ​

4. 질문 4: 다중 시나리오 문제에 대한 관련 솔루션

실제 적용 초기 단계에서 이 다중 시나리오 문제를 모델링하기 위해 업계의 기존 솔루션을 간단하게 분류했습니다. 크게 다음 4가지 유형으로 나뉩니다.

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

​첫 번째가 가장 직관적이고 현재 많은 비즈니스 실무에서 사용되는 솔루션이기도 합니다. 즉, 각 개별 시나리오에 대해 이러한 시나리오의 해당 데이터를 사용하여 별도의 모델을 학습합니다. 그런 다음 온라인 배포 및 추정 중에 각 시나리오에는 별도의 모델이 있습니다. 이러한 방식으로 업계의 기존 모델 구조를 선택하여 다양한 시나리오에서 모델링할 수 있습니다.

물론 이 솔루션에도 몇 가지 단점이 있는데, 주로 다음 사항에 중점을 둡니다. 첫 번째 요점은 이 방법이 단일 장면의 데이터 희박 문제를 잘 해결할 수 없다는 것입니다. 이는 동일한 유형의 다른 장면을 활용할 수 없기 때문입니다. 기능 정보가 보완됩니다. 특히 데이터 양이 상대적으로 적거나 행동 데이터가 희박한 일부 시나리오에서는 데이터 희박 문제가 더욱 두드러집니다. 앞서 언급한 두 번째 점은 이러한 단일 시나리오 단일 모델 모델링 방법은 모델 유지 관리 및 반복 비용 측면에서 상대적으로 많은 인력과 자원을 소비한다는 것입니다. 세 번째 요점은 비즈니스에 새로운 시나리오가 도입되면 비용이 높아진다는 문제도 있다는 것입니다.

단일 장면과 단일 모델 방식은 샘플이 희소하다는 문제가 있기 때문에 두 번째 해결 방법은 모든 장면의 샘플 데이터를 혼합하고 혼합된 데이터로 모델을 학습시킨 다음 동일한 모델을 모든 장면에 배포하는 것입니다. 이 방법은 첫 번째 유형의 방식에서 두 가지 문제를 완화할 수 있습니다. 왜냐하면 이 방식은 모든 장면의 샘플을 사용하고 모든 장면이 동일한 모델을 공유하기 때문입니다. 그러나 데이터 샘플의 상대적으로 거친 혼합 훈련으로 인해 각 장면 간의 데이터 분포가 파괴되고 약간의 노이즈가 발생한다는 단점이 있습니다. 또한 전체 모델 효과는 일부 큰 장면의 데이터에 의해 지배될 수 있으므로 일부 작은 장면의 효과에 영향을 미칠 수 있습니다.

세 번째 유형의 솔루션은 2단계 학습 방법을 사용하는 것입니다. 즉, 먼저 모든 시나리오의 샘플에 대해 혼합 학습을 수행하여 기본 모델을 학습한 다음 각 장면의 독립적인 샘플을 사용하여 원본에 대한 장면 학습을 수행하는 것입니다. 기본 모델. 내부 미세 조정. 모델 배포 및 추정 측면에서도 각 시나리오를 온라인에 올려 자체 장면 데이터로 미세 조정된 모델을 사용해 추정합니다. 이 접근 방식의 단점은 각 시나리오마다 자체 모델을 별도로 배포해야 한다는 것입니다. 또한 이러한 직접적인 사전 훈련 및 미세 조정 방법은 장면 간의 관계를 잘 모델링하지 못합니다.

마지막 카테고리는 현재 업계에서 주류를 이루는 다중 시나리오 모델링 방식으로, 다중 작업 학습 아키텍처를 바탕으로 각 시나리오의 데이터를 모델 구조에서 고려하여 공동 모델링을 수행하며, 그리고 모델 구조 디자인은 장면 간의 일반적인 표현과 차이점을 묘사하는 데 사용됩니다. 지난 2년 동안 업계에서는 많은 시도와 구현이 있었습니다. 예를 들어 SAR-Net은 MMOE와 유사한 방식으로 훈련되었으며 STAR는 매트릭스 매핑을 통해 이러한 전역 공유 네트워크와 각 시나리오에 고유한 네트워크를 구축합니다. 이 장면 차이의 특성화를 달성하기 위한 모델 매개변수 방법과 동적 매개변수 네트워크를 통해 이 장면 차이를 묘사하는 다른 작업 사이에 있습니다.

처음 세 가지 방식의 단점을 고려하여 후속 작업을 합동 훈련을 기반으로 수행하기로 결정했습니다.

5. 질문 5: 실제 비즈니스에서 멀티 시나리오 모델링이 직면하는 과제

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

실제 비즈니스 구현 프로세스에서는 이러한 멀티 시나리오 모델링을 통합 모델을 통해 공동 모델링에서 수행합니다. , 우리는 또한 주로 다음 측면에 반영된 몇 가지 구체적인 과제에 직면해 있습니다.

챌린지 1: 모든 장면의 정보를 최대한 활용하여 단일 장면의 데이터 희박 문제를 해결하기 위해 공동 모델링을 사용합니다. 다른 장면 지정된 장면에서 위에서 언급한 방법 중 일부는 매개변수 행렬 연산 또는 동적 매개변수 네트워크를 사용하여 장면의 공통점과 차이점을 특성화하지만 이러한 변환 방법은 상대적으로 암시적이며 다른 장면이 연출되는지 여부를 해석 가능한 방식으로 설명할 수 없습니다. 시나리오는 정보를 마이그레이션하고, 얼마나 많은 정보가 마이그레이션되는지. 따라서 세련되고 효과적인 장면 정보 마이그레이션을 달성하는 방법이 우리가 직면한 첫 번째 과제입니다. 간단히 말하면, 정보를 마이그레이션할지 여부와 마이그레이션할 정보의 양을 모델링하는 방법입니다.

챌린지 2: 모델을 교육할 때 주로 제품 클릭이나 비디오 완료와 같은 긍정적인 피드백 신호와 같은 사용자 상호 작용 행동을 기반으로 긍정적인 샘플을 구성합니다. 즉, 레이블이 지정된 샘플에서 교육은 이는 데이터에 대해 수행되며, 이는 동작이 거의 없는 일부 시나리오에서 심각한 데이터 희소 문제를 일으킬 수 있습니다. 비지도 작업을 사용하여 훈련 데이터를 레이블이 있는 샘플 공간에서 레이블이 없는 샘플 공간으로 확장할 수 있다면 데이터 희소성 문제를 완화하는 데 도움이 될 것입니다.

챌린지 3: 우리 모두는 전체 추천 링크가 회상 및 정렬과 같은 여러 핵심 단계로 나누어져 있다는 것을 알고 있습니다. 초기 연구에서 우리는 기본적으로 순위 모델인 위에 나열된 모델 중 일부를 포함하여 다중 시나리오 문제에 대한 공동 모델링이 주로 순위 단계에 집중되어 있음을 발견했습니다. 전체 추천 링크의 첫 번째 단계인 회상은 후보 크기, 검색 방법 및 정렬이 매우 다릅니다. 따라서 리콜 단계에서 다중 시나리오 공동 모델링을 어떻게 구현하느냐도 우리가 직면한 과제입니다.

2. Scene Adaptation and Unsupervised Multi-Scene Model (SASS)

다음은 실제 비즈니스 구현을 위한 모델 솔루션을 소개합니다. 이 모델을 SASS라고 합니다. 이 솔루션은 주로 세 가지 핵심 키워드에 중점을 둡니다. 첫 번째는 장면 적응형 전송(Scenario-Adaptive), 두 번째는 비지도(Self-Supervised), 세 번째는 리콜 작업을 위한 구현 탐색입니다.

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

전체 모델 프레임워크에는 두 단계가 포함되어 있습니다. 하나는 사전 훈련 작업이고 다른 하나는 미세 조정 작업입니다. 첫 번째 단계는 레이블이 지정되지 않은 샘플 세트에 대해 감독되지 않은 사전 학습 작업을 구성하고 대조 학습을 통해 장면 간의 관계를 모델링하는 것입니다. 또한 전체 모델이 회상 단계에서 구현되기 때문에 사용자 측과 아이템 측이 독립적으로 모델링되어야 하므로 사용자 측과 아이템 측에서 대칭적인 구조 설계를 하게 됩니다.

두 번째 단계는 첫 번째 단계에서 사전 훈련된 임베딩 및 네트워크 구조 매개변수 로드를 포함하여 첫 번째 단계를 기반으로 모델 구조를 재사용하는 미세 조정 작업입니다. 또한 두 번째 단계에서는 레이블이 지정된 표본 공간에 대한 회상 작업을 학습한 후 사용자 측과 항목 측의 표현 벡터를 출력합니다. 다음으로 이 두 단계를 자세히 소개하겠습니다.

1. 1단계: 사전 훈련 작업

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

​먼저, 사전 훈련 작업의 첫 번째 단계에서는 장면 간 대조 학습의 비지도 작업을 구성합니다. 그림의 오른쪽 상단에 표시된 것처럼 모든 사람은 대조 학습의 고전적인 훈련 패러다임에 익숙해야 합니다. 동일한 객체 x는 두 가지 다른 데이터 향상 방법을 통해 두 가지 다른 특징 세트를 얻은 다음 특징 추출 네트워크와 매핑을 사용합니다. 네트워크는 최종적으로 동일한 객체에 대한 두 개의 서로 다른 벡터 표현식을 얻은 다음 학습된 메트릭 손실을 비교하여 두 벡터 사이의 표현 거리를 단축하여 감독되지 않은 사전 학습 작업을 달성할 수 있습니다.

대조 학습 아이디어에서 영감을 받아 다중 장면 모델링의 장면 간 정렬 표현과 대조 학습의 사전 훈련 작업을 결합합니다. 앞에서 언급했듯이 동일한 사용자는 여러 다른 장면에 액세스할 수 있으며 다른 장면에서 다른 상호 작용 동작을 수행하여 장면과 관련된 일부 통계 정보를 남길 수 있습니다. 따라서 서로 다른 시나리오에서 사용자 행동의 차이를 데이터 향상의 자연스러운 방법으로 간주할 수 있습니다. 동일한 사용자의 관심은 연속성을 가지지만 서로 다른 시나리오 간에 표현에는 일정한 차이가 있을 수 있습니다. 그런 다음 이를 기반으로 대조 학습이라는 비지도 학습 작업을 구축합니다.

특정 모델을 살펴보면, 그림의 왼쪽과 같이 다양한 시나리오에 대한 통합 기능 시스템을 구축하게 되지만, 기능의 특정 값은 시나리오에 해당합니다. 행동 순서를 시나리오로 나누는 개방형 사용자는 각자의 시나리오에 대한 관심과 선호도와 같은 통계적 특성을 갖습니다. 이 분할 방법을 통해 동일한 사용자는 시나리오와 관련된 여러 다른 기능 값 세트를 갖습니다. 예를 들어 그림에서 장면 a와 장면 b에서 동일한 사용자의 특성을 확인한 다음 통합 표현 네트워크(이 표현 네트워크는 나중에 소개됨)를 통해 서로 다른 장면에서 동일한 사용자의 표현 벡터를 얻을 수 있습니다. , 그리고 최종적으로 비교를 통해 손실을 학습하여 둘 사이의 거리를 단축합니다.

방금 이야기한 것은 사용자 측의 훈련 방법입니다. 회상 작업에서는 일반적으로 사용자 측과 항목 측이 독립적으로 모델링됩니다. 따라서 항목 측도 훈련을 위해 대칭 구조와 작업을 사용하고 사용자 측과 항목 측은 동일한 임베딩 레이어를 공유합니다. 구체적으로, 동일한 항목에 대해 항목 측의 특징값을 장면으로 분할한 후 각 장면의 벡터 표현을 얻은 후 동일한 대조 학습을 사용합니다. 훈련 손실.

샘플을 구성할 때 사용자가 2개 이상의 장면을 방문할 수 있다는 특별한 처리가 있습니다. 따라서 비교 학습의 훈련 작업을 구성할 때 사용자가 방문한 장면을 쌍으로 결합하여 여러 훈련 샘플을 구성합니다. 아이템 측면에서도 이 두 가지 조합을 통해 여러 샘플이 구성됩니다.

특정 대조 학습 과제​에서는 InfoNCE의 손실 형식을 따라 학습했습니다.

모델링 장면과 장면 간 비교 학습 작업을 통해 여러 장면 간 레이블이 지정되지 않은 데이터의 사전 학습을 달성합니다. 다음으로 전체 모델 프레임워크에서 더 중요한 표현 네트워크의 설계 세부 사항을 소개합니다.

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

모델의 장면 표현 네트워크는 다층 장면 적응 마이그레이션 네트워크입니다. 우선, 전체 모델 구조 중 모델의 임베딩 레이어에서 매개변수를 공유합니다. 이 표현 네트워크는 전체적으로 여러 구성 요소로 나눌 수 있습니다. 첫 번째는 전체 장면이 공유하는 네트워크로, 그림에서 모델 왼쪽의 파란색 부분은 여기에서 가져온 샘플입니다. 모든 장면이 이를 통과하게 됩니다. 여기서 훈련은 사용자 측 또는 항목 측의 모든 장면 샘플을 혼합하여 훈련된 표현 구조로 볼 수 있습니다.

두 번째 부분은 각 장면의 독특한 네트워크 구조로, 사진 속 각 장면에 해당하는 회색 부분입니다. 각 장면에 해당하는 샘플은 해당 네트워크를 통해 학습됩니다. 각 장면의 네트워크 계층 매개변수가 분리되어 있기 때문에 이러한 학습 및 표현을 통해 각 장면 간의 분포 차이를 잘 설명할 수 있습니다. 또한 그림의 왼쪽 하단에는 보조 바이어스 네트워크도 소개되어 있습니다. 이 바이어스 네트워크의 입력에는 장면 ID와 일부 장면별 기능은 물론 일부 상황별 기능이 포함됩니다. 이는 공유 시스템을 기반으로 장면의 맥락 간의 차이와 편향 정보를 더욱 특성화할 수 있습니다.

특정 학습 과정에서 각 샘플은 통합 특징 임베딩 레이어를 통과하고 접합된 후 전체 장면 공유 네트워크와 이 샘플에 해당하는 장면에 고유한 네트워크에 진입하여 순방향 전파를 수행합니다. 역전파 네트워크 훈련.

동시에 전체 네트워크 구조에서 전체 장면 공유 네트워크의 각 레이어 출력은 장면 적응형 게이팅 장치를 통과하여 전체 장면의 융합 정보를 단일로 마이그레이션합니다. 장면 정보를 얻기 위한 장면 간 정제된 마이그레이션. 자세한 내용은 그림의 모델 오른쪽 상단에 있는 구조를 참조하세요. 마이그레이션 구조에는 주로 적응형 게이트와 업데이트 게이트가 포함됩니다. 적응형 게이트의 출력 값은 전체 장면의 정보 중 얼마나 많은 정보를 단일 장면으로 마이그레이션할 수 있는지 제어하는 ​​데 사용되며, 업데이트 게이트의 출력은 전체 장면 네트워크에서 마이그레이션된 정보와 원본 정보를 제어하는 ​​데 사용됩니다. 단일 장면의 가중치 융합의 가중치 값입니다. 이 두 게이트 네트워크의 입력에는 전체 장면 네트워크의 정보, 단일 장면 네트워크의 정보 및 장면 자체의 바이어스 정보가 포함됩니다. 이러한 세련되고 적응적인 마이그레이션 구조를 통해 장면의 마이그레이션 방향과 마이그레이션 정보의 양이 모델링되고 특성화됩니다. 마이그레이션 구조를 여러 레이어로 쌓고 최종적으로 각 샘플은 해당 장면의 벡터 표현을 얻을 수 있습니다. 마지막으로, 각 장면의 각 출력은 해당 장면의 바이어스 출력과 융합되어 해당 장면의 최종 벡터 표현을 얻습니다.

2. 2단계: 작업 미세 조정

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

두 번째 단계에서는 작업을 미세 조정합니다. 추천 링크의 리콜 단계에 모델을 구현하려고 하므로 미세 조정 작업과 리콜 작업의 목표가 일치합니다. 샘플 선택 측면에서는 사용자가 클릭한 항목을 Positive 샘플로 사용하고, Random Sampling을 통해 Negative 샘플을 구성한 후 학습용 Triple을 구성하여 쌍별 손실을 계산합니다.

또한 미세 조정 단계에서는 모델 구조와 매개변수를 재사용합니다. 즉, 사전 학습 단계와 마찬가지로 미세 조정 단계에서도 동일한 표현 네트워크 구조를 재사용합니다. , 사전 훈련을 로드합니다. 단계의 임베딩 계층과 네트워크 매개변수는 첫 번째 단계의 장면 간 비지도 훈련 정보를 유지하는 것과 동일합니다.

미세 조정 단계의 사용자 측 및 항목 측 메트릭 일치 작업에서는 훈련에 도움이 되는 새로운 보조 작업도 도입했습니다. 앞서 언급했듯이 각 샘플은 표현 네트워크를 통해 특성화된 후 두 개의 벡터 표현식을 얻을 수 있습니다. 하나는 각 단일 장면 네트워크의 고유한 벡터 출력입니다. 이 벡터는 각 해당 장면의 독립적인 표현을 묘사합니다. 사용자 기능이나 항목 기능의 전역 표현을 나타내는 출력입니다. 따라서 전체 미세 조정 단계의 훈련 작업에는 두 가지 손실이 포함됩니다. 하나는 단일 장면 네트워크에 의해 출력된 사용자 임베딩과 항목 임베딩 사이에 훈련된 손실이고, 다른 하나는 출력에 해당하는 사용자 임베딩과 항목 임베딩입니다. 이러한 계산 방법을 통해 또 다른 손실도 얻을 수 있으며, 마지막 두 손실의 가중 합을 훈련의 최종 손실로 사용합니다. 전체 장면 손실 보조 작업의 도입은 전체 도메인에서 동일한 사용자 및 항목의 표현을 기술하는 것과 동일합니다. 비록 그 표현이 각 장면의 독립적인 특징 표현에 적합하지 않을 수 있지만, 훈련을 위한 전역 과제 마지막으로 전체 효과의 수렴에 유리하며 후속 실험 분석도 이 점을 입증할 수 있습니다.

다음으로 리콜 모델 배포 방법을 소개하겠습니다. 모델 훈련이 완료된 후 미세 조정 단계에서 모델을 배포하고 온라인 상태로 전환합니다. 온라인 추정 중에 각 장면의 정보는 모델의 해당 장면 네트워크를 통해 전달되어 해당 장면의 표현 벡터를 얻습니다.

또한 보조 작업에서 전체 장면 네트워크의 출력은 훈련 단계에서만 사용됩니다. 혼합 샘플이므로 약간의 노이즈가 있을 수 있으며 추정할 때 각 장면은 여전히 ​​​​있습니다. 자체 장면의 출력을 사용합니다. 리콜 작업의 경우 항목 측면에서 모든 후보에 대해 이 벡터를 생성한 다음 해당 인덱스를 구성하고 모델 배포를 통한 온라인 추정 중에 벡터를 생성합니다. 그런 다음 벡터 검색을 통해 topk 결과를 얻고 마지막으로 결과는 전체 권장 링크에 대해 일부 후속 작업을 수행하기 위해 정렬 단계로 반환됩니다.

3. 실험 분석 및 실제 응용

다음으로 이 모델을 이용한 몇 가지 실험 분석 및 실제 응용을 소개하겠습니다.

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

두 가지 오픈 소스 데이터 세트와 자사 사업의 산업 데이터 세트를 대상으로 다른 방법과의 효과를 비교했습니다.

비교 방법은 주로 세 가지 범주로 나뉩니다. 첫 번째 범주는 전통적인 단일 장면 모델입니다. 우리는 회상 작업에 중점을 두기 때문에 업계에서 더 널리 사용되는 몇 가지 회상 방법을 비교합니다. YoutubeDNN 및 MIND, BST, DSSM 등 이러한 단일 장면 모델은 각 장면의 독립적인 샘플을 사용하여 학습됩니다. 두 번째 유형은 여러 장면에서 혼합된 샘플을 사용하여 훈련하는 것입니다. 모델은 여전히 ​​업계에서 일반적으로 사용되는 단일 장면 모델을 사용합니다. 세 번째 카테고리는 업계에 존재하는 다중 시나리오 공동 모델링 방법 중 일부이며 우리가 제안한 방법 중 일부는 정렬 단계에서 사용되며, 리콜 단계의 구현을 위해 더 나은 비교를 위해 이들을 비교합니다. 방법은 약간 수정되었습니다. 즉, 순위 모델 네트워크의 마지막 레이어의 출력이 리콜 작업에 적응하기 위한 표현 벡터로 사용됩니다.

위 표의 마지막 두 열은 우리가 제안한 모델로, SASS-Base는 사전 학습이 없는 모델 구조인 반면 SASS는 사전 학습 단계를 추가합니다. 우리가 확인한 두 번째 데이터 세트에는 특징 누락 문제가 있고 사전 훈련 작업을 지원할 수 없기 때문에 이 데이터 세트에 대한 SASS-Base 및 기타 방법의 효과를 비교하는 데 중점을 두었습니다.

다양한 유형의 방법을 비교하여 몇 가지 귀중한 결론을 얻었습니다. 첫 번째 요점은 혼합 샘플로 훈련된 단일 장면 모델은 대부분의 경우 자체 별도 샘플로 훈련된 단일 장면 모델보다 덜 효과적이라는 것입니다. 이는 이전 시연 및 조사의 결론과 일치합니다. 즉, 이러한 샘플 혼합 방법은 더 많은 노이즈를 발생시키고 각 장면의 원래 데이터 분포를 깨뜨릴 수 있습니다. 그러나 데이터가 특히 희박한 일부 작은 장면의 경우 혼합 샘플을 사용하면 더 나은 결과를 얻을 수 있습니다. 이러한 시나리오에서는 희소 데이터로 학습할 때 효과적인 정보를 학습하기 어렵기 때문에 이러한 혼합 표본 방법을 사용하면 데이터가 편향될 수 있지만 표본 크기 증가 및 효과 개선을 통해 몇 가지 이점을 얻을 수 있습니다. 두 번째 결론은 다중 시나리오 공동 모델링을 통해 훈련된 모델이 일반적으로 처음 두 가지 유형의 단일 시나리오 모델링 방법보다 우수하다는 것입니다. 우리가 제안한 모델은 사전 훈련 작업을 추가하지 않는 모델, 즉 SASS-Base입니다. 모델 구조, 각 장면에서 기본적으로 다른 다중 장면 조인트 모델링 방법보다 낫거나 유사한 결과를 얻을 수 있습니다. 사전 훈련 작업을 중첩한 후 전반적인 효과가 더욱 향상되었습니다. ​

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

​그런 다음 주로 다음과 같은 부분을 포함하는 일련의 절제 실험을 수행했습니다.

첫 번째는 글로벌 장면에서 단일 장면으로의 정보 전송을 설명하는 적응형 게이트 구조입니다. 우리는 모델의 게이트 네트워크 구조를 (1) 정보 마이그레이션을 달성하기 위해 행렬 곱셈 매핑을 사용하고 (2) Simnet과 유사한 두 가지 기능을 사용하는 것을 포함하여 다른 기존 게이트 마이그레이션 방법과 비교했습니다. 이 마이그레이션 방법은 덧셈, 곱셈 및 접합을 수행하는 것입니다. 그런 다음 MLP를 통해 융합을 수행합니다. (3) Sigmoid 게이트를 통해 마이그레이션되는 MOE와 유사한 네트워크 구조입니다. 마지막으로 실제 실험 결과를 보면 우리의 적응형 방법은 좋은 결과를 얻을 수 있습니다.

두 번째 요점은 사전 훈련 작업을 추가할지 여부와 다양한 사전 훈련 작업 유형이 실험 결과에 미치는 영향을 비교하는 것입니다. 대조 사전 학습 방법은 사용자의 행동 순서를 통해 다음 동영상이나 다음 항목을 예측하는 학습 작업입니다. 결과를 비교하면 사전 훈련 작업이 추가되고 장면 간 대조 학습을 통해 모델의 효과가 향상될 수 있음을 증명할 수 있습니다.

세 번째 요점은 모델 구조 설계에서 보조 네트워크와 보조 작업을 시연하는 것입니다. 그 중 하나는 미세 조정 단계에서 전역적으로 공유되는 네트워크를 도입하고 이 네트워크의 출력 결과를 사용하여 보조 미세 조정 훈련을 수행하는 것입니다. 다른 하나는 네트워크 구조 설계에서 장면 관련 정보를 통합하는 것입니다. 각 장면의 출력에 대한 바이어스 기능의 제거 실험. 실험 결과는 또한 이 두 구조를 추가하면 전체 모델 효과가 어느 정도 향상된다는 것을 증명합니다.

또한 우리의 표현 네트워크는 다층 정보 전달 구조이기 때문에 네트워크 계층 수를 늘려 모델의 효과가 향상되는 것도 비교했습니다. 전체적인 추세는 네트워크 계층의 수가 증가함에 따라 모델 효과가 먼저 향상되고 감소하는 경향이 있음을 알 수 있습니다. 이에 따른 네트워크 레이어의 증가로 인해 효과가 저하되는 현상이 발생하는데, 이는 네트워크 레이어의 증가에 따라 전체 매개변수의 양이 증가하기 때문일 수 있으며 일부 과적합 현상이 발생할 것으로 분석되었습니다. 또한, 상위 표현을 획득한 후 이렇게 많은 양의 정보 마이그레이션을 수행하면 단일 장면의 표현이 전체 장면 정보의 영향을 받기 쉬워질 수 있습니다. 따라서 이 다층 네트워크 구조의 레이어 수를 늘리면 효과가 어느 정도 향상될 수 있지만 네트워크 레이어 수가 반드시 좋아지는 것은 아닙니다.

다음 실험 세트에서는 각 장면이 회상 시 자체 벡터를 생성하기 때문에 회상 작업에 대해 다양한 항목 측면의 표현 벡터를 비교했습니다. 일부 다중 시나리오 모델링에서는 사용자 측 표현이 다르지만 항목 측에 대해서는 자세히 설명하지 않습니다. 리콜 작업에서는 사용자 측과 항목 측이 각 장면에 해당하며 자체적인 벡터 표현이 있습니다. 그래서 각 장면에 해당하는 항목 표현과 장면에서 공유하는 동일한 항목 측의 임베딩도 비교했습니다. 비교를 통해 각 장면의 독립적인 벡터 표현이 아이템 측면에서도 구별될 수 있음을 알 수 있다.

마지막으로 실제 콘텐츠 추천 시나리오에서 이 모델을 이용해 온라인 A/B 실험을 진행했습니다. 일부 실험 지표에서 좋은 결과를 얻었으며, 특히 상대적으로 작거나 희박한 데이터 시나리오에서 개선율이 더 높습니다.

현재 우리가 제안한 모델 솔루션은 짧은 동영상, 이미지 및 텍스트 추천 등을 포함한 타오바오의 콘텐츠 추천 시나리오에서 홍보되었으며, 이 모델은 다양한 시나리오에서 주요 회상 방법 중 하나가 되었습니다. ​

4. 요약

Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습

마지막으로 요약해보자. 전반적으로 우리가 해결하고 싶은 문제는 추천 분야의 다중 시나리오 모델링 문제이며, 이는 추천 시스템에서도 흔히 나타나는 문제입니다. 이러한 다중 시나리오 모델링을 위해 우리의 핵심 목표는 통일된 프레임워크를 구축하여 다양한 시나리오 간의 정보 활용을 극대화하는 것입니다. 이 공동 모델링 방법은 데이터 희소성 문제를 해결하고 각 시나리오의 비즈니스 지표를 개선합니다. 그리고 동일한 메소드 아키텍처 세트를 통해 모델 반복 및 배포 비용이 절감됩니다. 그러나 실제 비즈니스 애플리케이션에서 다중 시나리오 모델링은 세 가지 핵심 과제에 직면합니다. 첫 번째는 효과적인 장면 정보의 개선 및 마이그레이션을 달성하는 방법, 다중 장면 모델링에서 데이터 희소성 문제를 해결하는 방법 및 레이블이 지정되지 않은 일부 데이터를 도입하는 방법입니다. -씬 조인트 모델링 착륙을 수행합니다.

실습에서는 이러한 종류의 적응형 장면 정보 전송 네트워크 아키텍처를 설계하고 장면 간 대조 학습의 비지도 작업을 구성하며 위의 문제를 해결하기 위해 적응형 모델 구조 설계, 훈련 방법 및 배포를 포함합니다. . 마지막으로, 이 장면 적응 비지도 모델은 현재 모든 장면에서 잘 구현되어 주요 회상 방법으로 사용됩니다. ​

5. 질의응답 세션

Q1: 각 시나리오에서 모델의 개선을 평가하는 데 사용되는 지표는 무엇입니까?

A1: 이는 모델 평가의 문제입니다. 각 시나리오의 모델링 목표와 일치해야 하며, 이후 시나리오별 지표 개선을 살펴봐야 합니다. 리콜 단계의 작업이라면 Hit Rate나 NDCG 등 해당 장면별로 리콜 관련 평가 지표를 선택하는 것이다. 정렬 단계라면 AUC, GAUC 등 일부 정렬 관련 지표에 주로 집중해야 합니다.

Q2: 두 SASS 시나리오의 기능은 동일합니까?

A2: 우선, 우리는 다중 장면 문제를 전체적으로 해결하고 있기 때문입니다. 정의에서 알 수 있듯이 각 장면 사이에서 샘플은 크게 정렬되므로 실제로 모델링할 때 모든 기능을 정렬하고 평면화하려고 합니다. 또한 각 장면에 여전히 몇 가지 고유한 기능이 있는 상황을 위해 장면 바이어스 네트워크를 설계했습니다. 완전히 정렬할 수 없는 기능을 별도의 네트워크 구조에 배치합니다.

Q3: 코드를 오픈 소스로 만드는 것을 고려해 보셨나요?

A3: 이 코드 세트는 현재 회사의 실제 비즈니스 시나리오에서 사용되고 있으며 오픈 소스는 회사의 정보 공개 준수 요구 사항을 준수해야 합니다. 우리는 향후에 소통할 것이며 오픈 소스에 대한 데모 버전을 제공할 수도 있습니다.

Q4: 이 모델들도 리콜 단계에서 사용되나요?

A4: 현재 모델 자체가 리콜 단계에서 구현되므로 전체 모델도 이러한 리콜 단계에 배포됩니다. 물론 우리가 제공하는 것은 보다 일반적인 솔루션이며 일부에서는 완전히 가능합니다. 수정하여 순위 모델로 사용됩니다.

Q5: 모델에는 어떤 종류의 네거티브 샘플링이 사용되나요?

A5: 네거티브 샘플링은 주로 미세 조정 단계에서 수행됩니다. 우리는 리콜 작업에서 더 흔히 사용되는 네거티브 샘플링 방법을 사용하는데, 사용자의 클릭을 포지티브 샘플로 사용하고 네거티브 샘플은 각 장면의 항목 노출 확률에 따라 무작위로 샘플링됩니다. 그런 다음 여러 장면에서 전반적인 훈련 작업이 여전히 각 장면에서 별도로 훈련되기 때문입니다. 따라서 네거티브 샘플링 중에 포지티브 샘플에 해당하는 네거티브 샘플도 장면에 해당하는 노출 공간에서 무작위로 샘플링됩니다. 이러한 방식으로 포지티브 샘플과 네거티브 샘플 쌍이 구성됩니다.

Q6: 이 모델 세트를 Taobao 정보 흐름의 제품 짧은 동영상 장면 페이지와 주제 페이지에 사용할 수 있나요? 제품 추천 시나리오와 결합할 수 있나요? 목표는 통일되어야 하는가? 예를 들어 비디오에는 때때로 긴 목표가 있습니다.

A6: 이 문제는 좀 큽니다. 세분화해 보겠습니다. 즉, 사진을 포함한 전체 콘텐츠가 주요 통신사입니다. 텍스트와 비디오. 이 부분은 전체 기능 시스템이 기본적으로 동일하고 완전히 재사용할 수 있기 때문에 완전히 적응 가능합니다. 그리고 또 다른 점은 실제로 다음 단계에서 해야 할 일, 즉 제품과 콘텐츠가 언급될 수 있으며, 자체 데이터 배포 및 기능 시스템이 실제로 다르다는 점입니다. 이는 실제로 크로스 도메인 문제에 더 가깝다고 이해할 수 있습니다. .제품 도메인과 콘텐츠 도메인의 융합입니다. 우리의 다음 작업 단계에서는 이러한 교차 도메인 아이디어를 여러 시나리오에 도입하고 일부 행동 정보를 상품 도메인에서 콘텐츠 도메인으로 마이그레이션하기를 희망합니다. 두 번째로 목표 통일에 관해서는 이제 목표 통일을 달성했습니다. 예를 들어 홈페이지 클릭의 경우 사용자의 클릭 신호를 긍정적인 샘플로 사용합니다. 그러나 이러한 끝없는 위아래 흐름에서는 실제로 사용자 클릭이 없습니다. 그런 다음 사용자의 긴 재생, 완료를 사용합니다. 기타 기간 신호는 양수 샘플입니다. 양수 피드백은 전체 레이블이 이러한 이진 차원으로 평탄화됨을 의미합니다.

Q7: 장면 간 비교 학습이라는 비지도 작업에 대해 자세히 소개해주실 수 있나요?

A7: 일반적으로 우리는 여전히 이 비교 학습 아이디어를 따릅니다. 사실 핵심은 장면 간에 기능을 분할한 후 사전 훈련 작업을 구축하는 것입니다. 이전 PPT 설명이나 소개를 참조하세요. 논문(다중 시나리오 개인화 추천을 위한 시나리오 적응형 및 자체 감독 모델)에 나와 있습니다.

Q8: 사전 학습 모델의 사용자 측과 항목 측에서 클릭 샘플이 사용됩니까?

A8: 사전 훈련 작업은 사용자가 방문한 a와 b의 두 가지 시나리오와 같이 레이블이 없는 공간에서 수행되며 사용자는 몇 가지 정적 속성 특성을 가지고 있으며 역사적으로 보존된 사용자 행동 순서 그러면 각 장면에 해당하는 는 두 장면 a와 b에서 동일한 사용자의 특성 시스템을 구성합니다. 사전 훈련의 모델링 목표는 이 접근된 사용자를 모델링하고 이러한 특징 측정을 통해 장면 a와 장면 b 사이의 두 표현 벡터 사이의 거리를 줄이는 것입니다. 따라서 이는 실제로 비지도 작업이며 클릭이 없는 샘플 공간에서 학습됩니다.

Q9: 각 장면에서 여러 대상을 통합하는 방법은 무엇입니까?

A9: 이것은 사실 또 다른 문제입니다. 현재 우리는 다중 시나리오 문제를 해결하고 있습니다. 우리는 클릭한 목표나 우리가 변환한 목표와 같은 동일한 목표를 공유하기를 바랍니다. 실제로 사용자가 이 콘텐츠에 관심이 있는지, 아니면 이 동영상에 관심이 있는지를 나타냅니다. 방금 언급한 다중 장면 및 다중 대상 방식은 사실 다중 장면과는 다소 다르지만, 이러한 다중 대상 모델링 방식이 이 다중 장면 모델링을 기반으로 구축될 수 있다고 이해합니다. 현재 여러 장면과 여러 대상을 공동으로 표현하는 작업이 많기 때문입니다. 예를 들어 현재 아키텍처에서는 표현 네트워크를 통과한 후 각 샘플이 각 장면에 해당하는 독립적인 벡터 표현을 갖게 됩니다. 이 벡터 표현을 입력으로 사용한 다음 이를 기반으로 각 대상에 대한 고유한 대상 관련 기능 네트워크를 구축하면 실제로 다중 대상 및 다중 시나리오 공동 작업을 수행할 수 있습니다. 현재의 다중 시나리오 훈련 방법을 기본 프레임워크로 간주하고 이를 기반으로 다른 다중 목표 작업을 모델링할 수 있습니다. 나는 이것이 의미가 있다고 생각합니다.

Q10: 사전 훈련 단계에서 대조 학습의 상실은 어떻게 설계되었나요?

A10: 이 손실은 실제로 전통적인 비교 학습 방식과 유사합니다. InfoNCE 손실도 사용합니다. 즉, 배치 크기가 n인 훈련 샘플에서 동일한 사용자 또는 항목이 해당 장면에 배치됩니다. 생성된 2개의 벡터는 양의 샘플로 간주되고, 다른 샘플에 대응하여 생성된 2n-2개의 벡터는 음의 샘플로 간주되어 학습을 위해 손실이 구성됩니다.

Q11: 사전 훈련 단계에서 항목에 대한 다중 뷰를 구성하는 방법은 무엇입니까?

A11: 방금 우리가 집중한 것은 사용자 측면이므로 실제로 아이템 측면도 동일한 구조를 가지고 있습니다. 아이템 측면에는 아이템 자체에 대한 전역 공유 네트워크와 각 장면의 각 장면에 있는 각 아이템에 대한 네트워크 매개변수의 표현도 있습니다. 따라서 동일한 모델 방식을 통해 사용자 측에서는 완전히 대칭적인 구조를 갖는다. 각 항목은 전역적으로 공유되는 매개변수와 각 장면의 네트워크 구조를 통해 마이그레이션되며 결국 장면과 관련된 독립적인 출력을 갖게 됩니다.

Q12: 모델의 적시성은 어떤가요? 모델은 얼마나 자주 업데이트되나요? 흐름 훈련인가?

A12: 좋은 질문이네요. 현재 모델은 실제로 오프라인으로 훈련되고 매일 업데이트됩니다. 그런 다음 적시성을 개선하고 온라인 학습을 통해 스트리밍 교육을 실시하기 위해 몇 가지 교체 시도도 진행하고 있습니다. 물론 현재 이러한 다중 시나리오 학습 방법에 주로 반영되는 몇 가지 문제가 있습니다. 실제로 이러한 종류의 스트리밍 학습에서는 어떻게 데이터를 여러 소스에서 가져올 수 있습니까? 여러 소스를 동시에 액세스하고 안정적인 교육을 보장하는 방법은 실제로 상대적으로 큰 과제이므로 현재 모델은 여전히 ​​오프라인 수준에서 업데이트됩니다. 향후에는 현재의 오프라인 다중 시나리오 합동 훈련을 기본 모델로 취급한 후, 단일 시나리오에 대한 모델 복원을 통해 스트리밍 데이터를 미세 조정하고 이러한 방식으로 반복 업데이트를 수행하는 등의 시도를 할 수 있습니다.

Q13: 사전 훈련 샘플을 구성하는 방법은 무엇입니까?

A13: 이것은 실제로 방금 소개되었습니다. 전체적인 핵심은 여전히 ​​동일한 사용자가 직면하는 일부 기능의 표현을 서로 다른 시나리오로 분할하는 것입니다. 예를 들어 두 시나리오 a와 b에는 몇 가지 정적 기능이 있으며 동시에 해당 시나리오에 독립적인 사용자 행동이 남게 됩니다. 시나리오뿐만 아니라 카테고리 선호도, 계정 선호도, 클릭 노출과 같은 일부 통계적 특성과 같은 해당 장면의 사용자에 대한 일부 통계 정보도 포함됩니다. 이는 동일한 사용자가 다양한 시나리오에서 다양한 기능을 가질 수 있도록 데이터의 기능 구조를 여러 시나리오로 분할하는 것과 같습니다. 이것이 특징의 구조이고 샘플에서는 방금 언급한 내용입니다. 사용자가 여러 장면을 방문하면 장면이 쌍으로 결합되어 이러한 샘플 쌍이 구성됩니다. 그런 다음 항목 측면에서는 항목이 여러 장면에 배치될 수 있으므로 여러 장면 간의 쌍 조합을 통해 항목의 샘플을 구성할 수도 있습니다.

Q14: 사전 훈련 비교 학습에 대한 지표 평가가 있나요?

A14: 우리의 사전 훈련 단계는 비지도 작업입니다. 우리의 초점은 사전 훈련 작업을 통해 임베딩 표현과 해당 네트워크 매개변수의 초기화를 얻는 것입니다. 따라서 사전 훈련 대조 학습을 평가할 때 주로 사전 훈련 단계에서 생성된 벡터의 시각적 클러스터링을 통해 효과를 분석합니다.

Q15: 다중 시나리오 모델은 일부 시나리오에서 긍정적인 수익을 얻었지만 일부 시나리오에서는 부정적인 수익을 얻었습니다. 부정적인 수익 시나리오를 조정하고 최적화하는 방법은 무엇입니까?

A15: 이것은 실제로 장면의 공통성과 차이점을 묘사한 것입니다. 멀티 장면 솔루션의 원래 의도는 통합 모델로 강화된 후 각 장면에서 최적화하는 것입니다. 물론 실제로는, 특히 후속 반복에서 모든 시나리오에서 동일한 모델 아키텍처를 사용하여 100% 성공을 달성하는 것은 불가능하며 일부 이점이 명확하지 않을 수 있습니다. 따라서 현재 우리는 실제로 현재 다중 시나리오 아키텍처의 각 장면의 특성을 기반으로 상위 구조에 대한 미세 조정 디자인을 만들어야 합니다. 즉, 기본 임베딩 공유 및 정보에 다중 시나리오를 사용할 수 있습니다. 이를 수행하기 위한 프레임워크입니다. 물론 각 시나리오에는 고유한 네트워크 특성이 있습니다. 예를 들어 두 번째 홉의 일부 강력한 트리거 정보는 상위 계층에서 일부 조정이 필요한 일부 독립적인 기능 구조를 갖습니다.

Q16: 사전 훈련된 모델은 다양한 시나리오에서 공유되나요?

A16: 기본 임베딩 및 글로벌 공유 네트워크는 각 장면 간에 공유되며, 각 장면은 각 장면에 고유한 네트워크 매개변수에 해당합니다.

Q17: 리콜 서비스 단계에서는 시나리오에 따라 항목 표현이 달라야 합니다. 데이터베이스 인덱스를 온라인으로 검색할 때 데이터베이스를 분할해야 하나요, 아니면 공동으로 구축해야 하나요?

A17: 현재는 분할 데이터베이스 구축 방식을 사용하고 있습니다. 즉, 각 장면에 해당하는 후보가 각 장면에서 독립적인 인덱스를 생성합니다.

Q18: 샘플 크기는 어느 정도 규모의 작은 장면으로 간주됩니까?

A18: 이에 대한 표준적인 답변은 없습니다. 실제 비즈니스 시나리오를 기반으로 살펴봐야 할 수도 있습니다.

Q19: 특정 리콜에 수동(전략 제품 관리자) 전략이 적용되었습니까?

A19: 회수 단계는 다중 채널 회수이기 때문에, 즉 벡터 회수 등 다양한 유형의 회수 방법이 있을 것이며, 에서 제공하는 수동 회수도 있을 것입니다. 따라서 현재 전반적인 추천 단계는 실제로 다양한 유형의 회상 방법을 융합한 것이며 정렬 측면에 통일된 점수가 부여됩니다. 오늘 우리가 이야기하고 있는 모델에 있어서는 여전히 이 모델의 최적화에 초점이 맞춰져 있습니다.

Q20: 단일 장면 모델 훈련은 초기화 중에 사전 훈련된 매개변수만 상속받을 수 있나요? 그러면 단일 장면 모델이 훈련된 후에도 사전 훈련된 모델의 매개변수가 계속 사용됩니까?

A20: 현재 계획은 모델 훈련 후 초기화 단계에서 모델 매개변수를 로드하는 것입니다. 임베딩과 사전 훈련 후 매개변수 업데이트가 필요한지 여부에 대해 우리는 두 가지 실험을 수행했습니다. 첫 번째는 사전 훈련된 모델을 로드한 후 수정하는 것이고, 두 번째는 이러한 모델 훈련 중에 계속 참여하는 것입니다. 미세 조정 단계. 그런 다음 현재 우리가 사용하는 것은 미세 조정 단계에서 원래의 사전 훈련된 모델 매개변수를 재교육하는 것입니다.

Q21: 다층 장면의 GRU에서 여러 장면의 순서는 어떻게 결정되나요?

A21: 장면 간의 순서는 무작위입니다. 왜냐하면 우리 모델이 실제로 이러한 전역 장면의 정보를 단일 장면으로 전송하므로 장면 간의 훈련 순서는 실제로 무작위이기 때문입니다.

Q22: 사전 훈련 단계에서 두 보기 기능의 차이점은 무엇인가요? 단지 현장에서만 차이가 나는 걸까요?

A22: 네, 장면 차이에 관해서는 서로 다른 장면에서 동일한 사용자 또는 동일한 항목의 특성을 사용하여 장면의 차이, 즉 장면 간의 차이를 설명합니다. 데이터를 강화하는 방법으로 사용됩니다. 장면뿐만 아니라 장면에 있는 사용자 및 항목의 일부 행동 특성 표현도 포함됩니다.

Q23: 온라인 추정에서는 사전 훈련된 표현식을 단계별로 얻어야 ​​합니까? 그리고 리콜을 하시나요?

A23: 사전 훈련은 최종 리콜 작업의 훈련을 지원하기 위한 것이므로 추정 시 배포를 위한 2단계 미세 조정 작업만 사용하겠습니다. 이러한 트윈 타워 구조 모델은 보다 고전적인 DSSM으로 이해할 수 있습니다. 따라서 미세 조정 단계의 모델 구조를 최종적으로 사용하여 온라인화한 후 표현 입력을 추정할 때 사용자 측 표현과 항목 측 표현이 출력됩니다.

Q24: 비교 학습의 손실과 미세 조정의 손실을 공동으로 훈련할 수 있나요?

A24: 이 질문을 표현하는 또 다른 방법은 우리가 현재 사용하고 있는 2단계 접근 방식을 엔드투엔드 훈련으로 변환할 수 있는지 여부입니다. 즉, 훈련 작업에서는 장면 사이에 무한한 연결이 있습니다. 훈련을 감독하고 동시에 이를 기반으로 사용자 및 아이템 회상에 대한 공동 훈련을 수행합니다. 이 접근 방식은 실현 가능하다고 느껴지지만 이를 수행하지 않은 이유는 레이블이 지정되지 않은 샘플 데이터를 사용하는 문제를 해결하지 못하기 때문입니다. 즉, 2단계 작업에 사용된 샘플은 실제로 다릅니다. 사전 훈련 단계에서는 더 넓은 범위의 레이블이 지정되지 않은 데이터가 사용되고 미세 조정 단계에서는 레이블이 지정된 데이터가 사용됩니다. 합동 훈련을 사용하면 이렇게 레이블이 지정된 데이터에 대해서만 훈련을 수행할 수 있으며 실제로는 샘플 공간이 줄어들게 됩니다. 이는 원래 설계 의도와 다소 다릅니다.

Q25: ML-SAT 단계 모델에서 업데이트 게이트와 적응 게이트 자체가 MLP의 각 레이어에서 사용됩니까, 아니면 최상위 레이어가 융합될 때만 적용됩니까?

A25: 이는 각 레이어에서 마이그레이션을 수행합니다. 즉, 다층 구조에서는 단일 레이어 구조가 정보를 마이그레이션한 다음 구조가 스택됩니다. 방금 실험 결과에 따르면, 여러 번 비교한 후 레이어 3을 선택하면 효과가 다소 향상되는 것으로 나타났습니다. 따라서 실제 비즈니스 구현에서는 이 모델에 해당하는 레이어 수도 3개로 설정됩니다.

Q26: 사전 훈련에는 며칠 동안의 데이터가 사용됩니까?

A26: 사전 훈련 및 미세 조정 단계 작업은 일일 수준 증분 훈련이며 사전 훈련 단계는 미세 조정 단계에서 도입됩니다. 양쪽 모두 증분 훈련을 수행하는 것과 동일합니다. 평행하게 되면 매개변수가 중간에 로드됩니다.

Q27: 사전 훈련과 미세 조정은 동일한 기간의 데이터를 사용합니까?

A27: 우리의 전반적인 교육 방법은 증분 교육이므로 기본적으로 시간 간격이 일치한다고 방금 언급했습니다.

위 내용은 Taobao 개인화된 추천을 통한 적응형 및 비지도 다중 시나리오 모델 모델링 실습의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제