*데이터는 2023년 2분기 기준입니다
Kuaishou는 인기 있는 A입니다. 짧은 영상과 라이브 스트리밍 커뮤니티 애플리케이션을 통해 올해 2분기에 인상적인 MAU 및 DAU 신기록을 달성했습니다. Kuaishou의 핵심 개념은 평범한 사람들의 삶을 관찰하고 공유함으로써 모든 사람이 콘텐츠 제작자이자 전파자가 될 수 있도록 하는 것입니다. Kuaishou 애플리케이션에서 짧은 비디오 장면은 주로 단일 열과 이중 열의 두 가지 형식으로 나뉩니다. 현재 단일 열의 트래픽은 상대적으로 크며 사용자는 위아래로 슬라이드하여 비디오 콘텐츠를 몰입감 있게 탐색할 수 있습니다. 이중 열 프레젠테이션은 정보 흐름과 유사합니다. 사용자는 화면에 나타나는 여러 콘텐츠 중에서 관심 있는 콘텐츠를 선택하고 클릭하여 시청해야 합니다. 추천 알고리즘은 Kuaishou 비즈니스 생태계의 핵심이며 트래픽 분산 및 사용자 경험 개선에 중요한 역할을 합니다. Kuaishou는 사용자 관심분야와 행동 데이터를 분석하여 사용자 취향에 맞는 콘텐츠를 정확하게 푸시할 수 있어 사용자 충성도와 만족도를 높일 수 있습니다. 일반적으로 Kuaishou는 전국 수준의 단편 영상 및 생방송 커뮤니티 애플리케이션으로서 평범한 사람들의 삶을 관찰하고 공유한다는 독특한 개념과 뛰어난 추천 알고리즘으로 계속해서 더 많은 사용자들의 참여를 유도하고 있으며, 사용자들 사이에서 주목할 만합니다. 경험과 트래픽 분포 측면에서 좋은 결과를 얻었습니다.
Kaishou 짧은 동영상 추천 시나리오에서는 단일 열이 주요 형식입니다. 사용자는 위아래로 슬라이드하는 동작 모드를 통해 비디오를 탐색하며, 비디오가 슬라이드되면 사용자가 선택하고 클릭하여 재생을 실행할 필요 없이 자동으로 재생됩니다. 또한 사용자 피드백에는 팔로우, 좋아요, 댓글 공유, 진행률 표시줄 끌기 등 다양한 형태가 있습니다. 비즈니스가 발전함에 따라 대화형 형태도 점점 다양해지고 있습니다. 최적화 목표에는 장기 목표와 단기 목표가 포함되며, 단기 목표에는 사용자 경험 최적화 및 DAU 유지가 포함됩니다.
추천 시스템은 머신러닝과 딥러닝을 기반으로 하며, 로그는 주로 사용자의 실제 행동에 의해 생성된 특성과 피드백에서 비롯됩니다. 그러나 로그에는 한계가 있어 사용자의 현재 관심사에 대한 제한된 정보만 반영할 수 있으며 실명, 키, 몸무게 등의 개인 정보를 얻을 수 없습니다. 동시에 추천 알고리즘은 이전의 로그 학습 및 훈련을 기반으로 이를 사용자에게 추천하는 자체 루프 특성을 가지고 있습니다. 또한, 폭넓고 다양한 시청자층, 수많은 동영상, 잦은 업데이트로 인해 추천 시스템은 인기 편향, 장단기 동영상 노출 편향 등 다양한 편향이 발생하기 쉽습니다. 단편 영상 추천에 있어서 인과 추론 기술을 활용한 편향 모델링은 편향을 교정하고 추천 효과를 높이는 데 도움이 될 수 있습니다.
다음으로 인과 추론 및 모델 표현에 관한 작업을 형제팀과 공유하겠습니다.
권장 시스템은 일반적으로 상호 작용 로그를 분석하여 모델 학습을 수행합니다. 사용자 피드백은 콘텐츠에 대한 선호도에서 비롯될 뿐만 아니라 집단 사고방식의 영향도 받습니다. 영화 선택을 예로 들면, 사용자는 작품의 수상 여부나 주변 사람들의 의견을 고려하여 결정을 내릴 수 있습니다. 사용자마다 집단 사고방식에 차이가 있습니다. 일부 사용자는 더 주관적이고 독립적인 반면, 일부 사용자는 다른 사용자의 영향이나 인기에 더 민감합니다. 따라서 사용자 상호작용을 귀속시킬 때 사용자의 관심도를 고려하는 것 외에도 무리 심리 요인도 고려할 필요가 있습니다.
대부분의 기존 작업은 인기를 정적 편차로 취급합니다. 예를 들어 영화의 인기는 항목에만 관련되며 사용자 및 항목 평가를 모델링할 때 사용자 간의 편차는 고려되지 않습니다. 인기도는 보통 별도의 채점 항목으로 활용되는데, 이는 해당 항목의 노출수와 관련이 있으며, 인기도가 낮은 항목에 대한 편향이 적습니다. 이러한 모델링 방법은 정적이며 항목에 상대적입니다. 추천 분야에 인과 추론 기술을 적용하면서 일부 연구에서는 이 문제를 분리된 표현을 통해 해결하고 사용자가 항목을 선택할 때 무리 심리의 차이를 고려하려는 시도를 하고 있습니다. 기존 방법과 비교하여, 우리의 방법은 사용자의 집단 사고방식의 차이를 보다 정확하게 모델링할 수 있으므로 편차를 보다 효과적으로 수정하고 추천 효과를 향상시킬 수 있습니다.
Webconf2021의 논문에서 사용자 상호 작용은 항목에 대한 사용자의 관심과 항목을 선택할 때 사용자에게 미치는 군중 사고 방식의 정도에 의해 영향을 받는 것으로 모델링되었습니다. 안건. . 인과관계도는 왼쪽에 나타나 있으며, 그 관계는 비교적 간단하다. 특정 모델링에서는 사용자와 항목의 표현이 관심 표현과 적합성 표현으로 구분됩니다. 관심 표현을 위해 관심 손실을 구성하고, 적합성 표현을 위해 확인 손실을 구성하고, 피드백 행동을 위해 클릭 손실을 구성합니다. 표현 구조의 분할로 인해 관심 손실은 관심 표현을 학습하기 위한 감독 신호로 사용되며, 확인 손실은 집단 사고 표현을 모델링하는 데 사용됩니다. 클릭 손실은 두 가지 요소와 관련되어 있으므로 연결과 교차로 구성됩니다. 전체 접근 방식은 명확하고 간단합니다.
이자 손실과 확인 손실을 구성할 때 본 연구에서도 인과 추론에 몇 가지 개념과 기법을 사용합니다. 예를 들어, 인기가 없는 동영상이나 항목이 긍정적인 상호작용을 얻는다면 이는 사용자가 실제로 그것을 좋아했기 때문일 가능성이 높습니다. 이는 역검증을 통해 확인할 수 있습니다. 항목이 인기가 없고 사용자가 관심을 갖지 않는다면 긍정적인 상호 작용이 없을 가능성이 높습니다. 클릭 손실은 일반적인 처리 방법인 쌍 손실(Pairwise loss)을 채택합니다. 충돌 효과와 관련하여 관심 있는 독자는 논문을 참조하여 보다 자세한 구성 방법을 확인할 수 있습니다.
추천 시스템의 복잡한 문제를 해결할 때 일부 연구는 모델 표현에서 시작되어 항목에 대한 사용자의 관심과 집단 사고방식을 구별하는 것을 목표로 합니다. 그러나 실제 적용에는 몇 가지 문제가 있다. 추천 시스템에는 엄청난 수의 동영상이 있으며 노출 분포가 고르지 않습니다. 헤드 동영상은 노출이 많고 롱테일 동영상은 노출이 적기 때문에 데이터가 희박합니다. 희소성은 기계 학습 모델에 학습 어려움을 가져옵니다.
이 문제를 해결하기 위해 샘플 확대를 위한 대조 학습을 도입했습니다. 구체적으로 사용자와 아이템 간의 긍정적인 상호작용 외에도 사용자의 행동 범위 내에 있는 다른 동영상도 확장을 위한 부정적인 샘플로 선택했습니다. 동시에 우리는 원인과 결과 다이어그램을 사용하여 모델을 설계하고 사용자와 항목 측면에서 관심과 적합성 표현을 분리했습니다. 이 모델과 기존 DICE의 주요 차이점은 관심 손실과 확인 손실을 학습할 때 대조 학습 및 샘플 확대 방법을 채택하고 각각 관심 손실과 확인 손실에 대한 정규화된 항목 인기 비율 지수 항을 구성한다는 것입니다. 이러한 방식으로 데이터 희소성 문제를 더 잘 처리할 수 있으며 다양한 인기 항목에 대한 사용자의 관심과 집단 사고방식을 보다 정확하게 모델링할 수 있습니다.
이 작업은 짧은 영상 상호작용에서 관심과 무리 심리의 중첩을 기반으로 하며 인과 추론 기술과 인과 임베딩 방법을 사용하여 구조적 표현의 분리를 달성합니다. 동시에 실제 시스템에서 롱테일 비디오 샘플의 희소 문제를 고려하여 희소성을 완화하기 위해 대조 학습 및 샘플 증대 방법을 사용합니다. 이 작업은 온라인 표현 모델과 인과 추론을 결합하여 특정 적합성 디커플링 효과를 달성합니다. 이 방법은 오프라인 및 온라인 실험에서 잘 수행되었으며 Kuaishou 추천 LTR 실험에서 성공적으로 사용되어 특정 효과 개선을 가져왔습니다.
숏비디오 추천 사업에서는 시청시간이 중요한 최적화 목표로, 이는 시청시간과 밀접한 관련이 있습니다. 사용자 유지율, DAU, 재방문과 같은 장기 지표는 밀접하게 관련되어 있습니다. 사용자 경험을 향상시키기 위해서는 사용자에게 동영상을 추천할 때 중간 행동 지표에 집중해야 합니다. 경험에 따르면 사용자의 주의 집중 시간이 제한되어 있기 때문에 시청 시간은 매우 중요한 지표입니다. 사용자의 시청 시간 변화를 관찰함으로써 어떤 요인이 사용자의 시청 경험에 영향을 미치는지 더 잘 이해할 수 있습니다.
영상 길이는 시청 시간에 영향을 미치는 중요한 요소 중 하나입니다. 영상의 길이가 길어질수록 사용자의 시청 시간도 늘어나게 되지만, 영상이 너무 길면 한계 효과가 줄어들거나 시청 시간이 약간 줄어들 수도 있습니다. 따라서 추천 시스템은 사용자의 요구에 맞는 영상 길이를 추천하기 위한 균형점을 찾아야 합니다.
시청 시간을 최적화하려면 추천 시스템에서 사용자의 시청 시간을 예측해야 합니다. 기간은 연속 값이므로 회귀 문제가 발생합니다. 하지만 지속 시간과 관련된 작업은 적은 편입니다. 짧은 영상 추천 사업이 상대적으로 새로운 분야인 반면 추천 시스템 연구는 오랜 역사를 갖고 있기 때문일 것입니다.
시청 시간 추정 문제를 해결할 때 동영상 길이 외에 사용자 관심도, 동영상 콘텐츠 품질 등 다른 요소도 고려할 수 있습니다. 이러한 요소를 고려함으로써 예측의 정확성이 향상되고 사용자에게 더 나은 추천 경험이 제공됩니다. 동시에 시장 변화와 사용자 요구 변화에 적응하기 위해 추천 알고리즘을 지속적으로 반복하고 최적화해야 합니다.
KDD212 컨퍼런스에서 저희는 짧은 영상 추천에서 길이 추정 문제를 해결하기 위한 새로운 방법을 제안했습니다. 이 문제는 주로 인과 추론의 지속 편향이라는 자기 강화 현상에서 비롯됩니다. 이 문제를 해결하기 위해 사용자, 동영상, 시청 시간 간의 관계를 설명하는 원인 및 결과 다이어그램을 소개합니다.
인과도에서 U와 V는 각각 사용자와 동영상의 특징 표현을 나타내며, W는 사용자가 동영상을 시청하는 시간, D는 동영상의 길이를 나타냅니다. 우리는 추천 시스템의 자체 순환 생성 프로세스로 인해 지속 시간이 시청 지속 시간과 직접적인 관련이 있을 뿐만 아니라 비디오 표현 학습에도 영향을 미친다는 것을 발견했습니다.
영상 표현에 지속 시간이 미치는 영향을 제거하기 위해 미적분학을 사용하여 파생시켰습니다. 최종 결론은 백도어 조정을 통해 이 문제를 해결하기 위해 가장 간단하고 직접적인 방법은 각 재생 시간 비디오에 해당하는 샘플에 대해 별도로 시청 시간을 추정하는 것임을 보여줍니다. 이는 시청 시간에 대한 지속 시간의 증폭 효과를 제거하여 인과 추론의 지속 시간 편향 문제를 효과적으로 해결할 수 있습니다. 이 방법의 핵심 아이디어는 d에서 v까지의 오류를 제거하여 바이어스 증폭을 완화하는 것입니다.
짧은 동영상 추천에서 지속 시간 추정 문제를 해결할 때 d에서 v까지의 오류를 제거하고 편향 증폭을 완화하기 위해 인과 추론 기반 방법을 채택했습니다. 지속변수로서의 지속시간 문제와 영상 개수의 분포 문제를 해결하기 위해 추천 풀의 영상을 지속시간에 따라 그룹화하고 분위수를 사용하여 계산하였다. 각 그룹 내의 데이터는 분할되어 그룹 내 모델을 훈련하는 데 사용됩니다. 훈련 과정에서 각 기간 그룹의 비디오 기간에 해당하는 분위수는 기간을 직접 회귀하는 대신 회귀됩니다. 이렇게 하면 데이터 희소성이 줄어들고 모델 과적합이 방지됩니다. 온라인 추론 중에 각 비디오에 대해 먼저 해당 그룹을 찾은 다음 해당 기간 분위수를 계산합니다. 표를 조회하면 분위수에 따른 실제 시청시간을 알 수 있습니다. 이 방법은 온라인 추론 프로세스를 단순화하고 기간 추정의 정확성을 향상시킵니다. 요약하면, 우리의 방법은 d에서 v까지의 오류를 제거하여 짧은 비디오 추천의 지속 시간 추정 문제를 효과적으로 해결하고 사용자 경험 최적화를 위한 강력한 지원을 제공합니다.
짧은 영상 추천의 지속시간 추정 문제를 해결할 때, 기술적 난이도를 줄이기 위해 매개변수 공유 방식도 도입했습니다. 분할 학습 프로세스에서 이상적인 접근 방식은 데이터, 기능 및 모델을 완전히 분리하는 것이지만, 이렇게 하면 배포 비용이 증가합니다. 따라서 우리는 기본 기능의 임베딩과 중간 레이어의 모델 매개변수를 공유하고 출력 레이어에서만 분할하는 더 간단한 방법을 선택했습니다. 지속시간이 실제 시청시간에 미치는 영향을 더욱 확대하기 위해 추정 지속시간의 분위수를 출력하는 부분에 지속시간을 직접 연결하는 잔차 연결을 도입하여 지속시간의 영향력을 강화합니다. 이 방법은 기술적 난이도를 줄이고 짧은 동영상 추천의 지속 시간 추정 문제를 효과적으로 해결합니다.
실험에는 Kuaishou에서 공개한 공개 데이터 세트를 주로 사용했습니다. 여러 가지 방법을 비교해 보면 직접 회귀 모델과 기간 가중 모델의 성능에는 각각 장단점이 있음을 알 수 있습니다. 지속 시간 가중 모델은 추천 시스템에 있어 낯선 것이 아닙니다. 핵심 아이디어는 시청 지속 시간을 긍정적인 샘플의 가중치로 모델에 포함시키는 것입니다. D2Q와 Res-D2Q는 인과 추론을 기반으로 하는 두 가지 모델 구조이며, 그 중 Res-D2Q는 잔여 연결을 도입합니다. 실험을 통해 영상을 길이에 따라 30개의 그룹으로 그룹화할 때 가장 좋은 결과를 얻을 수 있음을 발견했습니다. 순진 회귀 모델과 비교하여 D2Q 방법은 상당한 개선이 있었으며 기간 편향의 자체 루프 증폭 문제를 어느 정도 완화할 수 있습니다. 그러나 기간 추정 문제의 관점에서 볼 때 문제는 아직 완전히 해결되지 않았습니다.
추천 시스템의 핵심 문제인 기간 추정 문제는 고유한 특성과 과제를 가지고 있습니다. 첫째, 회귀 모델은 추천 결과의 순차적 관계를 반영할 수 없기 때문에 회귀 오류가 동일하더라도 실제 추천 결과는 매우 다를 수 있습니다. 또한 예측 모델은 추정의 정확성을 보장하는 것 외에도 모델이 제공하는 추정의 신뢰도도 고려해야 합니다. 신뢰할 수 있는 모델은 정확한 추정치를 제공할 뿐만 아니라 높은 확률로 해당 추정치를 제공해야 합니다. 따라서 기간 추정 문제를 해결할 때 회귀의 정확성뿐만 아니라 모델의 신뢰도와 추정값의 순서 관계도 고려해야 합니다.
시청 행동에는 사용자의 지속적인 동영상 시청에 대한 조건부 의존성이 있습니다. 구체적으로 전체 동영상을 시청하는 것이 무작위 이벤트인 경우 동영상의 50%를 먼저 시청하는 것도 무작위 이벤트이며 둘 사이에는 엄격한 조건부 종속성이 있습니다. 시청시간 추정에서는 바이어스 증폭 문제를 해결하는 것이 매우 중요하며, D2Q 방식은 이 문제를 잘 해결한다. 대조적으로, 우리가 제안한 TPM 접근 방식은 모든 기간 추정 문제를 포괄적으로 다루는 것을 목표로 합니다.
TPM 방법의 주요 아이디어는 기간 추정 문제를 이산 검색 문제로 변환하는 것입니다. 완전한 이진 트리를 구축함으로써 기간 추정 문제는 서로 조건부 의존하는 여러 분류 문제로 변환되고, 이 분류 문제를 해결하기 위해 이진 분류기가 사용됩니다. 계속해서 아래쪽으로 이진 탐색을 수행하여 각 정렬된 구간에서 시청시간의 확률을 구하고, 최종적으로 시청시간의 다항분포를 형성한다. 이 방법은 불확실성 모델링 문제를 효과적으로 해결하여 추정 기간의 평균을 실제 값에 최대한 가깝게 만드는 동시에 추정 기간의 분산을 줄일 수 있습니다. 전체 시청 시간 문제나 추정 과정은 상호의존적인 이진 분류 문제를 지속적으로 해결함으로써 점진적으로 해결될 수 있습니다. 이 방법은 기간 추정 문제를 해결하기 위한 새로운 아이디어와 프레임워크를 제공하여 추정의 정확성과 신뢰도를 향상시킬 수 있습니다.
TPM의 중요 기간을 모델링하는 아이디어를 도입하여 TPM과 D2Q의 백도어 조정 간의 원활한 연결을 보여주었습니다. 여기서는 간단한 원인 및 결과 다이어그램을 사용하여 사용자 및 항목 측 기능을 혼란 요인과 연관시킵니다. TPM에서 백도어 조정을 구현하려면 교란 요인 값으로 각 샘플에 해당 모델을 구축하고, 각 교란 요인에 대해 해당 TPM 트리를 구축해야 합니다. 이 두 단계가 완료되면 TPM을 후면 도어 조정 장치에 원활하게 연결할 수 있습니다. 이러한 유형의 연결을 통해 모델은 교란 요인을 더 잘 처리하여 예측 정확도와 신뢰도를 높일 수 있습니다.
구체적인 해결책은 D2Q와 마찬가지로 각 심층 교란 요인에 대해 해당 모델을 구축하는 것입니다. 이 경우에도 데이터 희소성 및 너무 많은 모델 매개변수 문제가 발생하며 각 샘플을 변환하려면 공유 바닥 처리가 필요합니다. 각 교란 요인은 동일한 모델에 통합되지만 모델의 기본 임베딩 표현, 중간 매개변수 등은 모두 공유되며 출력 레이어의 실제 노드 및 간섭 요인 값에만 관련됩니다. 훈련 중에는 훈련을 위한 각 훈련 샘플에 해당하는 실제 리프 노드만 찾으면 됩니다. 추정할 때 시청 지속 시간이 어느 리프 노드에 속하는지 모르기 때문에 위에서 아래로 순회해야 하며 시청 지속 시간이 위치한 각 리프 노드의 확률과 예상 지속 시간의 가중 합을 수행해야 합니다. 실제 시청 시간을 얻기 위해 해당 리프 노드. 이 처리 방법을 사용하면 모델이 교란 요인을 더 잘 처리하고 예측 정확도와 신뢰도를 높일 수 있습니다.
Kuaishou 공개 데이터 세트와 체류 시간에 대한 CIKM16 데이터 세트에 대한 실험을 수행하여 WLR, D2Q 및 OR과 같은 방법을 비교한 결과 TPM이 상당한 이점을 갖는 것으로 나타났습니다. 각 모듈에는 고유한 역할이 있으며 기본 실험도 수행했습니다. 실험 결과는 각 모듈이 역할을 한다는 것을 보여줍니다. 또한 실험 조건은 Kuaishou가 선택한 트래픽을 10개의 그룹으로 균등하게 나누는 것이며, 그 중 20%를 온라인 실험 그룹과 비교하기 위한 기준으로 사용했습니다. 실험 결과에 따르면 TPM은 정렬 단계에서 사용자의 시청 시간을 크게 늘릴 수 있지만 다른 지표는 기본적으로 동일하게 유지됩니다. 사용자 단파 수와 같은 부정적인 지표도 감소했다는 점은 주목할 가치가 있으며, 이는 기간 추정의 정확성 및 추정의 불확실성 감소와 일정한 관계가 있다고 생각합니다. 시청 시간은 짧은 동영상 추천 플랫폼의 핵심 지표이며, TPM의 도입은 사용자 경험과 플랫폼 지표를 향상시키는 데 큰 의미가 있습니다.
서문의 이 부분을 요약해 보겠습니다. 숏비디오 추천 플랫폼에서는 시청시간이 핵심 지표이다. 이 문제를 해결하려면 두 가지 수준을 고려해야 합니다. 하나는 훈련에 대한 전체 시스템 링크 로그의 자체 루프에서 해결해야 하는 기간 편향 및 인기 편향을 포함한 편향 문제이고, 다른 하나는 기간 추정 문제입니다. , 그 자체는 연속입니다. 값 예측 문제는 일반적으로 회귀 문제에 해당합니다. 그러나 특수 기간 추정 회귀 문제의 경우 특정 방법을 사용해야 합니다. 우선, 백도어 조정을 통해 편향 문제를 완화할 수 있다. 구체적인 방법은 그룹 기간을 설정하고 각 그룹에 해당하는 모델을 설계하여 회귀하는 것이다. 둘째, 기간 추정의 회귀 문제를 처리하기 위해 트리 구조를 사용하여 기간 추정을 여러 계층적 정렬 간격으로 분해할 수 있습니다. 트리 순회 프로세스를 통해 문제는 최상위에서 리프 노드까지의 경로를 따라 분해될 수 있습니다. . 그리고 해결합니다. 추정 시에는 트리 순회를 통해 기간을 추정합니다. 이 처리 방법은 기간 추정의 회귀 문제를 보다 효과적으로 해결하고 예측 정확도와 신뢰도를 향상시킬 수 있습니다.
기술 발전이 가속화되면서 우리가 사는 세상은 점점 더 복잡해지고 있습니다. Kuaishou의 짧은 동영상 추천 시나리오에서는 추천 시스템의 복잡성이 점점 더 두드러졌습니다. 더 나은 추천을 하기 위해서는 추천 시스템에 인과 추론을 적용하는 방법에 대한 심층적인 연구가 필요합니다. 먼저 시청 시간 추정 등 비즈니스 가치에 대한 문제를 정의해야 합니다. 그런 다음 인과 추론 관점에서 이 문제를 이해하고 모델링할 수 있습니다. 인과조정이나 인과추론 방법을 통해 지속편향, 인기편향 등의 편향 문제를 더 잘 분석하고 해결할 수 있습니다. 또한 머신러닝, 운영 최적화 등 기술적 수단을 활용해 시스템 복잡성, 장면 분포 등의 문제를 해결할 수도 있습니다. 효율적인 솔루션을 얻으려면 문제를 해결하기 위한 체계적이고 자동화된 방법을 찾아야 합니다. 이는 업무 효율성을 향상시킬 뿐만 아니라 비즈니스에 지속적인 가치를 제공합니다. 마지막으로, 솔루션의 타당성과 지속 가능성을 보장하기 위해 기술의 확장성과 비용 효율성에 중점을 두어야 합니다.
요약하자면, 추천 시스템에 인과 추론을 적용하는 것은 도전적이고 잠재적인 연구 방향입니다. 지속적인 탐색과 실천을 통해 추천 시스템의 효율성을 지속적으로 개선하고 사용자에게 더 나은 경험을 제공하며 비즈니스에 더 큰 가치를 창출할 수 있습니다.
위 내용은 이번에 공유한 내용입니다. 모두 감사드립니다.
A1: 헤드 노드에서 리프 노드로 가는 것은 MDP와 유사한 지속적인 의사결정 과정이라고 볼 수 있습니다. 조건부 의존성은 다음 계층의 결정이 이전 계층의 결과를 기반으로 한다는 것을 의미합니다. 예를 들어 간격 [0,1]인 리프 노드에 도달하려면 먼저 간격 [0,2]인 중간 노드를 통과해야 합니다. 이러한 종속성은 특정 노드가 다음 리프 노드로 이동해야 하는지 여부만 해결하는 각 분류기에 의한 실제 온라인 추정에서 실현됩니다. 나이 추측의 예에서 먼저 나이가 50세 이상인지 묻고, 대답에 따라 25세 이상인지 묻는 것과 같습니다. 여기에는 조건부 의존성이 내포되어 있습니다. 즉, 50세 미만이 두 번째 질문에 답하기 위한 전제 조건입니다.
A2: TPM과 D2Q의 장점을 비교할 때 가장 큰 장점은 문제 분할에 있습니다. TPM은 시간 정보를 더 잘 활용하고 상대적으로 균형 잡힌 샘플을 사용하여 문제를 여러 이진 분류 문제로 분할합니다. 이는 모델 훈련 및 학습의 학습 가능성에 기여합니다. 대조적으로, 회귀 문제는 특이치 및 기타 특이치의 영향을 받아 학습 불안정성이 더 커질 수 있습니다. 실제 적용에서는 샘플 구성 및 TF 그래프 노드 레이블 계산을 포함하여 많은 실제 작업을 수행했습니다. 온라인으로 배포할 때 모델을 사용하지만 출력 차원은 중간 노드 분류기의 수입니다. 각 비디오에 대해 기간 그룹 중 하나만 선택하고 해당 분류기의 출력을 계산합니다. 그런 다음 루프를 통해 리프 노드에 대한 분포를 계산하고 마지막으로 가중치 합을 수행합니다. 모델 구조는 비교적 간단하지만 각 기간 그룹과 리프가 아닌 각 노드의 분류자는 기본 임베딩 및 중간 레이어를 공유할 수 있으므로 순방향 추론 시 출력 레이어를 제외하면 일반 모델과 크게 다르지 않습니다.
위 내용은 콰이쇼우 단편영상 추천으로 인과추론 연습의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!