오늘 공유에서는 이러한 유형의 모델에 대한 주요 기술적 과제와 개발 내역을 포함하여 Deep UPLIFT 모델에 주로 초점을 맞추고 Tencent FinTech 사용자 성장을 돕는 Deep UPLIFT 모델의 고전적인 사례도 소개합니다.
먼저 UPLIFT 모델을 소개하겠습니다.
전형적인 시나리오: 마케팅 활동을 위한 최적의 고객 그룹을 찾는 방법은 무엇입니까? 아니면 최적의 마케팅 인센티브 방법을 찾는 방법은 무엇입니까?
일반적인 아이디어는 높은 의지를 가진 사용자를 타겟팅하는 것입니다(위 그림의 확실한 것 및 설득 가능한 사분면). 그러나 이 아이디어의 가장 큰 문제는 자연스러운 트래픽에서 사용자 전환을 무시한다는 것입니다. 우선, 일부 고의도 사용자(Sure Things Quadrant 사용자)는 광고 없이 자연스럽게 전환할 수 있습니다. 또한 할인 쿠폰 마케팅 모델에서는 고의도 사용자에게 직접 광고를 하는 경우 높은 비용 손실이 발생하는 경우가 많습니다. 의향이 낮은 사용자로 전환할 수 있습니까(방해 및 원인 손실 사분면을 참고하세요)? 광고를 통해 소비 의향을 높이나요? 실제로 의욕이 낮은 사용자의 경우 전환 가능성이 매우 낮습니다. 아무리 투자해도 전환되지 않거나 영구적으로 손실될 수도 있지만 이로 인해 많은 마케팅 비용이 소모됩니다.
따라서 이러한 유형의 마케팅 문제를 해결하기 전에 마케팅의 개념, 즉 "마케팅 이익"으로 돌아갈 필요가 있습니다. "마케팅 이익"은 당사의 마케팅 활동이 자신의 입장을 바꿀 수 있는 사용자 부분에 초점을 맞춰야 함을 의미합니다. 일반인의 관점에서 우리가 찾고 있는 타겟 고객 그룹은 마케팅 이전에는 전환하지 않지만 마케팅 이후에는 전환하는 사람들의 그룹(설득 가능 사분면 그룹)이며, UPLIFT 모델은 이러한 그룹에 민감한 사람들을 찾는 것입니다. 마케팅 인센티브.
사용자에 대한 마케팅 이후 전환 여부를 판단할 때 응답(응답) 모델이 구축되는 경우가 많으며, 모델은 이를 예측합니다. 일련의 데이터 분석, 비용 추정 등을 바탕으로 전환율 임계값을 정의하고 이 전환율 임계값보다 높을 것으로 예측되는 사용자에게 전달합니다. 응답 모델은 간단하고 효율적이며, 현재 주류인 머신러닝/딥러닝 모델을 모두 활용하여 직접 구축이 가능합니다. 그러나 가장 큰 문제는 마케팅 없이 전환될 수 있는 자연스러운 전환 트래픽 부분을 고려하지 않는다는 점입니다. 모델링 목표와 비즈니스 목표는 정확히 일치하지 않습니다.
UPLIFT 모델은 하나 이상의 모델을 사용하여 마케팅 하의 사용자 전환율과 비마케팅 하의 전환율을 각각 예측합니다. 이 두 값의 차이는 UPLIFT입니다. . 결국 UPLIFT 값의 크기에 따라 런칭 여부를 결정하게 됩니다.
위 그림의 반응 모델과 UPLIFT 모델 곡선을 비교하면 UPLIFT 모델이 개입 시간을 더 앞당기는 것을 알 수 있습니다. 사용자 이탈 조기 경고 시나리오에서는 손실이 발생할 사용자를 사전에 유지해야 합니다. 실제 적용에서는 사용자 이탈의 구체적인 시간을 예측하는 것은 의미가 없습니다. 이러한 사용자에게 유지 조치를 적용하는 것은 최상의 개입 시간을 놓쳤을 수 있으며, 운영 조치를 통해 유지될 수 있는 사용자를 예측하는 것은 실질적인 가치가 있습니다.
UPLIFT 모델 자체는 인과 추론 분야에 속하며, 관찰 연구를 바탕으로 한 인과 추론을 간략하게 정리한 것입니다. 첫째, 이러한 유형의 방법은 주로 평균 개입 효과를 연구하고 전략 효과에 대한 전반적인 방향성 평가를 형성합니다. 예를 들어 일부 학자들은 "흡연이 건강에 해로운지 여부"를 연구하여 장기적으로 결론을 내렸습니다. 흡연은 기대 수명을 단축시킵니다. 이런 식으로 결론은 방향성이 있는 경우가 많으며 구체적인 전략을 수립할 수 없습니다. 이는 실제 작업, 즉 인과 추론 방법을 어떻게 구현해야 하는지에 대한 문제입니다. 반면, UPLIFT 모델은 이질적인 인과관계를 연구하는 모델로, 집단이나 개인에 따라 개입의 효과가 다르다는 것을 발견하여 개입 메커니즘의 규칙을 발견하고 개인화된 전략을 형성합니다. 다음으로 몇 가지 정의를 소개합니다.
(1) Neyman-Rubin 잠재적 결과 프레임워크: 개인(샘플)은 자신의 고유한 속성을 기반으로 잠재적 결과를 제시합니다. 이러한 잠재적 결과는 종종 현실 세계의 한쪽에만 존재하므로 큰 문제인 귀납적 편향이 발생합니다.
(2) CATE: UPLIFT 모델의 모델링 목표입니다.
(3) Unconfoundedness: Unbiased CATE는 추정을 위해 교란 요인(발견되지 않은 교란 요인 없음)을 제어해야만 얻을 수 있습니다.
UPLIFT 모델은 광범위한 산업 응용이 가능하며 적용 방법은 대략 두 가지 범주로 나뉩니다. 하나는 개입 HTE의 이질적 효과를 평가하는 것입니다. A/B 테스트를 예로 들면 전체적으로 관찰된 개입 효과는 중요하지 않을 수 있지만 UPLIFT 모델을 통해 드릴다운하면 중요한 개입 효과가 있는 하위 그룹을 찾을 수 있습니다. 첫 번째 범주는 공공 서비스 분야의 전략 맞춤화 및 개인화된 인터넷 마케팅을 포함한 전략 최적화입니다.
UPLIFT 모델링은 일반적으로 모든 실험 그룹이 개입되고, 대조군은 개입되지 않는 무작위 대조 실험을 만듭니다. 그런 다음 UPLIFT 모델을 사용하여 모델링된 샘플을 수집합니다.
T-Leaner를 예로 들면 개입 표본은 응답 모델을 구축할 수 있고, 비 개입 표본은 반응 모델을 구축할 수 있습니다. 최종 점수 차이는 UPLIFT 값입니다.
UPLIFT 모델링에는 두 가지 핵심 문제가 있습니다.
개입 메커니즘으로 인한 선택 편향으로 인해 개입 표본이 발생합니다. 특성 분포는 UPLIFT 모델링의 특성 분포와 일치하지 않습니다. 비개입 표본으로 인해 교란 요인이 발생합니다. 이러한 유형의 교란 요인은 개입과 결과 모두에 영향을 미칩니다. 교란 요인이 존재하기 때문에 명확한 인과 관계 효과를 얻을 수 없습니다. 다음과 같은 특정 사례:
① 인기 편향: 노출은 대중적인 개입에 집중됩니다.
② 선택 편향: 다양한 집단 간 항목 노출의 차이.
이러한 샘플을 기반으로 한 모델링은 높은 신뢰도의 결론으로 이어지지 않을 가능성이 높습니다.
주요 해결 방법:
① 손실에 성향 점수 정규화 용어를 소개합니다.
②모형구조에 경향분열체인과 대립구조를 도입한다.
③ 성향 점수 역가중 샘플링.
4 해리 표현: 교란 요인 항을 벡터로 분리해 보세요.
아래 그림과 같이 개입/비개입 모델에서 채점된 표본/개인의 분포가 일관되지 않을 때 개입-비개입으로 점수를 매깁니다. CATE)를 분포 통계에 사용하면 지터가 매우 심하고 개인/그룹 간 UPLIFT 차이를 구별하기 어려운 것으로 나타나 UPLIFT 모델 예측이 기본적으로 유효하지 않음을 알 수 있습니다.
이 사례는 귀납적 편향의 문제를 보여줍니다. 모델 아키텍처의 관점에서 보면 반사실적 결과의 감독되지 않은 신호가 추정되거나 잠재적인 결과 추정의 정규화 정도가 일관되지 않아 최종 UPLIFT 예측 추정치가 불안정합니다.
Neyman-Rubin 잠재적 결과 프레임워크로 돌아가서, 다양한 개인에 대해 우리는 개입의 결과 또는 개입하지 않은 결과만 알 수 있습니다. 개입과 비개입의 결과를 동시에 아는 것은 불가능합니다. 또한 두 가지 잠재적 결과 추정치의 분포가 일관되지 않습니다. 또한 심층 모델 모델링 목표는 종종 CTR 또는 CVR이며, 이는 자체적으로 이득 점수(UPLIFT)를 얻을 수 없으므로 모델링 목표와 최종 평가 지표가 일치하지 않습니다. 그림에서 우리는 CATE의 분포가 잠재적인 결과 추정 점수의 분포와 완전히 일치하지 않음을 알 수 있습니다. 우리는 이 일련의 문제를 귀납적 바이어스 문제로 요약합니다. 귀납적 편집증 문제는 UPLIFT 모델의 핵심 문제입니다. 현재 학계에서는 대략 다음 네 가지 해결 방법을 제안했습니다.
① 역실적 출력 벡터 일관성, MMD 및 기타 분포 정렬 방법
② 합리적인 공유 매개변수 아키텍처, FlexTENet, S-Net 설계
3 역실적 매개변수 차이 제한
4 모델 구조에 무거운 매개변수 구조 도입 ), EUEN.
UPLIFT의 핵심 이슈를 소개한 후 UPLIFT 모델의 적용 과제에 대해 간략하게 이야기하겠습니다. 금융 분야에는 크게 두 가지 범주가 있습니다. 하나는 다중 가치/지속 가치 개입이고, 다른 하나는 지속적인 결과 예측입니다.
방금 제안한 UPLIFT 모델의 두 가지 핵심 문제인 교란 요인 질적 편향과 귀납적 편향과 함께 많은 학계와 산업계에서 제안한 바가 있습니다. 해결책.
첫 번째이자 가장 기본적인 것은 Meta-Learner입니다. 대표적인 모델링 솔루션은 S-Learner와 T-Learner입니다. 딥러닝에 들어간 후 혼합 편향을 해결하여 대표되는 DragonNet, DESCN, S-Net, CFRNet으로 진화했습니다. 등과 유도성 바이어스를 해결하여 표현되는 FlexTENet, S-Net, EUEN, DESCN, GANITE, CFRNet 등이 있습니다.
다음으로 금융기술 분야의 UPLIFT 모델 적용 사례를 소개하겠습니다. UPLIFT 모델을 적용하려면 종종 운영 측정과 모델 반복의 조합이 필요합니다. 운영 활동에서는 소규모 트래픽의 무작위 전달을 시작으로 개입/비개입 샘플을 수집한 후 타당성 검증 및 실험 설계, 전략적 고객 그룹 전달, UPLIFT 모델 구축 및 전달 평가를 수행했습니다.
그 중 UPLIFT 모델 솔루션은 3세대 반복을 완료했습니다.
1세대 솔루션은 주로 빠르게 출시할 수 있는 Meta-Learner입니다. 비즈니스 목표를 달성하기 위해 비즈니스의 어려움은 마케팅 ROI를 제어하고 규모를 늘리려는 욕구입니다.
2세대는 주로 딥러닝 아키텍처를 기반으로 하며 다중 가치 개인화 운영을 달성하는 것이 주요 목적이며 다중 가치 개입 질문입니다. 사용되는 주요 모델은 CRFnet과 자체 개발한 EFIN(Explicit Feature Interaction uplift Network)입니다.
여기에서는 자체 개발한 EFIN 모델에 중점을 둡니다. 이 알고리즘은 주로 세 가지 모듈로 구성됩니다.
첫 번째 모듈은 Self-Attetion 네트워크를 사용하여 대규모 사용자 기능을 완전히 학습하는 자체 상호 작용 계층입니다.
두 번째 모듈은 전체 알고리즘의 핵심입니다. 개입 변수 T는 명시적으로 별도로 표시되므로 다중 값 개입 문제를 해결하는 데 유용합니다. 개입 T와 특성 X는 주의 메커니즘을 사용하여 교차되어 이질적인 효과 학습을 향상시키며, 이는 정확히 UPLIFT 모델의 목표입니다. 그리고 Reparametrization 방법을 추정 출력으로 사용하여 잠재적인 결과의 일관되지 않은 점수 분포 문제를 완화합니다.
세 번째 모듈에서는 교란 편향 문제를 해결하기 위해 개입 제약 조건을 사용하여 모델이 표본이 개입되었는지 여부를 구별하기 어렵게 만듭니다.
다목적 UPLIFT 모델은 Ctr-Lift와 Value-Lift를 동시에 모델링하도록 설계되었으며, GMV 성장을 달성하면서 ROI>1을 달성할 것으로 예상됩니다. 가장 큰 어려움은 UPLIFT의 양을 모델링하기 어렵다는 점인데, 양 자체에 대한 두 개의 반사실적 추정치의 분산이 매우 크고, 이를 뺀 UPLIFT의 분산이 훨씬 크기 때문에 UPLIFT의 양을 모델링하기가 상대적으로 어렵습니다. 안정적인 UPLIFT가 현재 해결 중입니다.
이번 강의에서는 UPLIFT 모델링의 두 가지 핵심 이슈와 두 가지 응용 과제, 3세대 솔루션을 소개하고 자체 개발한 EFIN 모델에 중점을 두었습니다. 앞으로는 다목적 UPLIFT 모델링, ROI 제약, 동적 UPLIFT 모델링, 관측 데이터 보정 등 일련의 방향으로 더욱 심층적인 연구를 진행할 예정이다.
A1: 이것은 확실히 효과적입니다. 우리는 일반적으로 관찰 데이터를 모델링하기 위해 이 성향 점수 방법을 선택합니다. 성향 점수 방법의 적용은 DragonNet과 같은 모델 구조를 사용하고 이를 모델 구조에 직접 추가할 수 있습니다. 또 다른 보다 직접적인 방법은 성향 점수 분포를 기반으로 직접 표본 가중 샘플링을 수행하는 것입니다.
A2: 사실, 방금 그림에서 이것을 더 명확하게 설명했습니다. 왜냐하면 우리의 딥 러닝 모델은 각각 두 개의 반사실적 CTR을 추정하고, 그들의 모델링 목표는 실제로 두 개의 CTR이 추구하는 차이이기 때문입니다. 이 차이는 더 크다.
A3: 이 문제는 UPLIFT 문제가 아닙니다. 일반적으로 Embedding이 사용되며 카테고리 유형에는 One-Hot이 사용됩니다.
A4: 네, S-Learner에도 DNN이 있습니다.
A5: 심층 모델의 가장 큰 장점은 기능 교차, 주의 메커니즘 등과 같은 복잡한 네트워크 구조를 사용하여 기능을 완전히 학습한다는 것입니다. 포레스트 및 트리 모델의 가장 큰 장점은 안정성이며 모델링 목표는 다음과 같습니다. 숲 모델은 간단합니다. CATE입니다.
A6: 우리는 오프라인에서 지표를 평가하기 위해 주로 AUUC와 QINI를 사용하며, 임무 목표에 따라 마케팅을 통해 얻은 ROI를 확인하기 위해 주로 재무 지표로 변환할 수 있습니다.
A7: 실제로 금융 시나리오에는 검색과 프로모션이 있지만 금융 시나리오에는 고유성이 있는 것이 사실입니다. 이러한 고유성은 신용 카드, 인증 카드 등이 포함된 매우 긴 전환 링크에 있습니다. 승인 과정도, 자금 조달 금액을 어떻게 추정하는지도 어렵다.
A8: UPLIFT 모델과 DML 모두 CATE를 해결하는 데 사용됩니다. UPLIFT 모델은 트리 모델, 딥 러닝 등 머신러닝을 주요 도구로 사용하고 인과 추론 아이디어도 통합합니다. DML 모델은 계량 경제학 아이디어를 사용하여 기계 학습 도구가 CATE를 추정하도록 안내합니다. UPLIFT 모델은 더 큰 범주이며 일부 모델도 DML의 아이디어를 활용합니다.
A9: 규모의 문제는 사실 매우 중요한 문제입니다. 노출 규모는 그렇지 않습니다. 가장 중요한 것은 얼마나 많은 양의 샘플을 보유하고 있는지가 모델링 가능 여부를 결정하는 핵심입니다.
A10: 논문은 검토 후 오픈 소스로 공개됩니다.
위 내용은 Tencent Financial 사용자 성장 시나리오에 심층 UPLIFT 모델 적용의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!