>  기사  >  기술 주변기기  >  Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

王林
王林앞으로
2023-04-11 12:34:031857검색

​머스크의 “오픈소스 약속”이 드디어 실현되었습니다.

방금 Musk는 공식적으로 다음과 같이 발표했습니다.

대부분의 (트위터) 추천 알고리즘은 오늘부터 오픈 소스가 될 것이며 나머지도 뒤따를 것입니다.

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

그리고 머스크는 즉시 트위터 추천 알고리즘의 소스 코드 주소를 GitHub에 공개했습니다.

단 몇 시간 만에 수만 개의 별을 얻었습니다.

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

또한 Musk는 다음과 같이 말했습니다.

트위터는 24~48시간마다 사용자 제안을 기반으로 추천 알고리즘을 업데이트할 것입니다.

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

이제, 매일 5억 개의 트윗을 바탕으로 추천을 해준다는 이 거대 알고리즘의 정체가 드디어 드러났습니다.

트위터 추천 알고리즘은 어떤 모습인가요?

보고서에 따르면 트위터의 추천 시스템은 트윗, 사용자 및 상호 작용 데이터에서 잠재적인 정보를 추출할 수 있는 일련의 핵심 모델과 기능을 기반으로 합니다.

이 모델의 역할은 "미래에 다른 사용자와 상호 작용할 확률은 얼마입니까?" 또는 "트위터에는 어떤 커뮤니티가 있으며 어떤 커뮤니티가 있습니까?"와 같은 트위터 네트워크의 중요한 질문에 답하는 것입니다.

이 질문에 정확하게 답할 수 있다면 트위터에서 더 관련성이 높은 추천을 제공하도록 할 수 있습니다.

Twitter의 추천 시스템은 세 부분으로 구성됩니다.

  • 다양한 추천 소스에서 최고의 트윗을 얻으세요. 이 프로세스를 후보 소스라고 합니다.
  • 머신러닝 모델을 사용해 각 트윗의 순위를 매기세요.
  • 차단된 사용자의 트윗, NSFW 콘텐츠, 본 트윗 필터링과 같은 경험적 방법과 필터를 적용하세요.

For You 타임라인을 구축하고 전달하는 서비스를 '홈믹서'라고 합니다.

"Home Mixer"는 동적 콘텐츠 흐름을 구축하는 데 도움이 되는 맞춤형 Scala 프레임워크인 "Product Mixer"를 기반으로 구축되었습니다.

이 서비스는 다양한 후보 소스, 채점 기능, 휴리스틱 및 필터를 연결하는 소프트웨어 백본 역할을 합니다.

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

후보 소스

Twitter는 여러 후보 소스를 사용하여 사용자를 위한 최근 관련 트윗을 검색합니다.

각 요청에 대해 트위터는 이러한 소스를 통해 수억 개의 트윗 풀에서 가장 좋은 1,500개의 트윗을 가져오려고 합니다.

팔로우하는 사람(내부 네트워크)과 팔로우하지 않는 사람(외부 네트워크) 중에서 후보자를 찾아보세요.

현재 '당신을 위한 추천' 타임라인은 평균적으로 내부 네트워크 트윗 50%, 외부 네트워크 트윗 50%로 구성됩니다(단, 이는 사용자에 따라 다를 수 있음).

네트워크 내 소스

네트워크 내 소스는 가장 큰 후보 소스이며 팔로우하는 사용자에게 가장 관련성이 높고 최신 트윗을 제공하는 것을 목표로 합니다.

로지스틱 회귀 모델을 사용하여 관련성을 기준으로 팔로우하는 사람들의 트윗 순위를 효율적으로 매깁니다. 그런 다음 상위 순위 트윗이 다음 단계로 전송됩니다.

내부 네트워크 트윗 순위에서 가장 중요한 구성 요소는 Real Graph입니다.

리얼 그래프는 두 사용자 간의 상호 작용 가능성을 예측하는 데 사용되는 모델입니다. 사용자와 트윗 작성자 사이의 실제 그래프 점수가 높을수록 더 많은 트윗이 포함됩니다.

최근 트위터에서 내부 웹 소스가 연구 대상이 되었습니다. 트위터는 최근 각 사용자의 트윗 캐시에서 내부 네트워크의 트윗을 제공하는 데 사용했던 12년 된 서비스인 팬아웃(Fanout) 서비스 사용을 중단했습니다.

네트워크 외부 소스

사용자 네트워크 외부에서 관련 트윗을 찾는 것은 까다로운 문제입니다.

저자를 팔로우하지 않으면 트윗이 자신과 관련이 있는지 어떻게 알 수 있나요?

이를 위해 트위터는 이 문제를 해결하기 위해 두 가지 접근 방식을 취했습니다.

하나는 소셜 그래프입니다.

이 방법은 내가 팔로우하거나 비슷한 관심사를 가진 사람들의 활동을 분석하여 어떤 관련성이 있는지 추정하는 것입니다.

주로 참여 그래프를 탐색하고 아래 단계에 따라 다음 질문에 답하세요.

  • 내가 팔로우하는 사람들이 최근 트위터에 어떤 글을 올렸나요?
  • 나처럼 비슷한 트윗을 좋아하는 사람은 누구이며, 최근에는 또 무엇을 좋아했나요?

팀에서는 이러한 질문에 대한 답변을 기반으로 후보 트윗을 생성하고 로짓 모델을 사용하여 결과 트윗의 순위를 매깁니다.

이러한 유형의 그래프 순회는 외부 네트워크 추천에 필수적입니다. 팀은 이러한 순회를 수행하기 위해 사용자와 트윗 간의 실시간 상호 작용 그래프를 유지하는 그래프 처리 엔진인 GraphJet을 개발했습니다.

트위터 참여 검색 및 네트워크 팔로우에 대한 이러한 경험적 방법이 유용한 것으로 입증되었지만, 내장된 공간적 접근 방식은 외부 네트워크의 트윗을 더 많이 얻을 수 있는 소스가 되었습니다.

두 번째는 Embedding Spaces입니다.

임베디드 공간적 접근 방식은 콘텐츠 유사성에 대한 보다 일반적인 질문, 즉 어떤 트윗과 사용자가 내 관심사를 공유하는가에 대한 답변을 목표로 합니다.

임베딩은 사용자 관심분야와 트윗 콘텐츠를 디지털 방식으로 표현하는 방식으로 작동합니다. 그런 다음 이 임베딩 공간에 있는 두 사용자, 트윗 또는 사용자-트윗 쌍 간의 유사성을 계산할 수 있습니다.

이 유사성은 정확한 임베딩이 생성되는 한 상관 관계의 대리자로 사용될 수 있습니다.

Twitter의 가장 유용한 임베딩 공간 중 하나는 SimClusters입니다.

SimClusters는 사용자 지정 행렬 분해 알고리즘을 사용하여 영향력 있는 사용자 그룹(145,000개의 커뮤니티, 3주마다 업데이트됨)이 기반으로 하는 커뮤니티를 검색합니다.

사용자와 트윗은 커뮤니티 공간에 표시되며 여러 커뮤니티에 속할 수 있습니다. 커뮤니티의 규모는 개인 친구 그룹의 수천 명의 사용자부터 뉴스나 대중 문화의 수억 명의 사용자까지 다양합니다.

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

자세한 내용을 보려면 링크 끝에 있는 링크를 클릭하세요. 기사~

One More Thing

트위터의 알고리즘은 오픈소스이고, 빠른 네티즌들은... 알고리즘을 기반으로 빅브이가 되는 방법을 요약하기 시작했습니다:

팔로잉하는 사람 수와 숫자의 비율 당신을 팔로우하는 사람들의 수는 매우 중요하며 TwitterBlue를 구독하는 것은 특정한 역할을 합니다... ...

Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.

참조 링크:
[1]​​​https://www.php.cn/link/ce2b9a26bddc32cba5af69372ee14c00 ​​​
[2]​​​https://www.php .cn/link/e55bc0255c752d1cb05da10c0f1f5026​​​
[3]​​​https://www.php.cn/link/10fe8dc69a0964edc16fed1a1bd557 16 ​​​
[4]​​​https:// www.php .cn/link/51f4efbfb3e18f4ea053c4d3d282c4e2​

위 내용은 Musk 오픈 소스 트위터 추천 알고리즘인 GitHub는 몇 초 만에 별 10,000개에 도달했으며 24~48시간마다 진화할 것을 약속했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제