>기술 주변기기 >일체 포함 >Tencent는 분산 벡터화된 통계 분석 및 인과 추론을 지원하는 오픈 소스 데이터 구성 요소인 Fast-Causal-Inference를 출시했습니다.

Tencent는 분산 벡터화된 통계 분석 및 인과 추론을 지원하는 오픈 소스 데이터 구성 요소인 Fast-Causal-Inference를 출시했습니다.

WBOY
WBOY앞으로
2023-09-18 16:57:021183검색

Tencent는 공개 계정 'Tencent Open Source'를 통해 자사 오픈 소스 분산 데이터 과학 구성 요소 프로젝트인 Fast-Causal-Inference가 GitHub에 공개되었다고 발표했습니다.

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断▲ 사진 출처 'Tencent Open Source' 공개 계정

It SQL 상호 작용을 사용하고 분산 벡터화를 기반으로 하는 Tencent WeChat에서 개발한 통계 분석 및 인과 추론 계산 라이브러리입니다. "기존 통계 모델 라이브러리(R/Python)의 성능 병목 현상을 해결한다고 합니다." 빅데이터는 수백억 개의 데이터를 몇 초 만에 실행할 수 있는 인과 추론 기능을 제공하는 동시에 SQL 언어를 통해 통계 모델 사용의 문턱을 낮춰 생산 환경에서 사용하기 쉽게 구현됐다. WeChat 비디오 계정 및 WeChat 검색과 같은 여러 내부 WeChat 비즈니스 응용 프로그램. 사용자 경험을 더욱 향상시켜 최고의 수준에 도달할 수 있습니다

SQL을 사용하는 미니멀한 방식

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断SQLGateway WebServer는 SQL 언어를 통해 통계 모델을 사용하는 문턱을 낮추고 상위에서 미니멀한 SQL 사용 방식을 제공합니다. 엔진 관련 SQL 확장 및 최적화를 투명하게 수행합니다.


기본 연산자, 상위 연산자, 상위 계층 애플리케이션 캡슐화의 인과 추론 기능 제공

ttest, OLS, Lasso, Tree 기반 모델, 매칭, 부트스트랩, DML 등 지원

腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断

이 사이트는 또한 첫 번째 버전이 이미 다음 기능을 지원한다고 공식적으로 밝혔음을 알게 되었습니다.

기본 인과 추론 도구腾讯发布开源数据组件 Fast-Causal-Inference,支持分布式向量化统计分析和因果推断

ttest는 deltamethod를 기반으로 하며 CUPED

OLS, 10억 행의 데이터를 지원합니다. 1초 미만 수준의

고급 인과 추론 도구
  • OLS 기반 IV, WLS 및 기타 GLS, DID, 합성 제어, CUPED, 조정이 인큐베이팅 중
  • uplift: 수천만 데이터 분 수준 작업

부트스트랩 / 순열 데이터 시뮬레이션 프레임워크가 표시된 솔루션 없이 분산 추정 문제를 해결할 때까지 기다립니다.

  • 원래 의미를 변경하지 않고 유지하려면 내용을 중국어로 다시 작성해야 합니다. 원문이 나올 필요는 없습니다
오픈 소스 발표 | Tencent Distributed Data Science Component

Tencent / fast-causal-inference — GitHub

위 내용은 Tencent는 분산 벡터화된 통계 분석 및 인과 추론을 지원하는 오픈 소스 데이터 구성 요소인 Fast-Causal-Inference를 출시했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제