Tencent는 공개 계정 'Tencent Open Source'를 통해 자사 오픈 소스 분산 데이터 과학 구성 요소 프로젝트인 Fast-Causal-Inference가 GitHub에 공개되었다고 발표했습니다.
▲ 사진 출처 'Tencent Open Source' 공개 계정
It SQL 상호 작용을 사용하고 분산 벡터화를 기반으로 하는 Tencent WeChat에서 개발한 통계 분석 및 인과 추론 계산 라이브러리입니다. "기존 통계 모델 라이브러리(R/Python)의 성능 병목 현상을 해결한다고 합니다." 빅데이터는 수백억 개의 데이터를 몇 초 만에 실행할 수 있는 인과 추론 기능을 제공하는 동시에 SQL 언어를 통해 통계 모델 사용의 문턱을 낮춰 생산 환경에서 사용하기 쉽게 구현됐다. WeChat 비디오 계정 및 WeChat 검색과 같은 여러 내부 WeChat 비즈니스 응용 프로그램. 사용자 경험을 더욱 향상시켜 최고의 수준에 도달할 수 있습니다
SQL을 사용하는 미니멀한 방식ttest는 deltamethod를 기반으로 하며 CUPEDOLS, 10억 행의 데이터를 지원합니다. 1초 미만 수준의SQLGateway WebServer는 SQL 언어를 통해 통계 모델을 사용하는 문턱을 낮추고 상위에서 미니멀한 SQL 사용 방식을 제공합니다. 엔진 관련 SQL 확장 및 최적화를 투명하게 수행합니다.
기본 연산자, 상위 연산자, 상위 계층 애플리케이션 캡슐화의 인과 추론 기능 제공
ttest, OLS, Lasso, Tree 기반 모델, 매칭, 부트스트랩, DML 등 지원
이 사이트는 또한 첫 번째 버전이 이미 다음 기능을 지원한다고 공식적으로 밝혔음을 알게 되었습니다.기본 인과 추론 도구
고급 인과 추론 도구오픈 소스 발표 | Tencent Distributed Data Science Component
- OLS 기반 IV, WLS 및 기타 GLS, DID, 합성 제어, CUPED, 조정이 인큐베이팅 중
- uplift: 수천만 데이터 분 수준 작업
부트스트랩 / 순열 데이터 시뮬레이션 프레임워크가 표시된 솔루션 없이 분산 추정 문제를 해결할 때까지 기다립니다.
- 원래 의미를 변경하지 않고 유지하려면 내용을 중국어로 다시 작성해야 합니다. 원문이 나올 필요는 없습니다
Tencent / fast-causal-inference — GitHub
위 내용은 Tencent는 분산 벡터화된 통계 분석 및 인과 추론을 지원하는 오픈 소스 데이터 구성 요소인 Fast-Causal-Inference를 출시했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!