Rumah > Artikel > Peranti teknologi > Tencent mengeluarkan komponen data sumber terbuka Fast-Causal-Inference untuk menyokong analisis statistik vektor teragih dan inferens sebab
Tencent mengumumkan pada akaun awamnya "Tencent Open Source" bahawa projek komponen sains data teragih sumber terbukanya Fast-Causal-Inference telah dikeluarkan secara terbuka di GitHub
▲ Sumber gambar akaun awam "Tencent Open Source"
It dilaporkan ,Ini ialah pustaka pengiraan analisis statistik dan inferens yang dibangunkan oleh Tencent WeChat yang menggunakan interaksi SQL dan berdasarkan vektorisasi teragih Ia dikatakan dapat "menyelesaikan kesesakan prestasi perpustakaan model statistik sedia ada (R / Python) di bawah data besar , menyediakan keupayaan inferens Sebab yang boleh melaksanakan berpuluh bilion data dalam saat, dan pada masa yang sama menurunkan ambang untuk menggunakan model statistik melalui bahasa SQL, menjadikannya mudah untuk digunakan dalam persekitaran pengeluaran Pada masa ini, ia telah dilaksanakan dalam berbilang perniagaan WeChat dalaman seperti akaun video WeChat dan aplikasi carian WeChat ”
Pengenalan rasmi:
Menyediakan keupayaan inferens sebab untuk pelaksanaan data secara besar-besaran dalam beberapa saat
Dengan menggunakan execution OLAP yang digerakkan oleh vektor. pengalaman pengguna boleh dipertingkatkan lagi untuk mencapai tahap muktamad
Cara minimalis menggunakan SQL
SQLGateway WebServer menurunkan ambang untuk menggunakan model statistik melalui bahasa SQL, dan menyediakan cara minimalis untuk menggunakan SQL pada bahagian atas lapisan, secara telus melakukan pengembangan dan pengoptimuman SQL berkaitan enjin.
Menyediakan keupayaan inferens sebab bagi pengendali asas, operator tertib tinggi dan pengkapsulan aplikasi lapisan atas
Menyokong ttest, OLS, Lasso, model berasaskan pokok, padanan, bootstrap, DML, dsb.
Tapak ini juga mengetahui bahawa pegawai itu menyatakan bahawa versi pertama sudah menyokong ciri berikut:
Alat inferens sebab musabab asas
Alat inferens penyebab lanjutan
- ttest berdasarkan kaedah delta, menyokong CUPED
OLS data Tahap subsaatberasaskan OLS IV, WLS dan GLS lain, JPS, kawalan sintetik, CUPED, pengantaraan sedang mengeram
- naikkan: berpuluh juta operasi tahap minit data
- strap
/ pilih atur Tunggu rangka kerja simulasi data untuk menyelesaikan masalah anggaran varians tanpa penyelesaian yang dipaparkan
Untuk mengekalkan maksud asal tidak berubah, kandungan perlu ditulis semula ke dalam bahasa Cina. Tidak perlu muncul ayat asal
Atas ialah kandungan terperinci Tencent mengeluarkan komponen data sumber terbuka Fast-Causal-Inference untuk menyokong analisis statistik vektor teragih dan inferens sebab. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!