Rumah >Peranti teknologi >AI >Zhipu AI bekerjasama dengan Tsinghua KEG untuk mengeluarkan model besar berbilang modal sumber terbuka yang dipanggil CogVLM-17B

Zhipu AI bekerjasama dengan Tsinghua KEG untuk mengeluarkan model besar berbilang modal sumber terbuka yang dipanggil CogVLM-17B

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBke hadapan: 2023-10-12 11:41:011499semak imbas

Builder News pada 12 Oktober, baru-baru ini, Zhipu AI & Tsinghua KEG mengeluarkan dan sumber terbuka secara langsung model besar berbilang mod-CogVLM-17B dalam komuniti Moda. Dilaporkan bahawa CogVLM ialah model bahasa visual sumber terbuka yang berkuasa yang menggunakan modul pakar visual untuk menyepadukan pengekodan bahasa dan pengekodan visual secara mendalam, dan telah mencapai prestasi SOTA pada 14 penanda aras silang modal yang berwibawa.

CogVLM-17B kini merupakan model dengan prestasi komprehensif pertama dalam senarai akademik berwibawa berbilang modal, dan telah mencapai keputusan tempat paling maju atau kedua pada 14 set data. Kesan CogVLM bergantung pada idea "keutamaan visual", iaitu, memberikan pemahaman visual keutamaan yang lebih tinggi dalam model berbilang modal. Ia menggunakan pengekod visual parameter 5B dan modul pakar visual parameter 6B, dengan jumlah parameter 11B untuk memodelkan ciri imej, malah lebih daripada parameter 7B teks

Atas ialah kandungan terperinci Zhipu AI bekerjasama dengan Tsinghua KEG untuk mengeluarkan model besar berbilang modal sumber terbuka yang dipanggil CogVLM-17B. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Artikel ini dikembalikan pada:sohu.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel sebelumnya：Baidu World 2023 akan mengira detik, dan peta asli AI pertama di dunia akan dikeluarkanArtikel seterusnya：Baidu World 2023 akan mengira detik, dan peta asli AI pertama di dunia akan dikeluarkan

Artikel berkaitan

Lihat lagi