cari
RumahPeranti teknologiAIDengan ratusan bilion parameter, Alibaba Cloud Tongyi Qianwen telah berkembang kepada 2.0: prestasi melebihi GPT-3.5 dan mempercepatkan untuk mengejar GPT-4

Alibaba Cloud secara rasmi mengeluarkan Tongyi Qianwen 2.0, model besar dengan ratusan bilion parameter, pada 31 Oktober. Menurut 10 keputusan penilaian berwibawa, prestasi komprehensif Tongyi Qianwen 2.0 melebihi GPT-3.5 dan pantas mengejar GPT-4. Pada hari yang sama, APP Tongyi Qianwen telah dilancarkan di pasaran aplikasi mudah alih utama Sesiapa sahaja boleh mengalami secara langsung keupayaan model terbaharu melalui APP

Dalam 6 bulan lalu, Tongyi Qianwen 2.0 telah membuat lonjakan besar dalam prestasi, berbanding dengan 4 Versi 1.0 yang dikeluarkan pada bulan Mac, Tongyi Qianwen 2.0 telah meningkatkan dengan ketara keupayaannya dalam pemahaman perintah yang kompleks, penciptaan sastera, matematik am, ingatan pengetahuan dan rintangan halusinasi. Pada masa ini, prestasi komprehensif Tongyi Qianwen telah melebihi GPT-3.5, mempercepatkan untuk mengejar GPT-4.

Dengan ratusan bilion parameter, Alibaba Cloud Tongyi Qianwen telah berkembang kepada 2.0: prestasi melebihi GPT-3.5 dan mempercepatkan untuk mengejar GPT-4

Prestasi Tongyi Qianwen 2.0 yang komprehensif melebihi GPT-3.5 dan semakin pantas untuk mengejar GPT-4

Dalam 10 set penilaian penanda aras arus perdana, GPT-3.5 dan Eval, GPT-4, C8-SMEval. MATH, ia telah lulus Skor keseluruhan Yiqianwen 2.0 mengatasi Meta Llama-2-70B Berbanding dengan OpenAI's Chat-3.5, ia mempunyai sembilan kemenangan dan satu kekalahan Berbanding dengan GPT-4, ia mempunyai empat kemenangan dan enam kekalahan dengan GPT-4 telah mengecilkan lagi

Keupayaan memahami bahasa Cina dan Inggeris adalah kemahiran asas model bahasa besar. Dari segi tugasan Bahasa Inggeris, Tongyi Qianwen 2.0 mendapat markah 82.5 pada penanda aras MMLU, kedua selepas GPT-4 Dengan meningkatkan bilangan parameter dengan ketara, Tongyi Qianwen 2.0 boleh memahami dan memproses struktur dan konsep bahasa yang kompleks dari segi tugas , Tongyi Qianwen 2.0 mencapai markah tertinggi pada penanda aras C-Eval dengan kelebihan yang jelas Ini kerana model itu mempelajari lebih banyak korpus Cina semasa latihan, mengukuhkan lagi keupayaan pemahaman dan ekspresi bahasa Cina.

Dalam bidang seperti penaakulan matematik dan pemahaman kod, Tongyi Qianwen 2.0 telah mencapai kemajuan yang ketara. Dalam ujian penanda aras penaakulan GSM8K, Tongyi Qianwen menduduki tempat kedua, menunjukkan keupayaan pengkomputeran dan penaakulan logik yang kuat dalam ujian HumanEval, skor Tongyi Qianwen mengikuti GPT-4 dan GPT-3.5, yang terutamanya mengukur keupayaan model untuk skala besar; memahami dan melaksanakan serpihan kod adalah asas bagi model besar untuk digunakan dalam senario seperti bantuan pengaturcaraan dan pembaikan kod automatik.

Dengan ratusan bilion parameter, Alibaba Cloud Tongyi Qianwen telah berkembang kepada 2.0: prestasi melebihi GPT-3.5 dan mempercepatkan untuk mengejar GPT-4

Tongyi Qianwen 2.0 dikeluarkan

Tongyi Qianwen lebih matang dan lebih mudah digunakan. Tongyi Qianwen 2.0 telah membuat pengoptimuman teknikal dari segi pematuhan arahan, penggunaan alat, penciptaan yang diperhalusi, dll., supaya ia boleh disepadukan dengan lebih baik ke dalam senario aplikasi hiliran. Laman web rasmi Tongyi Large Model telah melancarkan fungsi berbilang modal dan pemalam, menyokong tugas tersegmen seperti input imej dan penghuraian dokumen.

Pada masa yang sama, lapan kumpulan model industri utama berdasarkan latihan model besar Tongyi telah dilancarkan iaitu Tongyi Lingma - pembantu pengekodan pintar, Tongyi Zhiwen - pembantu membaca AI, Tongyi Listening - bekerja dan belajar pembantu AI, Tongyi Stardust -. platform penciptaan watak yang diperibadikan, Tongyi Midianjin - pembantu penyelidik pelaburan pintar, Tongyi Xiaomi - perkhidmatan pelanggan pintar, Tongyi Renxin - pembantu kesihatan eksklusif peribadi, Tongyi Farui - perunding undang-undang AI. 8 model industri utama direka untuk senario menegak yang paling popular dan dilatih khas menggunakan data domain. Pengguna boleh mengalami secara langsung fungsi model di tapak web rasmi, dan pembangun boleh menyepadukan keupayaan model ke dalam aplikasi dan perkhidmatan model besar mereka sendiri melalui pembenaman halaman web, panggilan API/SDK, dsb.

Dengan ratusan bilion parameter, Alibaba Cloud Tongyi Qianwen telah berkembang kepada 2.0: prestasi melebihi GPT-3.5 dan mempercepatkan untuk mengejar GPT-4

Keluarga model besar Tongyi telah dinaik taraf sepenuhnya, dan 8 kumpulan model industri utama telah dilancarkan

Sehingga Oktober, Alibaba Cloud telah menjalankan kerjasama yang mendalam dengan rakan kongsi terkemuka dalam lebih 60 industri , mempromosikan General Qianwen dalam aplikasi Praktikal di pejabat, pelancongan kebudayaan, kuasa elektrik, hal ehwal kerajaan, insurans perubatan, pengangkutan, pembuatan, kewangan, pembangunan perisian dan bidang lain

Zhou Jingren berkata bahawa Alibaba Cloud merancang untuk membuka sumber versi 72B Tongyi Qianwen dalam masa terdekat. Sebelum ini, Alibaba Cloud telah menggunakan sumber terbuka model versi 7B dan 14B, dan muat turun kumulatif model ini telah melebihi 1 juta. Alibaba Cloud akan terus menyokong pembangun dalam pelbagai industri untuk menggunakan model sumber terbuka Tongyi Qianwen untuk menginovasi model dan aplikasi

Dengan ratusan bilion parameter, Alibaba Cloud Tongyi Qianwen telah berkembang kepada 2.0: prestasi melebihi GPT-3.5 dan mempercepatkan untuk mengejar GPT-4

Tongyi Qianwen 72B akan menjadi sumber terbuka tidak lama lagi

Atas ialah kandungan terperinci Dengan ratusan bilion parameter, Alibaba Cloud Tongyi Qianwen telah berkembang kepada 2.0: prestasi melebihi GPT-3.5 dan mempercepatkan untuk mengejar GPT-4. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:机器之心. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Apakah perbezaan antara jenis I dan Jenis II? - Analytics VidhyaApakah perbezaan antara jenis I dan Jenis II? - Analytics VidhyaApr 18, 2025 am 09:48 AM

Memahami Kesalahan Jenis I dan Jenis II dalam Ujian Hipotesis Statistik Bayangkan ujian percubaan klinikal menguji ubat tekanan darah baru. Percubaan itu menyimpulkan bahawa dadah dengan ketara menurunkan tekanan darah, tetapi pada hakikatnya, ia tidak. Ini adalah jenis

Ringkasan Teks Automatik dengan Perpustakaan SumyRingkasan Teks Automatik dengan Perpustakaan SumyApr 18, 2025 am 09:37 AM

Sumy: Pembantu Ringkasan AI anda Bosan menyaring dokumen yang tidak berkesudahan? Sumy, perpustakaan Python yang kuat, menawarkan penyelesaian yang diselaraskan untuk ringkasan teks automatik. Artikel ini meneroka keupayaan Sumy, membimbing anda

Kenyataan Kes SQL: Dari Asas ke Teknik LanjutanKenyataan Kes SQL: Dari Asas ke Teknik LanjutanApr 18, 2025 am 09:31 AM

Cabaran Data: Menguasai pernyataan kes SQL untuk pandangan yang tepat Siapa yang memerlukan peguam apabila anda mempunyai peminat data? Penganalisis data, saintis, dan semua orang dalam dunia data yang luas menghadapi cabaran kompleks mereka sendiri, memastikan fungsi sistem Fla

Apakah kuasa rantai pengetahuan dalam kejuruteraan segera?Apakah kuasa rantai pengetahuan dalam kejuruteraan segera?Apr 18, 2025 am 09:30 AM

Memanfaatkan kekuatan rantai pengetahuan di AI: menyelam yang mendalam menjadi kejuruteraan segera Adakah anda tahu bahawa kecerdasan buatan (AI) bukan sahaja dapat memahami soalan anda tetapi juga menenun bersama -sama dengan banyak pengetahuan untuk memberikan jawapan yang berwawasan?

Bolehkah AI membantu kita mencapai keseimbangan kerja-hidup? - Analytics VidhyaBolehkah AI membantu kita mencapai keseimbangan kerja-hidup? - Analytics VidhyaApr 18, 2025 am 09:27 AM

Pengenalan Joanna Maciejewska baru -baru ini berkongsi pemerhatian yang berwawasan mengenai x: Cabaran terbesar dengan push AI? Ia salah arah. Saya mahu AI mengendalikan dobi dan hidangan supaya saya dapat memberi tumpuan kepada seni dan menulis, bukan sebaliknya. - Joanna MA

Panduan untuk memanggil alat dengan llama 3.1Panduan untuk memanggil alat dengan llama 3.1Apr 18, 2025 am 09:26 AM

Meta's Llama 3.1: menyelam mendalam ke dalam keupayaan LLM sumber terbuka Meta terus memimpin pertuduhan dalam model bahasa besar sumber terbuka (LLMS). Keluarga llama, yang berkembang dari llama ke llama 2, llama 3, dan sekarang llama 3.1, menunjukkan komitmen untuk

Apakah carta SPC? - Analytics VidhyaApakah carta SPC? - Analytics VidhyaApr 18, 2025 am 09:24 AM

Pengenalan Carta Kawalan Proses Statistik (SPC) adalah alat penting dalam pengurusan kualiti, membolehkan organisasi memantau, mengawal, dan memperbaiki proses mereka. Dengan menggunakan kaedah statistik, carta SPC secara visual mewakili variasi data

Top 30 Soalan Temubual MySQL - Analytics VidhyaTop 30 Soalan Temubual MySQL - Analytics VidhyaApr 18, 2025 am 09:23 AM

Panduan ini melengkapkan anda untuk wawancara MySQL anda dengan meliputi 30 soalan yang merangkumi tahap pemula, pertengahan, dan lanjutan. MySQL, alat penting dalam pengurusan data dan analisis, diterokai melalui konsep teoritis dan contoh pertanyaan praktikal

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa