Rumah > Artikel > Peranti teknologi > Alibaba Cloud mengeluarkan Tongyi Qianwen 2.0, dengan prestasi dipercepatkan untuk mengejar GPT-4
Pada Persidangan Pengkomputeran Hangzhou 2023, Ketua Pegawai Teknologi Awan Alibaba Zhou Jingren mengeluarkan Tongyi Qianwen 2.0, model besar dengan ratusan bilion parameter. Dalam 10 penilaian berwibawa, prestasi komprehensif Tongyi Qianwen 2.0 melebihi GPT-3.5 dan semakin pantas untuk mengejar GPT-4.
Dilaporkan bahawa Tongyi Qianwen 2.0 telah mencapai kemajuan besar dalam tempoh enam bulan yang lalu. Berbanding dengan versi 1.0 yang dikeluarkan pada bulan April, Tongyi Qianwen 2.0 telah meningkatkan dengan ketara keupayaannya dalam pemahaman perintah yang kompleks, penciptaan sastera, matematik am, ingatan pengetahuan dan rintangan halusinasi. Pada masa ini, prestasi komprehensif Tongyi Qianwen telah melebihi GPT-3.5, dan sedang mempercepatkan langkah mengejar GPT-4
Tongyi Qianwen 2.0 telah dinilai pada 10 Penanda Aras arus perdana termasuk MMLU, C-Eval, GSM8K, HumanEval, dan MATH Skor keseluruhan pada set melebihi Llama-2-70B Meta, kadar kemenangan adalah 91% lebih tinggi daripada OpenAI's Chat-3.5, 46% lebih tinggi daripada GPT-4, dan jurang dengan GPT-4 dikecilkan lagi
Bahasa Cina dan Kebolehan Memahami Bahasa Inggeris adalah kemahiran asas model bahasa besar. Dari segi tugasan Bahasa Inggeris, Tongyi Qianwen 2.0 mendapat markah 82.5 pada penanda aras MMLU, kedua selepas GPT-4 Dengan meningkatkan bilangan parameter dengan ketara, Tongyi Qianwen 2.0 boleh memahami dan memproses struktur dan konsep bahasa yang kompleks dari segi tugas , Tongyi Qianwen 2.0 mencapai markah tertinggi pada penanda aras C-Eval dengan kelebihan yang jelas Ini kerana model itu mempelajari lebih banyak korpus Cina semasa latihan, mengukuhkan lagi keupayaan pemahaman dan ekspresi bahasa Cina.
Dalam bidang seperti penaakulan matematik dan pemahaman kod, Tongyi Qianwen 2.0 telah mencapai kemajuan yang ketara. Dalam ujian penanda aras penaakulan GSM8K, Tongyi Qianwen menduduki tempat kedua, menunjukkan keupayaan pengkomputeran dan penaakulan logik yang kuat dalam ujian HumanEval, skor Tongyi Qianwen mengikuti GPT-4 dan GPT-3.5, yang terutamanya mengukur keupayaan model untuk skala besar; memahami dan melaksanakan serpihan kod adalah asas bagi model besar untuk digunakan dalam senario seperti bantuan pengaturcaraan dan pembaikan kod automatik.
Atas ialah kandungan terperinci Alibaba Cloud mengeluarkan Tongyi Qianwen 2.0, dengan prestasi dipercepatkan untuk mengejar GPT-4. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!