Rumah  >  Artikel  >  Peranti teknologi  >  Claude 3 memintas GPT-4 Arena untuk mencapai puncak! Xiaobei Haiku menjadi kegemaran baharu pembangun: keberkesanan kos yang tiada tandingan

Claude 3 memintas GPT-4 Arena untuk mencapai puncak! Xiaobei Haiku menjadi kegemaran baharu pembangun: keberkesanan kos yang tiada tandingan

PHPz
PHPzke hadapan
2024-03-28 14:58:321130semak imbas

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

GPT-4 benar-benar telah diatasi!

Dalam arena model besar, Claude 3 Big Cup Opus ialah raja baharu, dan skor Elo mencapai bahagian atas senarai.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Malah Xiaobei Haiku telah memasuki eselon kedua, mengatasi model GPT-4-0613 dan meninggalkan GPT-3.5-turbo jauh di belakang.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Harga token input Haiku adalah separuh lebih murah daripada GPT-3.5-turbo dari segi output, ia hampir 2 yuan lebih murah daripada GPT-3.5-turbo setiap 1 juta token.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Berbanding dengan GPT-4, harganya cuma 1/20 sahaja. Dan Haiku juga menyokong konteks 200k.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Tidak hairanlah sesetengah pembangun terus terang berkata:

GPT-3.5 terdedah kepada Claude Haiku.

Bukan sahaja harganya lebih murah, Haiku juga telah membawanya ke peringkat seterusnya.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Sebelum Claude 3 menyertai pertandingan, keluarga GPT-4 telah mendominasi ranking selama hampir setahun.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Untuk menambah pengetahuan latar belakang kepada rakan baharu: standard pemarkahan Papan Pendahulu Arena Chatbot LMSYS ialah pemarkahan manusia Soalan yang sama dilemparkan kepada dua model A dan B pada masa yang sama, dan hakim manusia Sila undi mana-mana jawapan yang anda fikir adalah yang terbaik.

Cawan kecil Haiku telah menjadi kegemaran baharu pembangun

Perlu dinyatakan bahawa dalam ucapan tahniah rasmi dari Arena, model Haiku turut diserlahkan khas:

Menurut pilihan pengguna kami, Claude 3 Haiku telah mencapai tahap GPT-4.

Kepantasan, fungsi dan panjang konteksnya adalah unik di pasaran hari ini. . Malah, dengan keberkesanan kos yang sangat tinggi, Claude 3 small cup Haiku sememangnya telah menjadi kegemaran baharu dalam kalangan komuniti pembangun.

Sesetengah orang telah segera membuka imaginasi mereka dan menghasilkan projek sumber terbuka yang boleh "overclock" kesan Haiku ke tahap Opus yang besar, menarik banyak perhatian.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Ringkasnya, biarkan Opus menjadi guru Haiku:

Mula-mula gunakan Opus untuk menjana contoh melaksanakan tugas, dan kemudian gunakan kes pengajaran ini untuk meningkatkan tahap postur Haiku.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌Penekanan: Harga Haiku hanya 1/60 daripada Opus, dan kelajuan tindak balasnya adalah 10 kali ganda daripada Opus.
Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌Projek yang dipanggil gpt-prompt-engineer ini pada masa ini mempunyai sejumlah 7.3k bintang di GitHub.

Saudara Matt inilah yang turut menggunakan Opus dan Haiku untuk mencipta "penganalisis saham AI", yang secara langsung menjadi popular di GitHub.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Banyak produk aplikasi juga telah disambungkan ke Haiku buat kali pertama. Contohnya, Vercel boleh menjana UI tapak web secara automatik berdasarkan gesaan. . Model terbaru bersaing, yang gila itu sendiri.

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌
Tetapi sudah tentu apa yang paling dinanti-nantikan oleh pembangun ialah:

OpenAI, cepat dan gulung (doge).

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Atas ialah kandungan terperinci Claude 3 memintas GPT-4 Arena untuk mencapai puncak! Xiaobei Haiku menjadi kegemaran baharu pembangun: keberkesanan kos yang tiada tandingan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam