China telah melakukannya sekali lagi dengan model AI dan kali ini pukulan lebih besar dan lebih baik! Baidu - sebuah syarikat AI Cina, baru -baru ini mengeluarkan dua model bahasa besar (LLMS) - Ernie 4.5 & x1. Menuntut untuk melakukan lebih baik daripada model terbaru & terbaru Openai sehingga kini-GPT-4.5, model-model ini lebih cekap daripada DeepSeek-R1! Model kelihatan terlalu baik untuk menjadi benar - menawarkan kualiti tinggi pada sebahagian kecil daripada harga. Dalam blog ini, kami akan meneroka model Ernie 4.5 & X1, menilai hasil penanda aras mereka, dan melihat bagaimana mereka melaksanakan dalam aplikasi dunia nyata. Jadi, mari kita mulakan.
Jadual Kandungan
- Apa itu Ernie 4.5 & x1?
- Ernie 4.5
- Ernie X1
- Bagaimana cara mengakses Ernie 4.5 & x1?
- Pemeriksaan Prestasi Ernie 4.5 & X1
- Tugas 1: Analisis Imej Penalaran
- Tugas 2: Ringkasan Analisis Dokumen
- Tugas 3: Analisis audio
- Tugas 4: Generasi Imej Kreativiti
- Ernie 4.5 & x1 Baidu: Harga
- Ernie 4.5 & x1: Hasil penanda aras standard
- Kesan masa depan
- Kesimpulan
- Soalan yang sering ditanya
Apa itu Ernie 4.5 & x1?
Ernie 4.5 & X1 adalah dua LLM multimodal terkini yang dibangunkan oleh syarikat teknologi Cina terkemuka Baidu, yang mengkhususkan diri dalam perkhidmatan internet, kecerdasan buatan, dan memandu autonomi. Ia paling terkenal dengan enjin carian dominannya di China dan kemajuan dalam inovasi AI-didorong. Baidu melancarkan LLM pertamanya, Ernie 3.0 Titan, kembali pada Disember 2021. Selepas itu, ia telah mengeluarkan beberapa model lagi, sambil bekerja secara serentak untuk membina LLM yang lebih mantap. Hasil dari semua penyelidikan dan usaha berterusan ialah Ernie 4.5 & x1.
Ernie 4.5
Ernie 4.5 adalah model asas multimodal yang mampu memahami dan mengintegrasikan pelbagai jenis data, termasuk teks, imej, audio, dan video. Pendekatan pemodelan yang pelbagai ini meningkatkan keupayaannya untuk memahami dan menghasilkan pelbagai jenis kandungan.
Berikut adalah beberapa ciri utama Ernie 4.5:
- Ernie 4.5 menunjukkan peningkatan yang komprehensif dalam pemahaman, generasi, penalaran, dan ingatan terhadap pendahulunya, Ernie 4.0.
- Ia menunjukkan kebolehan yang hebat dalam pencegahan halusinasi, penalaran logik, dan pengekodan, menjadikannya mahir mengendalikan tugas -tugas kompleks dengan ketepatan yang lebih tinggi.
- Model ini bahkan lebih baik daripada GPT-4.5 OpenAI dalam pelbagai tanda aras, sementara ia hanya berharga 1% daripada apa yang ia kos untuk menggunakan GPT-4.5!
Ernie X1
Ernie X1 direka sebagai model pemikiran yang mendalam dengan keupayaan multimodal. Ia adalah model pemikiran yang pertama yang dikeluarkan oleh Baidu. Berikut adalah beberapa ciri utamanya:
- Ernie X1 cemerlang dalam memahami konteks, merancang proses pemikirannya, mencerminkan tindak balasnya, dan berkembang dari masa ke masa.
- Ia mampu menggunakan pelbagai alat untuk tugas -tugas seperti carian lanjutan, pemahaman imej, dan pengiraan yang kompleks.
- Model ini menyampaikan prestasi setanding dengan DeepSeek-R1 tetapi pada separuh harga, menawarkan penyelesaian kos efektif untuk perusahaan yang mencari keupayaan AI maju.
Bagaimana cara mengakses Ernie 4.5 & x1?
Anda boleh mengakses Ernie 4.5 & x1 sama ada melalui chatbot AI mereka - Ernie Bot, atau melalui API.
Akses melalui Bot:
- Kepala ke https://yiyan.baide.com .
- Buat akaun anda dengan menambah butiran anda dan mulakan.
Kedua -dua model ini boleh diakses secara bebas kepada pengguna individu di platform BOT Baidu's Ernie. Walau bagaimanapun, pendaftaran untuk Ernie Bot kini terhad kepada warga China.
Akses melalui API:
- Kepala ke platform Maas Baidu Ai Cloud, Qianfan
- Buat akaun anda di platform untuk memulakan.
Pada masa ini, platform tidak dapat diakses oleh semua pengguna. Juga, hanya Ernie 4.5 yang boleh didapati melalui API, sementara Ernie X1 tidak lama lagi akan disediakan di platform.
Pemeriksaan Prestasi Ernie 4.5 & X1
Dalam bahagian ini, kami akan mengetahui bagaimana model -model ini melaksanakan tugas -tugas yang melibatkan multimedia, penalaran, analisis dokumen, dan banyak lagi. Oleh kerana antara muka model hanya menyokong bahasa Cina, dan penciptaan akaun terhad kepada warga China, kita akan melihat beberapa contoh bagaimana orang menggunakan kedua -dua model, dan output yang mereka terima. Kami akan meliputi beberapa kes penggunaan yang paling biasa dari Ernie 4.5 & x1 yang kami dapati dalam talian, termasuk:
- Penalaran dengan analisis imej
- Analisis dan ringkasan dokumen
- Analisis audio
- Kreativiti dan Generasi Imej
Tugas 1: Analisis Imej Penalaran
Dalam tugas ini, model itu diminta menyelesaikan masalah matematik yang diberikan kepadanya dalam bentuk imej.
Model yang digunakan: Ernie 4.5
Output:
Sama seperti kebanyakan LLM multimodal lain, Ernie 4.5 dengan cepat menganalisis video dan menyelesaikan masalah dalam imej. Ia mengambil semua soalan dalam imej satu demi satu, dan akhirnya meringkaskan mereka semua. Kelajuan dan ketepatan prestasinya menjadikannya alat yang berguna untuk pelajar, pendidik, penyelidik, dan profesional yang memerlukan penyelesaian masalah yang cepat dan tepat.
Tugas 2: Ringkasan Analisis Dokumen
Di sini, model itu diberi dokumen dan ia perlu meringkaskan maklumat mengenai topik tertentu dari dokumen itu.
Model yang digunakan: Ernie 4.5
Output:
Model ini membolehkan anda memuat naik pelbagai fail pelbagai jenis, sekaligus. Ia mampu memproses fail pelbagai jenis, termasuk DOCS, PDF, PPT, lembaran Excel, dan banyak lagi. Dari fail yang dimuat naik, anda boleh memilih satu (atau lebih) yang anda ingin menanyakan chatbot tentang dan model dengan cepat meringkaskan topik tersebut. Pemprosesan cepat pelbagai fail boleh sangat berguna untuk tugas -tugas seperti analisis penyelidikan, semakan dokumen undang -undang, pengekstrakan data kewangan, dan pelaporan korporat.
Tugas 3: Analisis audio
Untuk tugas ini, model itu perlu menganalisis audio yang diberikan dan mencari sumbernya.
Model yang digunakan: Ernie 4.5
Output:
Analisis audio adalah ciri yang tidak ada chatbots AI yang popular telah dimasukkan dalam antara muka mereka, menjadikan Ernie 4.5, yang pertama seumpamanya. Model ini dengan cepat menganalisis klip, menentukan sumbernya, dan kemudian terus menerangkan kepentingan klip. Analisis cepat dan penerangan terperinci, menjadikannya alat yang berharga untuk tugas-tugas seperti transkripsi masa nyata, carian berasaskan suara, pengesanan DeepFake, dan analisis sentimen di seluruh media, perkhidmatan pelanggan, pendidikan, dan penguatkuasaan undang-undang.
Tugas 4: Generasi Imej Kreativiti
Untuk tugas ini, model itu perlu menganalisis bilik dan mencadangkan hiasan yang mungkin dapat meningkatkan rayuan keseluruhannya. Ia kemudiannya perlu menghasilkan imej yang dikemas kini di bilik.
Model yang digunakan: Ernie X1
Output:
Model ini dengan cepat memproses imej. Ia kemudian mencadangkan peningkatan yang mungkin kepada hiasan bilik untuk meningkatkan rayuan keseluruhan. Akhirnya, ia menghasilkan imej bilik dengan semua peningkatan yang dicadangkan. Ciri ini merupakan tambahan yang hebat untuk tugas -tugas seperti reka bentuk dalaman, perancangan pengubahsuaian rumah, pementasan hartanah, dan visualisasi hiasan maya.
Nota: Kami telah mengambil contoh dari siaran ini pada X.
Ernie 4.5 & x1 Baidu: Harga
Kedua -dua Ernie 4.5 & X1 mempunyai semua ciri, dan lebih banyak lagi, berbanding dengan model teratas oleh Openai, Deepseek, Grok, Claude, dan lain -lain. Berikut adalah pecahan harga kedua -dua model:
Model | Harga input (per juta token) | Harga output (per juta token) | Adanya |
Ernie 4.5 | $ 0.55 | $ 2.20 | Terdapat |
Ernie X1 | $ 0.28 | $ 1.10 | Belum ada |
Berbanding dengan model teratas yang lain, Ernie 4.5 & X1 jauh lebih murah, menjadikannya aset yang berharga dalam kemajuan AI generatif.
Ernie 4.5 & x1: Hasil penanda aras standard
Kami telah melihat ciri -ciri, keupayaan, dan harga model Ernie terkini. Sekarang mari kita lihat beberapa nombor prestasi model-model ini terhadap model teratas seperti GPT-4.5, GPT-4O, DeepSeek-R1, dan banyak lagi.
Grafik di bawah membandingkan Ernie 4.5 dan GPT-4O merentasi pelbagai tanda aras yang menguji prestasi AI multimodal.
Grafik menunjukkan bahawa:
- Ernie 4.5 mengatasi GPT-4O dalam kebanyakan tugas multimodal.
- Skor purata untuk Ernie 4.5 ialah 77.77, yang lebih tinggi daripada GPT-4O 73.92.
- Ernie 4.5 mempunyai kelebihan yang ketara dalam Mathvista dan Docvqa, menunjukkan penalaran matematik yang lebih baik dan kemahiran bertulis berasaskan dokumen.
- Kedua -dua model ini sama dalam Ocrbench dan MMMU, tetapi Ernie 4.5 masih mempunyai sedikit kelebihan.
Grafik seterusnya membandingkan Ernie 4.5, DeepSeek V3-CHAT, GPT-4O, dan GPT-4.5 merentasi pelbagai tanda aras untuk penalaran berasaskan teks dan penyelesaian masalah.
Berikut adalah beberapa pengambilan utama dari graf:
- Ernie 4.5 mengetuai pek dengan skor purata 79.6, dengan sempit melepasi Deepseek v3 - sembang pada 79.14.
- Ia berfungsi dengan baik di seluruh pengetahuan umum, penalaran, dan penanda aras pengaturcaraan seperti MMLU-Pro, GSM8K, dan HumanEval.
- GPT-4O dan DeepSeek V3 juga menunjukkan hasil yang kuat, dengan DeepSeek V3 melakukan kompetitif dalam tanda aras Cina seperti CMMLU.
- Ernie 4.5 cemerlang dalam GSM8K (matematik) dan C-Eval (penalaran umum), walaupun DeepSeek V3 sangat dekat dengan prestasi.
Kesan masa depan
Perlumbaan menjadi LLM teratas adalah pemanasan dan Baidu's Ernie 4.5 & x1 memperkenalkan persaingan yang serius untuk Openai, Deepseek, Antropik, dan Meta. Dengan makmal AI Cina yang menyampaikan model yang menyaingi atau melepasi AI Barat dengan sebahagian kecil daripada kos, syarikat akan dipaksa untuk berinovasi lebih cepat dan menurunkan kos mereka untuk kekal berdaya saing.
Semua kemajuan ini akhirnya akan membawa kepada:
- Kemajuan AI yang lebih cepat di semua pusat penyelidikan AI utama.
- AI yang lebih murah untuk perniagaan dan pemaju.
- Satu era baru aplikasi AI multimodal, berkembang melampaui AI berasaskan teks tradisional.
Kesimpulan
Model Ernie 4.5 & X1 Baidu bukan sekadar satu lagi model AI - mereka adalah pengganggu industri. Keupayaan multimodal dan penalaran mereka, harga rendah, dan integrasi mendalam ke dalam ekosistem digital China, menandakan peralihan kuasa dalam pasaran AI global.
Sekiranya trend ini berterusan, kita akan melihat pendemokrasian dan jangkauan AI skala yang lebih besar di pelbagai industri. Ini juga akan mendorong banyak syarikat Barat untuk melepaskan model yang lebih murah. Bukan sahaja ini akan menambah daya saing di pasaran, tetapi juga akan memastikan pengguna mendapat nilai paling banyak untuk wang mereka.
Soalan yang sering ditanya
Q1. Apa itu Ernie 4.5 & x1?A. Ernie 4.5 & X1 adalah model bahasa besar terkini (LLMS) yang dibangunkan oleh Baidu, yang direka untuk menyaingi model AI seperti OpenAI's GPT-4.5 dan DeepSeek-R1. Ernie 4.5 adalah model asas multimodal, sementara Ernie X1 adalah model pemikiran yang mendalam dengan keupayaan maju.
S2. Bagaimana Baidu's Ernie 4.5 berbeza dari Ernie X1?A. Ernie 4.5 dioptimumkan untuk pemahaman multimodal, mampu memproses teks, imej, audio, dan video dengan ketepatan yang tinggi. Ernie X1, sebaliknya, direka untuk pemikiran yang mendalam, cemerlang dalam pemahaman konteks, perancangan, dan penyelesaian masalah dengan refleksi diri.
Q3. Bagaimanakah Ernie 4.5 & x1 membandingkan dengan GPT-4.5 OpenAI?A. Baidu Ernie 4.5 mengatasi GPT-4.5 dalam pelbagai tanda aras, terutamanya dalam penalaran, pemahaman multimodal, dan pencegahan halusinasi, sementara hanya berharga 1% daripada harga GPT-4.5. Ernie X1 menyampaikan prestasi peringkat DeepSeek-R1 pada separuh kos, menjadikannya penyelesaian AI yang sangat kompetitif.
Q4. Apakah butiran harga untuk Ernie 4.5 & x1? A. Ernie 4.5: Kos input $ 0.55 setiap token 1m, kos output $ 2.20 per 1m token.
Ernie X1: Kos input $ 0.28 setiap token 1m, kos output $ 1.10 per 1m token.
Model Ernie X1 belum tersedia melalui API tetapi akan segera.
A. Anda boleh mengakses model ini melalui:
1. Ernie Bot (AI Chatbot) di yiyan.baide.com (hanya tersedia untuk pengguna Cina).
2. Platform Maas Baidu Ai Cloud, Qianfan, untuk akses API (kini hanya Ernie 4.5 yang tersedia).
Atas ialah kandungan terperinci Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Walaupun ia tidak dapat memberikan sambungan manusia dan intuisi ahli terapi terlatih, penyelidikan telah menunjukkan bahawa ramai orang selesa berkongsi kebimbangan dan kebimbangan mereka dengan bot AI yang agak tidak berwajah dan tanpa nama. Sama ada ini selalu baik saya

Kecerdasan Buatan (AI), satu dekad teknologi dalam pembuatan, merevolusikan industri runcit makanan. Dari keuntungan kecekapan berskala besar dan pengurangan kos kepada proses yang diselaraskan di pelbagai fungsi perniagaan, kesan AI adalah undeniabl

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini termasuk mengenal pasti dan menjelaskan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Di samping itu, untuk comp saya

Mengekalkan imej profesional memerlukan kemas kini almari pakaian sekali -sekala. Walaupun membeli-belah dalam talian adalah mudah, ia tidak mempunyai kepastian percubaan secara peribadi. Penyelesaian saya? Peribadi yang berkuasa AI. Saya membayangkan pembantu AI yang mengendalikan pakaian selecti

Google Translate menambah fungsi pembelajaran bahasa Menurut Android Authority, App Expers AssembleDebug telah mendapati bahawa versi terbaru aplikasi Google Translate mengandungi mod ujian "amalan" baru yang direka untuk membantu pengguna meningkatkan kemahiran bahasa mereka melalui aktiviti yang diperibadikan. Ciri ini kini tidak dapat dilihat oleh pengguna, tetapi AssembleDebug dapat mengaktifkannya dan melihat beberapa elemen antara muka pengguna yang baru. Apabila diaktifkan, ciri ini menambah ikon topi tamat pengajian baru di bahagian bawah skrin yang ditandai dengan lencana "beta" yang menunjukkan bahawa ciri "amalan" akan dikeluarkan pada mulanya dalam bentuk eksperimen. Prompt pop timbul yang berkaitan menunjukkan "Amalan aktiviti yang disesuaikan untuk anda!", Yang bermaksud Google akan menjana disesuaikan

Penyelidik MIT sedang membangunkan Nanda, protokol web yang direka untuk agen AI. Pendek untuk ejen rangkaian dan AI yang terdesentralisasi, Nanda membina Protokol Konteks Model Anthropic (MCP) dengan menambahkan keupayaan Internet, membolehkan AI AGEN

Usaha terbaru Meta: Aplikasi AI untuk menyaingi chatgpt Meta, syarikat induk Facebook, Instagram, WhatsApp, dan Threads, melancarkan aplikasi berkuasa AI yang baru. Aplikasi mandiri ini, Meta AI, bertujuan untuk bersaing secara langsung dengan chatgpt Openai. Tuil

Menavigasi serangan AI Cyber yang semakin meningkat Baru-baru ini, Jason Clinton, Ciso untuk Anthropic, menggariskan risiko yang muncul yang terikat kepada identiti bukan manusia-sebagai komunikasi komunikasi ke mesin, melindungi "identiti" ini menjadi


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

DVWA
Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

MantisBT
Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)
