Rumah  >  Artikel  >  Peranti teknologi  >  Model Ejen AI berbilang mod ujian akhir parameter 2 bilion Stanford telah dipertingkatkan dengan hebat, dan boleh digunakan oleh telefon mudah alih, kereta dan robot

Model Ejen AI berbilang mod ujian akhir parameter 2 bilion Stanford telah dipertingkatkan dengan hebat, dan boleh digunakan oleh telefon mudah alih, kereta dan robot

王林
王林ke hadapan
2024-05-07 16:25:291048semak imbas

Model Ejen AI berbilang modal ultra kecil pertama di duniaOctopus V3, daripada pasukan NEXA AI Stanford University, menjadikan Ejen lebih bijak, lebih pantas, penggunaan tenaga dan kos

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

Pada awal April tahun ini, Nexa AI melancarkan Octopus V2 yang sangat dijangkakan kemungkinan baharu untuk aplikasi AI sisi akhir. "Token berfungsi" teknologi terasnya yang dipatenkan mengurangkan dengan ketara panjang teks yang diperlukan untuk penaakulan melalui kaedah panggilan fungsi yang inovatif. Kaedah ini membolehkan model mencapai latihan yang cekap dengan hanya 2 bilion parameter

, dan melepasi GPT-4 dari segi ketepatan dan kependaman, menyesuaikan diri dengan keperluan penggunaan pelbagai peranti akhir. Sejak Octopus V2 dikeluarkan dalam komuniti LLM, ia telah mendapat perhatian meluas dan mendapat pujian daripada sebilangan besar pakar dan penyelidik dalam bidang kecerdasan buatan, seperti Julien Chaumond, CTO Hugging Face, Rowan Cheung, pengasas surat berita AI yang terkenal AI, dan Figure AI Brett Adcock, pengasas OPPO, Manoj Kumar, ketua pasukan kecerdasan buatan kelebihan OPPO, dsb. Mereka dipuji sebagai "mencipta era baharu teknologi AI sisi peranti." Pada platform AI sumber terbuka yang terkenal Hugging Face, Octopus V2 telah dimuat turun lebih daripada 12,000 kali.

Dalam masa kurang sebulan, pasukan AI NEXA mengeluarkan model AI

Agen 斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用 generasi akan datang model Octopus V3, menunjukkan penemuan lebih lanjut: dengan pemprosesan imej dan keupayaan pemprosesan teks berbilang bahasa, untuk telefon pintar dan lain-lain peranti Ia membuka jalan kepada peranti sampingan untuk benar-benar memasuki era AI.

Model Ejen AI berbilang modal pertama dengan kurang daripada 1 bilion parameter斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

Octopus+V3 bukan sahaja mempunyai keupayaan berbilang modal, tetapi juga jauh melebihi model serupa dalam prestasi panggilan fungsi, setanding dengan GPT-4V +GPT4; Bilangan parameter model adalah kurang daripada 1 bilion dan ia mempunyai keupayaan berbilang bahasa. Dalam erti kata lain, berbanding dengan model bahasa berskala besar tradisional, saiznya lebih kecil dan menggunakan lebih sedikit tenaga Ia boleh berjalan dengan lebih mudah pada pelbagai peranti kecil, seperti Raspberry Pi, dan mencapai fungsi berkelajuan tinggi dan tepat pemindahan.

Ini bermakna pada masa hadapan, AI Agent boleh digunakan secara meluas dalam

telefon pintar, AR/VR, robot, kereta pintar

dan peranti sisi hujung yang lain untuk menjadikan pengalaman interaksi pengguna lebih lancar dan lebih pintar. Sebaliknya, kerana V3 mempunyai keupayaan pemprosesan pelbagai mod, ia boleh mengendalikan input teks dan imej pada masa yang sama, ditambah dengan keupayaan berbilang bahasa, ia juga akan menjadikan pengalaman pengguna lebih kaya. Sebagai contoh, dalam apl beli-belah Instacart, pengguna boleh membenarkan Ejen AI mencari produk secara automatik untuk mereka melalui gambar nanas dan arahan perbualan mudah, meningkatkan kecekapan dan pengalaman pengguna.

Untuk contoh lain, dalam senario seperti menghantar e-mel, Octopus V3 boleh mengekstrak maklumat secara automatik dan mengisi kandungan e-mel berdasarkan imej dengan teks, memberikan pengguna perkhidmatan yang lebih bijak dan mudah.

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

Daripada interaksi perisian kepada kereta pintar, AI sisi peranti mempunyai potensi besar

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用Berdasarkan ciri-ciri ini, Octopus V2 dan V3 mempunyai senario aplikasi yang kaya dan pelbagai serta mempunyai prospek aplikasi yang luas.

Selain senario telefon mudah alih yang dinyatakan di atas, apabila Octopus V2 digunakan pada kereta pintar, ia juga boleh membawa pengalaman interaktif baharu. Pembantu suara semasa selalunya sukar untuk membantu pemilik kereta menyelesaikan tugas yang lebih kompleks, seperti menukar destinasi sementara semasa memandu, menambah perhentian tambahan, dsb. Selepas menggunakan Octopus V3, pembantu AI boleh menyelesaikan tugasan yang sepadan dengan cepat dan tepat berdasarkan arahan yang agak kabur dan mudah.

Menggabungkan keupayaan V2 dan V3, daripada mendapatkan maklumat kepada reka bentuk berasaskan arahan, pengguna boleh mendapatkan pengalaman AI yang lancar dalam adegan maya: Dalam demo adegan VR pengguna komuniti, selepas memasukkan arahan suara mudah, AI ​​Agent It boleh membantu pengguna menyiapkan reka bentuk ruang tamu dengan cepat, menggantikan sofa, menukar warna lampu, dsb. dengan satu klikan jari. Selepas pengguna memasukkan arahan perjalanan, pengguna dengan cepat tiba di Jepun, dan Ejen AI juga boleh membantu pengguna mencari tarikan yang sepadan dan memberikan maklumat yang kaya dalam komunikasi perbualan yang mudah.

Data menunjukkan bahawa pasaran model bahasa berskala besar global berkembang pesat. Granview Research melaporkan bahawa saiz pasaran model bahasa besar global dianggarkan berjumlah AS$4.35 bilion dan dijangka berkembang pada kadar pertumbuhan tahunan kompaun sebanyak 35.9% dari 2024 hingga 2030. Begitu juga, pasaran kecerdasan buatan tepi juga menunjukkan momentum yang berkembang pesat - pasaran kecerdasan buatan kelebihan global dijangka berkembang pada kadar pertumbuhan tahunan kompaun sebanyak 21.0% dari 2023 hingga 2030, dan akan mencecah AS$66.478 bilion menjelang 2030.

Pasukan NEXA AI diasaskan oleh penyelidik cemerlang dari Universiti Stanford.

Pengasas dan Ketua Saintis Alex Chen (Chen Wei) sedang belajar untuk PhD dari Universiti Stanford Beliau mempunyai pengalaman luas dalam penyelidikan kecerdasan buatan dan pernah berkhidmat sebagai pengerusi Pertubuhan Usahawan Cina Stanford.

Pengasas bersama dan Ketua Pegawai Teknologi Zack Li (李志元) juga merupakan graduan Universiti Stanford dan mempunyai pengalaman R&D barisan hadapan selama 4 tahun dalam AI bahagian akhir di Google dan Amazon Lab126 seorang usahawan Cina di Stanford Presiden persatuan itu.

Profesor Madya di Universiti Stanford dan Timbalan Pengarah Program Keusahawanan Teknologi StanfordCharles (Chuck) Eesley berkhidmat sebagai perunding, memberikan bimbingan dan sokongan kepada pasukan.

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用Kiri: Li Zhiyuan; Kanan: Chen Wei

Pada masa ini, teknologi asal NEXA AI telah memohon perlindungan paten.

Pasukan pengasas NEXA AI menyatakan bahawa mereka akan terus komited untuk mempromosikan pembangunan teknologi AI sisi akhir, meningkatkan pengaruh teknologi inovatifnya melalui model sumber terbuka, dan mewujudkan kehidupan masa depan yang lebih bijak dan cekap untuk pengguna .

Alamat kertas: https://arxiv.org/abs/2404.11459

Atas ialah kandungan terperinci Model Ejen AI berbilang mod ujian akhir parameter 2 bilion Stanford telah dipertingkatkan dengan hebat, dan boleh digunakan oleh telefon mudah alih, kereta dan robot. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam