Rumah  >  Artikel  >  Peranti teknologi  >  Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

王林
王林ke hadapan
2024-04-10 14:34:091188semak imbas

Selasa ini, Google mengeluarkan satu siri kemas kini model dan produk berkaitan AI di Google Cloud Next 2024, termasuk Gemini 1.5 Pro yang menyediakan fungsi pemahaman pertuturan (pertuturan) tempatan buat kali pertama, model penjanaan kod baharu CodeGemma, yang pertama Pemproses Lengan yang dibangunkan sendiri Axion dan sebagainya.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Gemini 1.5 Pro

Gemini 1.5 Pro, model AI generatif Google yang paling berkuasa, kini tersedia dalam pratonton awam pada Vertex AI, platform pembangunan AI tertumpu perusahaan Google. Ini ialah platform pembangunan AI Google untuk perusahaan. Konteks yang ia boleh mengendalikan peningkatan daripada 128,000 token kepada 1 juta token. Satu juta token adalah bersamaan dengan kira-kira 700,000 perkataan, atau kira-kira 30,000 baris kod. Itu kira-kira empat kali ganda jumlah data model utama Anthropic yang boleh dikendalikan oleh Claude 3 sebagai input, dan kira-kira lapan kali ganda jumlah konteks maksimum OpenAI GPT-4 Turbo.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Pautan teks asal rasmi: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

Ini versi Buat pertama kalinya, keupayaan pemahaman audio (pertuturan) tempatan dan API fail baharu disediakan untuk memudahkan pemprosesan fail. Mod input Gemini 1.5 Pro sedang dikembangkan untuk memasukkan pemahaman audio (pertuturan) dalam API Gemini dan Google AI Studio. Selain itu, Gemini 1.5 Pro kini boleh melakukan inferens pada imej (bingkai) dan audio (pertuturan) video yang dimuat naik dalam Google AI Studio.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Anda boleh memuat naik rakaman kuliah, seperti kuliah ini dengan lebih 117,000 token oleh Jeff Dean, dan Gemini 1.5 Pro boleh menukarnya menjadi ujian dengan jawapan. (Demo telah dipercepatkan)

Google juga telah membuat penambahbaikan dalam API Gemini, terutamanya termasuk tiga kandungan berikut:

Pada masa ini, arahan sistem boleh digunakan dalam Google AI Studio dan Gemini API untuk membimbing tindak balas model . Tentukan peranan, format, matlamat dan peraturan untuk membimbing tingkah laku model untuk kes penggunaan khusus anda.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Tetapkan perintah sistem dengan mudah dalam Google AI Studio

2: Arahkan model untuk mengeluarkan objek JSON sahaja. Corak ini memungkinkan untuk mengekstrak data berstruktur daripada teks atau imej. cURL kini tersedia, dengan sokongan Python SDK akan datang tidak lama lagi.

3. Penambahbaikan untuk fungsi panggilan: Kini anda boleh memilih mod untuk mengehadkan output model dan meningkatkan kebolehpercayaan. Pilih teks, panggilan fungsi atau hanya fungsi itu sendiri.

Selain itu, Google akan mengeluarkan model pembenaman teks generasi seterusnya yang mengatasi model yang serupa. Mulai hari ini, pembangun akan dapat mengakses model pembenaman teks generasi akan datang melalui API Gemini. Model baharu ini, text-embedding-004 (text-embedding-preview-0409 dalam Vertex AI), mencapai prestasi perolehan semula yang lebih kukuh pada penanda aras MTEB dan mengatasi model sedia ada dengan dimensi yang setanding.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Dalam penanda aras MTEB, Text-embedding-004 (aka Gecko) menggunakan output 256 malap mengatasi semua model output 768 malap yang lebih besar

Walau bagaimanapun, Pro5 tidak sepatutnya tersedia untuk Gemini 1. mereka yang tidak mempunyai akses kepada Vertex AI dan AI Studio. Pada masa ini, kebanyakan orang terlibat dengan model bahasa Gemini melalui chatbot Gemini. Gemini Ultra memperkasakan chatbot Gemini Advanced, dan walaupun ia berkuasa dan boleh memahami arahan yang panjang, ia tidak sepantas Gemini 1.5 Pro.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Tiga alatan sumber terbuka utama

Pada persidangan Google Cloud Next pada tahun 2024, syarikat itu melancarkan berbilang alatan sumber terbuka, terutamanya digunakan untuk menyokong projek dan infrastruktur AI generatif. Satu ialah Max Diffusion, yang merupakan koleksi pelaksanaan rujukan pelbagai model resapan yang dijalankan pada peranti XLA (Accelerated Linear Algebra).

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Alamat GitHub: https://github.com/google/maxdiffusion

Yang kedua ialah Jetstream, enjin baharu untuk menjalankan model AI generatif. Pada masa ini, JetStream hanya menyokong TPU, tetapi mungkin serasi dengan GPU pada masa hadapan. Google mendakwa bahawa JetStream boleh menyampaikan sehingga 3x ganda harga/prestasi model seperti Gemma 7B milik Google dan Llama 2 Meta.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi


Alamat GitHub: https://github.com/google/JetStream

Yang ketiga ialah MaxTest, yang merupakan penjanaan teks dan model koleksi AI Nvidia untuk GPU TPU . MaxText kini termasuk Gemma 7B, OpenAI's GPT-3, Llama 2, dan model daripada pemula AI Mistral, yang semuanya dikatakan Google boleh disesuaikan dan disesuaikan dengan keperluan pembangun. . pemproses Lengan pemproses Lengan dibangunkan, dipanggil Axion. Ia berdasarkan Arm's Neoverse 2 dan direka untuk pusat data. Google mengatakan kejadian Axionnya berprestasi 30% lebih baik daripada contoh berasaskan Arm lain daripada pesaing seperti AWS dan Microsoft, dan prestasi sehingga 50% lebih baik dan 60% lebih cekap tenaga berbanding tika berasaskan X86 yang sepadan.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadiGoogle menekankan semasa acara pelancaran Selasa bahawa kerana Axion dibina di atas asas terbuka, pelanggan Google Cloud akan dapat membawa beban kerja Arm sedia ada mereka ke Google Cloud tanpa sebarang pengubahsuaian.

Walau bagaimanapun, Google masih belum mengeluarkan sebarang pengenalan terperinci mengenai perkara ini.

Alat penyiapan dan penjanaan kod - CodeGemma

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

CodeGemma adalah berdasarkan model Gemma dan membawa fungsi pengekodan yang berkuasa dan ringan kepada komuniti. Model ini boleh dibahagikan kepada varian 7B pra-latihan yang secara khusus mengendalikan penyiapan kod dan tugas penjanaan kod, varian arahan 7B untuk sembang kod dan ikutan arahan, dan varian pra-latihan 2B yang menjalankan penyiapan kod pantas pada tempatan. komputer.

CodeGemma mempunyai kelebihan berikut:

Penyiapan dan penjanaan kod pintar: baris lengkap, fungsi, malah menjana keseluruhan blok kod, sama ada anda bekerja secara tempatan atau dalam awan

; Ketepatan lebih tinggi: CodeGemma terutamanya menggunakan data bahasa Inggeris sebanyak 500 bilion token daripada dokumen dalam talian, matematik dan kod untuk latihan Kod yang dijana bukan sahaja lebih tepat dari segi tatabahasa, tetapi juga lebih bermakna dari segi semantik, membantu mengurangkan ralat dan masa penyahpepijatan

Keupayaan berbilang bahasa: Menyokong Python, JavaScript, Java dan bahasa pengaturcaraan popular yang lain

Aliran kerja yang dipermudah: Integrasikan CodeGemma ke dalam persekitaran pembangunan anda untuk menulis kod boilerplate yang kurang dan berfungsi dengan lebih pantas Tulis kod yang penting, menarik dan membezakan. . Beberapa hasil perbandingan antara

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

CodeGemma dan model besar kod arus perdana yang lain ditunjukkan dalam rajah di bawah:

  • Hasil perbandingan antara model CodeGemma 7B dan model Gemma 7B, model MATH GSM8K dan set data yang lain
  • Untuk butiran lanjut teknikal dan keputusan percubaan, sila rujuk kertas kerja yang dikeluarkan serentak oleh Google.

Alamat kertas: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf

Model bahasa terbuka - RecurrentGemma

Google DeepMind turut mengeluarkan satu siri model bahasa berat terbuka - RecurrentGemma. RecurrentGemma adalah berdasarkan seni bina Griffin, yang membolehkan inferens pantas apabila menjana jujukan panjang dengan menggantikan perhatian global dengan campuran perhatian tempatan dan ulangan linear.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Laporan teknikal: https://storage.googleapis.com/deepmind-media/gemma/recurrentgemma-report.pdf

RecurrentGemma-2B mencapai prestasi unggul pada tugas hiliran dengan Gemma -2B (seni bina pengubah) adalah setanding.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Pada masa yang sama, RecurrentGemma-2B mencapai daya pemprosesan yang lebih tinggi semasa inferens, terutamanya pada jujukan yang panjang.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Alat penyuntingan video - Google Vids

Google Vids ialah alat penciptaan video AI dan ciri baharu yang ditambahkan dalam Google Workspace.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Google mengatakan bahawa dengan Google Vids, pengguna boleh membuat video bersama alatan Workspace lain seperti Dokumen dan Helaian serta bekerjasama dengan rakan sekerja dalam masa nyata.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Pembantu kod khusus perusahaan - Gemini Code Assist

Gemini Code Assist ialah alat pelengkap dan bantuan kod AI untuk perusahaan, yang ditanda aras dengan GitHub Copilot Enterprise. Code Assist akan tersedia sebagai pemalam untuk editor popular seperti VS Code dan JetBrains.

Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi

Sumber imej: https://techcrunch.com/2024/04/09/google-launches-code-assist-its-latest-challenger-to-githubs-copilot/

Code Assist Dikuasakan oleh Gemini 1.5 Pro. Gemini 1.5 Pro mempunyai tetingkap konteks jutaan token, yang membolehkan alatan Google memperkenalkan lebih banyak konteks berbanding pesaing. Google mengatakan ini bermakna Code Assist boleh memberikan cadangan kod yang lebih tepat dan keupayaan untuk membuat alasan dan menukar sebahagian besar kod.

Google berkata: "Bantuan Kod membolehkan pelanggan membuat perubahan besar-besaran pada keseluruhan pangkalan kod mereka, membolehkan transformasi kod dibantu AI yang sebelum ini mustahil

Pembina Ejen - Vertex AI

." perisikan adalah hala tuju pembangunan industri yang hangat tahun ini. Google kini telah mengumumkan alat baharu untuk membantu perusahaan membina ejen AI – Vertex AI Agent Builder.

Thomas Kurian, Ketua Pegawai Eksekutif Google Cloud, berkata: “Pembina Ejen Vertex AI menjadikannya amat mudah dan pantas untuk membina dan menggunakan ejen perbualan generatif yang didorong oleh AI yang sedia pengeluaran yang boleh membimbing manusia dalam Panduan ejen dalam cara untuk meningkatkan kualiti dan ketepatan model hasil yang dihasilkan."

🎜

Atas ialah kandungan terperinci Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam