Rumah > Artikel > Peranti teknologi > Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi
Selasa ini, Google mengeluarkan satu siri kemas kini model dan produk berkaitan AI di Google Cloud Next 2024, termasuk Gemini 1.5 Pro yang menyediakan fungsi pemahaman pertuturan (pertuturan) tempatan buat kali pertama, model penjanaan kod baharu CodeGemma, yang pertama Pemproses Lengan yang dibangunkan sendiri Axion dan sebagainya.
Gemini 1.5 Pro, model AI generatif Google yang paling berkuasa, kini tersedia dalam pratonton awam pada Vertex AI, platform pembangunan AI tertumpu perusahaan Google. Ini ialah platform pembangunan AI Google untuk perusahaan. Konteks yang ia boleh mengendalikan peningkatan daripada 128,000 token kepada 1 juta token. Satu juta token adalah bersamaan dengan kira-kira 700,000 perkataan, atau kira-kira 30,000 baris kod. Itu kira-kira empat kali ganda jumlah data model utama Anthropic yang boleh dikendalikan oleh Claude 3 sebagai input, dan kira-kira lapan kali ganda jumlah konteks maksimum OpenAI GPT-4 Turbo.
Pautan teks asal rasmi: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
Ini versi Buat pertama kalinya, keupayaan pemahaman audio (pertuturan) tempatan dan API fail baharu disediakan untuk memudahkan pemprosesan fail. Mod input Gemini 1.5 Pro sedang dikembangkan untuk memasukkan pemahaman audio (pertuturan) dalam API Gemini dan Google AI Studio. Selain itu, Gemini 1.5 Pro kini boleh melakukan inferens pada imej (bingkai) dan audio (pertuturan) video yang dimuat naik dalam Google AI Studio.
Anda boleh memuat naik rakaman kuliah, seperti kuliah ini dengan lebih 117,000 token oleh Jeff Dean, dan Gemini 1.5 Pro boleh menukarnya menjadi ujian dengan jawapan. (Demo telah dipercepatkan)
Google juga telah membuat penambahbaikan dalam API Gemini, terutamanya termasuk tiga kandungan berikut:
Pada masa ini, arahan sistem boleh digunakan dalam Google AI Studio dan Gemini API untuk membimbing tindak balas model . Tentukan peranan, format, matlamat dan peraturan untuk membimbing tingkah laku model untuk kes penggunaan khusus anda.
Tetapkan perintah sistem dengan mudah dalam Google AI Studio
2: Arahkan model untuk mengeluarkan objek JSON sahaja. Corak ini memungkinkan untuk mengekstrak data berstruktur daripada teks atau imej. cURL kini tersedia, dengan sokongan Python SDK akan datang tidak lama lagi.
3. Penambahbaikan untuk fungsi panggilan: Kini anda boleh memilih mod untuk mengehadkan output model dan meningkatkan kebolehpercayaan. Pilih teks, panggilan fungsi atau hanya fungsi itu sendiri.
Selain itu, Google akan mengeluarkan model pembenaman teks generasi seterusnya yang mengatasi model yang serupa. Mulai hari ini, pembangun akan dapat mengakses model pembenaman teks generasi akan datang melalui API Gemini. Model baharu ini, text-embedding-004 (text-embedding-preview-0409 dalam Vertex AI), mencapai prestasi perolehan semula yang lebih kukuh pada penanda aras MTEB dan mengatasi model sedia ada dengan dimensi yang setanding.
Dalam penanda aras MTEB, Text-embedding-004 (aka Gecko) menggunakan output 256 malap mengatasi semua model output 768 malap yang lebih besar
Walau bagaimanapun, Pro5 tidak sepatutnya tersedia untuk Gemini 1. mereka yang tidak mempunyai akses kepada Vertex AI dan AI Studio. Pada masa ini, kebanyakan orang terlibat dengan model bahasa Gemini melalui chatbot Gemini. Gemini Ultra memperkasakan chatbot Gemini Advanced, dan walaupun ia berkuasa dan boleh memahami arahan yang panjang, ia tidak sepantas Gemini 1.5 Pro.
Pada persidangan Google Cloud Next pada tahun 2024, syarikat itu melancarkan berbilang alatan sumber terbuka, terutamanya digunakan untuk menyokong projek dan infrastruktur AI generatif. Satu ialah Max Diffusion, yang merupakan koleksi pelaksanaan rujukan pelbagai model resapan yang dijalankan pada peranti XLA (Accelerated Linear Algebra).
Alamat GitHub: https://github.com/google/maxdiffusion
Yang kedua ialah Jetstream, enjin baharu untuk menjalankan model AI generatif. Pada masa ini, JetStream hanya menyokong TPU, tetapi mungkin serasi dengan GPU pada masa hadapan. Google mendakwa bahawa JetStream boleh menyampaikan sehingga 3x ganda harga/prestasi model seperti Gemma 7B milik Google dan Llama 2 Meta.
Alamat GitHub: https://github.com/google/JetStream
Yang ketiga ialah MaxTest, yang merupakan penjanaan teks dan model koleksi AI Nvidia untuk GPU TPU . MaxText kini termasuk Gemma 7B, OpenAI's GPT-3, Llama 2, dan model daripada pemula AI Mistral, yang semuanya dikatakan Google boleh disesuaikan dan disesuaikan dengan keperluan pembangun. . pemproses Lengan pemproses Lengan dibangunkan, dipanggil Axion. Ia berdasarkan Arm's Neoverse 2 dan direka untuk pusat data. Google mengatakan kejadian Axionnya berprestasi 30% lebih baik daripada contoh berasaskan Arm lain daripada pesaing seperti AWS dan Microsoft, dan prestasi sehingga 50% lebih baik dan 60% lebih cekap tenaga berbanding tika berasaskan X86 yang sepadan.
Google menekankan semasa acara pelancaran Selasa bahawa kerana Axion dibina di atas asas terbuka, pelanggan Google Cloud akan dapat membawa beban kerja Arm sedia ada mereka ke Google Cloud tanpa sebarang pengubahsuaian.
Walau bagaimanapun, Google masih belum mengeluarkan sebarang pengenalan terperinci mengenai perkara ini.
CodeGemma mempunyai kelebihan berikut:
Penyiapan dan penjanaan kod pintar: baris lengkap, fungsi, malah menjana keseluruhan blok kod, sama ada anda bekerja secara tempatan atau dalam awan
Aliran kerja yang dipermudah: Integrasikan CodeGemma ke dalam persekitaran pembangunan anda untuk menulis kod boilerplate yang kurang dan berfungsi dengan lebih pantas Tulis kod yang penting, menarik dan membezakan. . Beberapa hasil perbandingan antara
CodeGemma dan model besar kod arus perdana yang lain ditunjukkan dalam rajah di bawah:
Alamat kertas: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf
Google DeepMind turut mengeluarkan satu siri model bahasa berat terbuka - RecurrentGemma. RecurrentGemma adalah berdasarkan seni bina Griffin, yang membolehkan inferens pantas apabila menjana jujukan panjang dengan menggantikan perhatian global dengan campuran perhatian tempatan dan ulangan linear.
Laporan teknikal: https://storage.googleapis.com/deepmind-media/gemma/recurrentgemma-report.pdf
RecurrentGemma-2B mencapai prestasi unggul pada tugas hiliran dengan Gemma -2B (seni bina pengubah) adalah setanding.
Pada masa yang sama, RecurrentGemma-2B mencapai daya pemprosesan yang lebih tinggi semasa inferens, terutamanya pada jujukan yang panjang.
Google Vids ialah alat penciptaan video AI dan ciri baharu yang ditambahkan dalam Google Workspace.
Google mengatakan bahawa dengan Google Vids, pengguna boleh membuat video bersama alatan Workspace lain seperti Dokumen dan Helaian serta bekerjasama dengan rakan sekerja dalam masa nyata.
Gemini Code Assist ialah alat pelengkap dan bantuan kod AI untuk perusahaan, yang ditanda aras dengan GitHub Copilot Enterprise. Code Assist akan tersedia sebagai pemalam untuk editor popular seperti VS Code dan JetBrains.
Sumber imej: https://techcrunch.com/2024/04/09/google-launches-code-assist-its-latest-challenger-to-githubs-copilot/
Code Assist Dikuasakan oleh Gemini 1.5 Pro. Gemini 1.5 Pro mempunyai tetingkap konteks jutaan token, yang membolehkan alatan Google memperkenalkan lebih banyak konteks berbanding pesaing. Google mengatakan ini bermakna Code Assist boleh memberikan cadangan kod yang lebih tepat dan keupayaan untuk membuat alasan dan menukar sebahagian besar kod.
Google berkata: "Bantuan Kod membolehkan pelanggan membuat perubahan besar-besaran pada keseluruhan pangkalan kod mereka, membolehkan transformasi kod dibantu AI yang sebelum ini mustahil
." perisikan adalah hala tuju pembangunan industri yang hangat tahun ini. Google kini telah mengumumkan alat baharu untuk membantu perusahaan membina ejen AI – Vertex AI Agent Builder.
Thomas Kurian, Ketua Pegawai Eksekutif Google Cloud, berkata: “Pembina Ejen Vertex AI menjadikannya amat mudah dan pantas untuk membina dan menggunakan ejen perbualan generatif yang didorong oleh AI yang sedia pengeluaran yang boleh membimbing manusia dalam Panduan ejen dalam cara untuk meningkatkan kualiti dan ketepatan model hasil yang dihasilkan."
Atas ialah kandungan terperinci Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!