Rumah  >  Artikel  >  Tutorial Perkakasan  >  Lanzhou berkeras untuk melakukan segala usaha: Untuk melaksanakan adegan ToB, model besar dengan parameter 10B sudah memadai

Lanzhou berkeras untuk melakukan segala usaha: Untuk melaksanakan adegan ToB, model besar dengan parameter 10B sudah memadai

王林
王林ke hadapan
2024-03-21 12:21:40836semak imbas

Fokus, kesempurnaan, reputasi, kelajuan dan kos.

Zhou Ming ialah pengasas dan Ketua Pegawai Eksekutif Lanzhou Technology Beliau mencadangkan "Peraturan Sembilan Aksara untuk Melaksanakan Model Besar", yang berdasarkan "Peraturan Tujuh Aksara" Lei Jun untuk Internet dan menambah perkataan "kos".

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Dia memanggil tahun 2024 sebagai tahun pertama model besar, tetapi pada masa yang sama tegas menyatakan bahawa ini tidak bermakna terdapat emas di mana-mana.

Bagi pelaksanaan khusus model besar, Zhou Ming menunjukkan contoh dengan pasukan keusahawanan model besar Lanzhou Technology yang dipimpinnya - menggunakan sistem "satu mendatar dan N menegak" Lanzhou, berdasarkan model besar Mencius, berorientasikan senario , keluaran produk.

Ringkasnya, ia adalah teknologi dan aplikasi pacuan dua roda Sambil menyelidik dan menguasai teknologi canggih secara aktif, kami komited untuk memastikan penggunaan teknologi ini dengan berkesan.

Pada persidangan pelancaran produk dan teknologi model berskala besar Lanzhou pada 18 Mac, Lanzhou Technology turut menandatangani kontrak kerjasama strategik dengan Zero-One Wanshi.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Di tempat kejadian, Kai-fu Lee, Pengerusi Sinovation Ventures dan Ketua Pegawai Eksekutif Zero-One Everything, berkongsi bahawa kecerdasan model berskala besar terbaik di dunia telah mencapai 3 kali ganda tahap kecerdasan manusia purata perkataan, 100 soalan hanya boleh dijawab oleh orang biasa Terdapat 33 jawapan yang betul, dan model AI besar terbaik boleh menjawab lebih daripada 99 soalan dengan betul.

Beliau menantikan empat trend utama pada masa hadapan era AI 2.0:

Aplikasi AI 2.0 yang paling revolusioner mestilah AI-First / AI-Native: aplikasi yang akhirnya menonjol adalah milik perintis yang berani melabur sepenuhnya dalam teknologi baharu. Pengenalan model bahasa besar telah membawa dorongan besar kepada aplikasi AI-First.

Model besar bermula dengan teks dan akan dikembangkan kepada "semua mod" pada masa hadapan: teknologi penjanaan rentas modal ialah titik perubahan dalam merealisasikan kecerdasan kognitif dan membuat keputusan. Maklumat dunia sebenar ialah sistem teks, audio, penglihatan, penderia dan pelbagai sensasi sentuhan manusia yang komprehensif Untuk mensimulasikan dunia sebenar dengan lebih tepat, adalah perlu untuk membuka pelbagai keupayaan modal, seperti imej-teks, teks-. video dan sistem rentas modal lain atau keupayaan komprehensif modal penuh.

AI 2.0 akan melangkaui perbualan, daripada alat sembang kepada alatan produktiviti pintar: pengalaman pengguna, serta antara muka interaktif masa depan dan model perniagaan akan mengalami perubahan besar.

AI 2.0 akan menjadi fizikal dan sangat meningkatkan produktiviti sosial: kecerdasan yang terkandung boleh membolehkan robot mengeluarkan robot, seterusnya merealisasikan perancangan pintar AI 2.0+ bagi barisan pengeluaran.

Fokus pada penyelidikan dan pembangunan model besar parameter 10B-100B

Lanzhou Technology telah ditubuhkan pada Jun 2021. Ia adalah salah satu pasukan pertama di China yang memulakan perniagaan model besar.

Pada Mac tahun lalu, Lanzhou mengeluarkan Mencius GPT V1 (MChat); pada Januari tahun ini, model besar Mencius GPT V2 (termasuk model besar Mencius - standard, model besar Mencius - ringan, model besar Mencius - kewangan, model besar Mencius - Pengekodan) terbuka kepada orang ramai.

Baru-baru ini, pasukan Lanzhou telah menamatkan latihan model besar Mengzi3-13B.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Seperkara lagi, terdapat penyumbang besar di sebalik latihan model besar Mengzi, iaitu set data Mengzi-3 dengan jumlah skala token 3T, yang merangkumi sumber data berkualiti tinggi seperti halaman web, kod, buku, kertas, dll.

Menurut laporan, pada akhir bulan ini (30 Mac), model Mengzi3-13B akan menjadi sumber terbuka dalam komuniti GitHub, HuggingFace, Moda dan Shizhi AI.

Mengapa sumber terbuka model Mencius versi 13B? Zhou Ming menjawab soalan ini terus.

Pertama sekali, Lanzhou jelas menumpukan pada penyediaan senario ToB, ditambah dengan ToC.

Amalan mendapati bahawa parameter model besar yang paling kerap digunakan dalam senario ToB kebanyakannya 7B, 13B, 40B dan 100B, dan parameter keseluruhan tertumpu di antara 10B-100B.

Kedua, dalam julat ini, dari perspektif ROI, ia bukan sahaja memenuhi keperluan tempat kejadian, tetapi juga paling kos efektif.

Jadi untuk masa yang lama, matlamat Lanzhou adalah untuk membina model industri yang besar dalam skala parameter 10B-100B. Ini menjadikannya mustahil untuk memahami mengapa 13B dipilih untuk versi sumber terbuka.

Zhou Ming menjelaskan bahawa dia sendiri sebenarnya seorang yang percaya kepada undang-undang Scaling, tetapi keusahawanan berbeza dengan penyelidikan saintifik.

" Pertama, model besar bersaiz ini sudah boleh menyelesaikan 80% masalah; kedua, ia agak stabil untuk pasukan dan tidak akan berasa gelisah kerana persaingan skala model yang semakin berkembang, tambah Zhou Ming dengan cara ini Pemikiran yang tenang dapat memastikan kawalan kos yang baik dan mengelakkan persaingan yang tidak perlu untuk kuasa pengkomputeran GPU, data dan tenaga kerja.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Sistem "Satu mendatar N menegak"

Pada sidang akhbar itu, Lanzhou mengumumkan satu sistem menegak N mendatarnya sendiri.

"Yiheng" ialah lapisan model, iaitu setiap model yang dibangunkan berdasarkan teknologi model besar Mencius;

"N vertikal" ialah teknologi dan produk terpenting untuk aplikasi ToB berdasarkan model besar Mencius.

Difahamkan bahawa Lanzhou kini menumpukan pada industri kewangan, pengaturcaraan tambahan dan bidang lain, bertujuan untuk mencipta model menegak besar yang lebih dekat dengan senario industri melalui data medan yang lebih komprehensif, profesional dan berkualiti tinggi.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Berdasarkan "One Horizon" model besar universal Mencius GPT, Li Jingmei, rakan kongsi dan ketua pegawai produk Teknologi Lanzhou, memperkenalkan produk berkebolehan aplikasi Lanzhou, termasuk:

Pemahaman dokumen AI: meliputi profesional Keupayaan penghuraian dokumen PDF dan keupayaan pengekstrakan maklumat menyediakan keupayaan asas yang lebih baik untuk pemahaman dokumen dalam penyelesaian RAG

Soal Jawab dokumen AI: Menyediakan keupayaan penyelesaian untuk pembinaan pangkalan pengetahuan pintar perusahaan yang diswastakan berdasarkan keperluan perusahaan

penulisan bantuan dokumen AI; pengguna untuk memuat naik berbilang dokumen sebagai bahan rujukan, menyokong soalan berbilang peringkat tersuai dan garis besar penulisan, dan diperkasakan oleh model besar untuk menjana draf artikel pertama yang lengkap secara automatik seperti yang diperlukan

Platform terjemahan mesin: tertumpu pada Terjemahan Bahasa Cina antara jurusan utama dunia bahasa dan terjemahan profesional dalam lebih daripada 20 bidang;

Lanzhou Intelligence: produk yang memfokuskan pada analisis pintar dan soal jawab kandungan mesyuarat, ia adalah pembantu mesyuarat pintar asli model besar yang dibina berdasarkan model besar

Lanzhou AI Carian: Enjin carian dalam era model bahasa besar.

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

Pada tahun lalu, bidang model besar telah berubah setiap hari.

Kami akan melakukan apa sahaja yang OpenAI lakukan. Ia tidak mengapa dalam jangka pendek, tetapi tidak dalam jangka panjang. Kami mesti mempunyai idea inovatif kami sendiri.

Zhou Ming menyatakan pandangannya tentang cara memanfaatkan kekuatan dan mengelakkan kelemahan serta mencari laluan inovasi tersendiri.

Langkah pertama yang paling kritikal ialah syarikat mempunyai kedudukan yang jelas. Kedudukan Teknologi Lanzhou jauh berbeza daripada syarikat permulaan model besar lain di China.

Sebagai contoh, Lanzhou diletakkan sebagai syarikat komprehensif yang menyediakan "teknologi model besar + aplikasi senario perusahaan". berharap Teknologi dan aplikasi membentuk hubungan ekologi, membolehkan kedua-dua pihak bergerak dengan cepat "

Pada masa yang sama, ia masih perlu untuk memberi tumpuan dan melaksanakan pelaksanaan - untuk mencipta nilai dan memacu inovasi melalui pelaksanaan.

Dan harus diingat bahawa inovasi dan pelaksanaan saling melengkapi.

Jangan membuat inovasi secara membabi buta atau melaksanakan secara membabi buta, tetapi sambungkan kedua-duanya untuk menjadikannya berulang dengan cepat.

Akhirnya Zhou Ming juga mengingatkan dengan seikhlas hati:

Ini tahun pertama pelancaran model besar, jadi ada emas di mana-mana, bukan? Tidak, saya secara bertanggungjawab boleh mengatakan bahawa kami belum meneroka banyak tempat.

Sebagai contoh, bagaimana untuk menyelesaikan batu terakhir mendarat model besar? Apakah model perniagaan model besar? Bagaimana untuk mengukuhkan keupayaan penghantaran? Bagaimana untuk meningkatkan pengkomersilan produk?

Pelancaran model besar sebenarnya baru sahaja bermula.

— Hubungi pengarang —

Atas ialah kandungan terperinci Lanzhou berkeras untuk melakukan segala usaha: Untuk melaksanakan adegan ToB, model besar dengan parameter 10B sudah memadai. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:myzaker.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam