Tumpuan peningkatan tahun ini ialah pengenalan keupayaan model besar pelbagai mod.
Memandangkan gubahan video dan muzik yang dicipta oleh Sora dan Suno mencetus revolusi audiovisual di seluruh dunia, bagaimanakah aplikasi multimodal berskala besar dalam industri akan berkembang? Pada 27 Mac, sebagai penyedia penyelesaian "pengilangan AI+" terkemuka China, Innovation Qizhi telah mendedahkan jawapan mereka yang berpandangan ke hadapan.
Selepas setengah tahun bekerja keras, Innovation Qizhi mengeluarkan versi Model Besar Perindustrian Qizhi Haiming 2.0 (AInno-75B) yang lebih berkuasa pada sidang akhbar yang diadakan di Beijing. Beberapa aplikasi model besar asli juga membuat penampilan sulung mereka, termasuk ChatVision, ChatCAD, dan ChatRobot turut dinaik taraf kepada versi Pro.
keluar Pada masa ini, beberapa konsensus telah dibentuk pada antara muka Penambahbaikan parameter boleh meningkatkan prestasi model. Berbanding dengan AInno-15B, AInno-75B telah mencapai pertumbuhan yang ketara dalam saiz dan prestasi. Tumpuan peningkatan tahun ini ialah pengenalan keupayaan model besar berbilang mod. Zhang Faen menjelaskan bahawa model besar termaju ini boleh mengendalikan pelbagai modaliti maklumat termasuk teks, gambar dan video, malah boleh menyepadukan jenis data yang unik kepada senario industri, seperti lukisan CAD dan isyarat EEG. Outputnya adalah sama pelbagai dan boleh menjana teks, imej, video, lukisan reka bentuk CAD atau gelagat pengendalian badan alat. . Keupayaan penjanaan AI adalah sama menarik.
Reka bentuk perindustrian adalah asas kepada aktiviti pengeluaran Daripada telefon bimbit ke kilang kenderaan tenaga baharu, reka bentuk perindustrian perlu disiapkan sebelum pengeluaran dan pembinaan. Sebagai asas reka bentuk perindustrian, perisian CAD menduduki kedudukan penting dalam rantaian perindustrian. Untuk masa yang lama, pasaran perisian CAD media negara saya telah dikuasai oleh pengeluar asing, dengan antara muka yang kompleks dan halangan yang tinggi untuk digunakan.
Wang Xian, pengurus besar operasi China IPIM International Mechanical Engineering Co., Ltd. mendedahkan bahawa kebanyakan kerja reka bentuk mereka bergantung kepada kerja manual. Bangunan tunggal, sama ada lantai standard atau kompleks, memerlukan pereka bentuk untuk melukisnya satu demi satu. Begitu juga dengan lukisan industri, yang menggunakan banyak tenaga kerja dan sumber bahan. Di samping itu, terdapat banyak spesifikasi industri dan semakan yang kerap, yang meningkatkan lagi kesukaran reka bentuk.
Untuk memecahkan situasi ini, Chuangxinqizhi menerajui dalam memperkenalkan teknologi model besar industri ke dalam bidang reka bentuk perindustrian dan melancarkan aplikasi Text-to-CAD - "ChatCAD": melalui dialog mudah dan format soal jawab , anda boleh memahami dengan cepat Niat kreativiti pereka, menjana lukisan reka bentuk industri secara automatik yang memenuhi keperluan, dan menyokong pengeksportan kepada perisian tradisional untuk penalaan halus.
Masukkan "Bantu saya mereka bentuk takal perindustrian. Parameternya adalah seperti berikut: jejari takal ialah 6, ketebalan ialah 5, tepi takal terkeluar ke luar sebanyak 0.8, ketebalan bahagian yang menonjol ialah 0.5, ketinggian paksi tengah takal ialah 5, dan jejari ialah 4". ChatCAD menjana karya seni serta-merta dan terus memperhalusi reka bentuk berdasarkan maklum balas.
Reka bentuk takal industri demonstrasi langsung
Walaupun anda menghadapi keperluan reka bentuk komponen yang panjang dan kompleks, ChatCAD boleh mengendalikannya. Contohnya, "Bantu saya mereka bentuk turbin. Turbin terdiri daripada motor dan penutup enjin. Keperluan khusus adalah seperti berikut: motor adalah silinder, 20 panjang dan 16 diameter. Turbin terdiri daripada aci turbin silinder dan 5 bilah kipas Aci turbin adalah 20 panjang diameternya ialah 12, bahagian atas turbin harus mempunyai aci berputar berbentuk silinder, panjang penutup aci ialah 9, diameter 12, diameter hud ialah 50. panjang ialah 30, dan jarak antara bilah turbin dan hud ialah 1. ”
ChatCAD masih boleh menjana hasil dan terus bertambah baik berdasarkan maklum balas. Reka bentuk yang dihasilkan oleh ChatCAD juga menyokong format fail arus perdana dan boleh disambungkan dengan lancar kepada perisian industri lain untuk memudahkan penyepaduan dan pengubahsuaian seterusnya.
Demonstrasi langsung reka bentuk turbin Ciri ini membuatkan Encik Wang sangat teruja. Beliau percaya bahawa ChatCAD dijangka membantu industri mengurangkan buruh berulang dan mengelakkan sekatan spesifikasi yang tegar, sekali gus menjejaskan sebut harga manual keseluruhan industri.
Jadi, bagaimanakah ChatCAD dilaksanakan? Zhang Faen menjelaskan bahawa CAD berbeza daripada modaliti biasa seperti teks, gambar dan video Ia perlu mewakili data geometri seperti titik, garisan, tepi, bulatan, lajur dan proses. "Jadi kami juga memanggilnya sebagai modaliti, iaitu modaliti yang tidak ada pada bahagian C. Kami perlu mencipta bahasa perantaraan kami sendiri untuk menyatakan CAD, menjana bahasa perantaraan atau kod perantaraan ini untuk model besar, dan kemudian menterjemah kod perantaraan ini ke dalam CAD "
… Zhang Fa'en terus terang berkata bahawa lukisan ringkas yang dihasilkan oleh ChatCAD boleh digunakan terus untuk pemprosesan, tetapi reka bentuk yang kompleks masih perlu diperbaiki. Matlamat ChatCAD adalah untuk menjadi pembantu kanan untuk jurutera di institut reka bentuk. Ia dijangka memendekkan proses reka bentuk yang pada asalnya mengambil masa sepuluh jam kepada satu jam, dengan model besar bertanggungjawab untuk 90% kerja dan baki 10% dioptimumkan secara manual.
Perlu disebut bahawa Chuangxinqizhi telah berjaya menyepadukan teknologi model besar termaju ke dalam pelbagai perisian industri seperti CAD, MES dan BI, merealisasikan kepintaran keseluruhan proses "R&D reka bentuk-pengeluaran kawalan-pengurusan maklumat" Pengubahsuaian dan peningkatan.
2. ChatVision: alat baharu untuk penyeliaan keselamatan industri Keselamatan dan pematuhan pengeluaran kilang adalah penting, dan pengawasan video serta analisis imej amat diperlukan. Ambil pematerian gelombang di kilang kad papan sebagai contoh Apabila pekerja membersihkan relau timah suhu tinggi 280 darjah, jika mereka tidak memakai peralatan perlindungan keselamatan dengan ketat, seperti topeng karbon diaktifkan kedap udara, sarung tangan pelindung suhu tinggi, dsb. ., terdapat risiko melecur yang serius.
Kaedah pemantauan tradisional tidak cekap, mudah terlepas bahaya tersembunyi, dan mempunyai ketinggalan yang jelas dalam pemeriksaan berikutnya. Berdasarkan model besar industri Alnno-75B, ChatVision boleh menganalisis strim video pengawasan, fail video dan gambar dalam masa nyata melalui bahasa semula jadi, mengenal pasti tingkah laku tidak patuh dengan tepat dan segera mencetuskan sistem penggera (seperti menghantar e-mel secara automatik kepada pentadbir) untuk membantu keselamatan perusahaan industri Pengeluaran. Dalam demonstrasi langsung pada sidang akhbar itu, ChatVision menjawab dengan tepat arahan pemahaman yang komprehensif seperti "Lihat dengan teliti pada skrin semasa dan beritahu saya di mana ini mungkin", serta "Cari soket kuasa dalam skrin", " Cari topi keledar keselamatan putih", dsb. Tugas pengecaman sasaran khusus menunjukkan prospek aplikasinya yang luas.
Semasa demonstrasi langsung, C 演Hasion menemui matlamat khusus seperti soket kuasa dalam gambar "dan" mencari topi keledar putih ".
Arahan ini nampaknya sangat mudah, tidak Dalam kes model besar, algoritma khusus perlu dibangunkan untuk setiap kategori pengecaman kecil (seperti topi keledar keselamatan dan merokok Sukar untuk diubah suai selepas penyahpepijatan dan penggunaan, dan kos pelaksanaannya tinggi dan kitarannya panjang menumbangkan paradigma tradisional. Satu model besar boleh Merangkumi fungsi berbilang model kecil, ia mengatasi semua aspek dari segi prestasi, ketepatan dan keupayaan generalisasi, dan menyokong interaksi bahasa semula jadi, yang sangat memudahkan proses pembangunan dan penggunaan Semasa demonstrasi langsung, skrin berubah: seorang rakan sekerja menanggalkannya Semasa pekerja itu bermain dengan telefon bimbitnya, rakan sekerja lain menanggalkan pakaian keselamatannya dan memberi arahan: "Sila analisa gambar ini dengan teliti dan hantar e-mel kepada pentadbir. jika terdapat sebarang pelanggaran." Arahan ini sangat intensif pengetahuan dan melibatkan lebih daripada sekadar pelanggaran. Untuk menilai, anda juga perlu memutuskan sama ada untuk mencetuskan penghantaran e-mel dan penerima. Ini ialah mod perkhidmatan biasa model besar Hasilnya, ChatVision menggunakan banyak kemahiran pemantauan keselamatan di latar belakang untuk mengenal pasti, bukan sahaja menandakan tiga pelanggaran, tetapi juga mengenal pastinya dengan tangkapan skrin
发 发 .发 发 发 发Demonstrasi Chatvision sepenuhnya mencerminkan keupayaan perancangan dan penaakulan model industri Panggil alat luaran untuk menyelesaikan tugas pemahaman video yang rumit dengan teratur Innovation Qizhi CTO Zhang Faen berkata bahawa syarikat itu telah mengumpulkan lebih daripada 200 algoritma visual. aset model dalam beberapa tahun kebelakangan ini, dan model besar perindustrian telah membuka dunia baharu untuk aplikasi aset ini Model ini bukan sahaja boleh bertindak sebagai orkestra pintar untuk mengoptimumkan pengalaman pengguna, tetapi keupayaan pelbagai modnya juga boleh meningkatkan video. memahami dan memainkan peranan penting dalam bidang keselamatan perusahaan .Kes demonstrasi terakhir menyerlahkan aplikasi canggih model besar dalam bidang berbilang modal. Berdepan dengan video bengkel sebenar, penunjuk perasaan mengemukakan keperluan yang sukar: "Sila analisa video ini dengan teliti, beritahu saya sama ada sesiapa sedang makan dan tandakan masa tindakan ini berlaku." Tugasan ini memerlukan model besar untuk melaksanakan pengecaman tindakan berterusan pada imej jujukan jangka panjang dan menandakan masa mula dan tamat tindakan. Hasilnya, ChatVision mengesan dengan tepat tempat pekerja sedang makan dalam masa 15 saat pertama video.
"Makan adalah acara yang sangat biasa, dan keupayaan model besar untuk memahami acara adalah jauh lebih baik daripada model algoritma kecil tradisional." Untuk masa yang lama, terdapat keperluan mendesak untuk memastikan keselamatan pengeluaran dan kejuruteraan melalui video. Pada masa hadapan, kerja berkaitan model besar dijangka akan mencapai pemahaman video pintar tentang keadaan keselamatan pengeluaran dan pematuhan proses pengeluaran.
Pada pandangan Wang Xian, keselamatan sentiasa menjadi keutamaan dalam projek kejuruteraan. Selama bertahun-tahun, latihan keselamatan kejuruteraan jarang melibatkan pengenalpastian bahaya di tapak. Beliau percaya ChatVision mempunyai prospek aplikasi yang luas, dan ia dijangka akan dilaksanakan dalam pengesanan topi keledar keselamatan di tapak, pemakaian tali keselamatan altitud tinggi, membawa peralatan keselamatan dan senario lain. ChatVision juga mempunyai potensi besar dalam industri penyeliaan Pada masa ini, banyak pemeriksaan keselamatan di tapak masih banyak bergantung kepada tenaga manusia.
3. ChatRobot Pro: "Pengiktirafan Imaginasi Pergerakan"
Aplikasi asli AInno-15B ChatRobot telah melaksanakan kawalan suara robot industri. Hanya beritahu ChatRobot "Bawa saya secawan kopi", dan ia boleh mengarahkan lengan robot industri untuk mencari kopi di rak dan mereka bentuk laluannya sendiri untuk menghantar barangan kepada anda. ChatRobot Pro boleh memproses isyarat EEG pembawa maklumat yang lebih kompleks.
Pada sidang akhbar itu, penunjuk perasaan secara rawak memilih produk (Teh Hijau Seragam) dan meminta seseorang yang mempunyai pelbagai elektrod dipasang pada kulit kepalanya untuk menggunakan imaginasi motor untuk mengawal robot industri untuk meletakkan minuman itu ke dalam tangannya. Lelaki yang memakai pengumpul cuba memikirkan tiga perkara: kiri, kanan dan pilihan Kursor juga bergerak ke kiri dan ke kanan pada skrin berdasarkan isyarat yang diterjemahkan oleh model besar. Apabila kursor bergerak ke ikon sasaran, dia akan merenung ikon tersebut dan klik kursor untuk memilihnya.
Seterusnya, ChatRobot Pro secara bebas akan menyelesaikan penyusunan tugas yang bijak, menjana langkah tugas boleh laku dan berinteraksi dengan antara muka robot industri dalam masa nyata untuk mengarahkan robot menyelesaikan tugasan.
Isyarat EEG adalah isyarat yang dihasilkan semasa aktiviti otak Hubungan antara aktiviti otak dan isyarat EEG adalah sangat kompleks. Walaupun pendekatan tradisional mempunyai ketepatan yang rendah, AInno-75B menunjukkan potensi untuk mentafsir jenis maklumat multimodal ini. Sesetengah teknologi antara muka otak-komputer asing menggunakan elektrod invasif untuk mendapatkan isyarat EEG, yang melibatkan satu siri isu kejuruteraan seperti reka bentuk elektrod, implantasi pembedahan, tindak balas penolakan, penghantaran isyarat dan penyahkodan isyarat. Inovasi Qizhi menggunakan penutup EEG bukan invasif untuk mengumpul maklumat EEG, yang mengurangkan kesukaran kejuruteraan.
Walau bagaimanapun, Zhang Faen juga berkata bahawa kaedah invasif boleh mendapatkan lebih banyak saluran dan isyarat EEG yang lebih jelas, yang akan memudahkan penyahkodan seterusnya bagi niat otak yang lebih kompleks. Metafora yang jelas ialah: kaedah invasif untuk mengumpul isyarat EEG adalah seperti mendengar konsert di dalam stadium, manakala kaedah bukan invasif adalah seperti mendengar konsert di luar stadium Akan terdapat perbezaan besar dalam kejelasan nyanyian . Pada masa ini, kerja penyelidikan dan pembangunan yang dilakukan oleh Inovasi Qizhi adalah untuk mengesahkan keupayaan pelbagai mod model industri besar dan menjalankan pra-penyelidikan teknikal untuk kemungkinan senario automasi industri yang dikawal oleh otak pada masa hadapan.
Ini juga merupakan aplikasi asli hujung ke hujung, Zhang Faen menekankan. Keseluruhan proses daripada input isyarat EEG kepada output mengarahkan hasil akhir (lengan robot yang menghantar barangan kepada penunjuk perasaan) diselesaikan oleh rangkaian saraf, tanpa bergantung pada ciri rekaan tangan atau pemprosesan data tradisional.
Selain interaksi bahasa semula jadi dan pengecaman imaginasi motor, ChatRobot Pro juga menggunakan sepenuhnya keupayaan penaakulan model besar industri untuk mencapai penyusunan tugas urutan panjang dan pembuatan keputusan yang rumit. Memberi badan yang berbeza (sama ada lengan robot industri, AGV, dll.) kawalan pintar yang berkuasa dan keupayaan membuat keputusan juga akan menjadi hala tuju masa depan model besar Perindustrian Qizhi yang inovatif.
4 Terus berkembang dan maju
Dalam era AI generatif, tiada preseden untuk aplikasi industri Qizhi telah meneroka pelbagai kemungkinan dalam senario industri.
Zhang Faen memanggil prospek model besar ke arah perkhidmatan perusahaan "Menjanjikan". Tetapi dia mengakui bahawa dalam tempoh tingkap perubahan teknologi, pemahaman semua orang sering tidak sekata, terutama untuk perubahan yang agak besar, pemahaman rakyat memerlukan masa untuk membuat susulan, dan dia tidak terkecuali.
Selain aplikasi asli baharu, prestasi keseluruhan dan kesan ChatDOC yang dikeluarkan tahun lepas telah dipertingkatkan, dan fungsi produk menjadi lebih lengkap. ChatBI telah menambah sokongan untuk data Excel dan CSV, dan kini ketepatan menjana penyata SQL dan laporan analisis telah meningkat sebanyak 15%. Enjin servis model besar lebih mudah digunakan dan memberikan prestasi inferens yang lebih tinggi.
"Inovasi Qizhi akan menggilap lagi aplikasi ChatX yang dibina secara langsung berdasarkan keupayaan penjanaan teras model besar industri."
Atas ialah kandungan terperinci Tonton video, lukis CAD dan kenali imejan gerakan! Model perindustrian pelbagai mod besar 75B sangat berkebolehan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!