


Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai
Ledakan kecerdasan buatan telah memesongkan deria masa kita.
Bolehkah anda percaya bahawa Stable Diffusion baru berusia 4 bulan dan ChatGPT telah wujud kurang dari sebulan?
Untuk menggunakan metafora yang jelas, jika anda berkelip mata, anda akan terlepas industri baharu.
Dalam bidang AI pada tahun 2022, model generatif berskala besar bermunculan seperti cendawan selepas hujan, mengubah landskap keseluruhan industri AI.
Lebih-lebih lagi, model-model ini dengan pantas bergerak keluar dari makmal dan digunakan dalam realiti.
Sebagai contoh, teknologi LLM telah mengilhamkan dua bidang baru muncul - ejen membuat keputusan (permainan, robot, dll.) dan AI4Science.
Jim Fan, seorang murid Li Feifei, meringkaskan untuk kita sepuluh detik sorotan AI teratas pada tahun 2022. Mari kita putar semula masa dan lihat apa kejayaan AI menakjubkan yang akan berlaku pada tahun 2022.
1 Penjanaan imej teks
DALLE-2 ialah yang pertama menjana imej resolusi tinggi yang realistik daripada sebarang tajuk Besar -model penyebaran skala untuk imej.
Ia melancarkan revolusi artistik AI dan melahirkan banyak aplikasi baharu, permulaan dan cara berfikir.
Tetapi DALLE-2 dilindungi di sebalik dinding OpenAI dan bukan sumber terbuka.
Selepas OpenAI, StabilityAI dan runwayml LMU mengambil langkah berani untuk melatih model text2image berskala Internet mereka sendiri berdasarkan algoritma "potensi resapan". Mereka memanggil model "penyebaran stabil" dan sumber terbuka kod dan pemberat.
Ternyata keterbukaan Stable Diffusion telah membawa perubahan besar kepada permainan.
Kini, banyak syarikat permulaan dan makmal penyelidikan sedang mencipta aplikasi baharu berdasarkan Stable Diffusion, dan Stable Diffusion sendiri terus dipertingkatkan oleh komuniti sumber terbuka.
Baru-baru ini, Stable Diffusion telah mencapai v2.1 dan boleh berjalan pada satu GPU.
Selain itu, terdapat dua model imej2teks daripada GoogleAI tahun ini. GoogleAI tidak mengeluarkan model mahupun API, tetapi dari kertas itu, kita masih dapat melihat banyak cerapan menarik.
Imej
https://imagen.research.google
Parti
https://parti.research.google. Ia adalah model Transformer tanpa resapan.
2. Penjanaan Teks-Teks
Semua orang tahu bahawa saya bercakap tentang ChatGPT!
Ini adalah satu-satunya apl dalam sejarah yang mencapai 1 juta pengguna dalam masa 5 hari.
ChatGPT juga telah banyak memberi inspirasi kepada kreativiti manusia kita.
Dalam senarai ini, lihat semua idea berguna dan imaginatif tentang ChatGPT: https://github.com/f/awesome-chat
Kedua-dua ChatGPT dan GPT-3.5 menggunakan teknologi baharu yang dipanggil RLHF ("Pembelajaran Pengukuhan daripada Maklum Balas Manusia").
Ini juga bermakna projek segera mungkin hilang tidak lama lagi.
Kepopularan ChatGPT telah melahirkan gelombang pemula dan pesaing baharu, seperti Jasper Chat, YouChat, Replit’s Ghostwriter chat dan perplexity_ai.
Pesaing ini menawarkan kaedah carian intuitif sehinggakan eksekutif Google pun mula berpeluh!
Model text-bot
Bagaimana untuk memberi GPT tangan dan kaki supaya mereka boleh membersihkan dapur anda yang tidak kemas?
Tidak seperti NLP, model robot perlu berinteraksi dengan dunia fizikal.
Tahun ini, Transformers besar yang telah dilatih akhirnya mula menyelesaikan masalah paling sukar dalam bidang robotik
VIMA
Pada bulan Oktober, rakan sekerja saya dan saya Mencipta "robot GPT" - pengubah bernama VIMA.
Ia boleh menerima sebarang teks bercampur, imej dan video sebagai gesaan dan mengeluarkan kawalan lengan robot.
Model kami dipanggil VIMA ("Perhatian VisuoMotor") dan merupakan sumber terbuka sepenuhnya.
Kini, ejen tunggal boleh menyelesaikan sasaran visual, tiruan video sekali sahaja, asas konsep baharu, kekangan visual, dll., dengan skalabiliti kapasiti model dan data yang kukuh.
RT-1
Mengikuti laluan yang sama ke VIMA, penyelidik dari GoogleAI mengeluarkan RT-1, pengubah Robot yang dilatih dalam 700 tugas dan 130K demonstrasi manusia.
Data ini dikumpul selama 17 bulan oleh 13 robot, tentera keluli literal!
4 Teks - Video
Pada asasnya, video ialah satu siri imej yang digabungkan bersama-sama dari semasa ke semasa, memberikan kita Mencipta ilusi pergerakan .
Jika kita boleh melakukan text2image, mengapa tidak menambah garis masa padanya untuk keseronokan tambahan?
Pada masa ini, terdapat 3 karya utama dalam medan teks-ke-video, tetapi tiada satu pun daripadanya adalah sumber terbuka.
Make-A-Video
Yang pertama ialah Make-A-Video Meta AI: Tidak memerlukan data teks-video berpasangan, anda boleh mendapatkan video teks daripada generasi.
Anda boleh mendaftar untuk akses percubaan di sini: https://makeavevideo.studio
Pautan kertas: https://arxiv.org/abs / 2209.14792
Video Imej
Video Imej Google AI: Ia menggunakan model resapan untuk menjana video definisi tinggi, berdasarkan penjana imej statik Imagen.
Demo: http://imagen.research.google/video/
Pautan kertas: https://arxiv.org/abs/2210.02303
Phenaki
Phenaki daripada Google AI: Menjana video berpanjangan berubah-ubah daripada huraian teks domain terbuka.
Demo: https://phenaki.video
Pautan kertas: https://arxiv.org/abs/2210.02399
5. Pemodelan Teks-3D
Daripada mereka bentuk produk inovatif kepada mencipta kesan visual yang hebat dalam filem dan permainan, pemodelan 3D menjadi generasi teks-X Lautan biru seterusnya daripada model.
Anehnya, terdapat banyak model generatif 3D yang menjanjikan muncul pada tahun 2022. Di sini, Fan menyenaraikan 3 model.
DreamFusion
Yang pertama muncul ialah DreamFusion yang dibangunkan bersama oleh pasukan penyelidik AI Google dan UC Berkeley.
Pautan kertas: https://arxiv.org/pdf/2209.14988.pdf
Model dilakukan menggunakan resapan teks-ke-imej 2D model Sintesis Teks-ke-3D.
Berdasarkan algoritma NeRF, DreamFusion boleh menjana model 3D daripada teks yang diberikan.
Model boleh dilihat dari mana-mana sudut, boleh dinyalakan semula di bawah sebarang pencahayaan dan boleh digubah ke dalam mana-mana persekitaran 3D.
Magic3D
Keputusan kedua ialah dua projek pasukan NVIDIA AI, dinamakan GET3D dan Magic3D.
Pautan kertas GET3D: https://nv-tlabs.github.io/GET3D/assets/paper.pdf
Pautan kertas Magic3D: https://arxiv.org/pdf/2211.10440.pdf
Dilatih menggunakan imej 2D sahaja, GET3D boleh menjana grafik 3D dengan tekstur ketelitian tinggi dan butiran geometri yang kompleks.
Model ini membolehkan pengguna mengimport serta-merta bentuk mereka ke dalam pemapar 3D dan enjin permainan untuk penyuntingan seterusnya.
Magic3D adalah serupa dengan DreamFusion, menggunakan model teks-ke-imej untuk menghasilkan imej 2D, yang kemudiannya dioptimumkan ke dalam data NeRF (Neural Radiation Field) volumetrik, mengoptimumkan model kasar yang dijana pada resolusi rendah menjadi halus model pada resolusi tinggi.
Menurut pasukan NVIDIA AI, kaedah Magic3D yang terhasil boleh menjana objek 3D lebih pantas daripada DreamFusion.
Point-E
Susulan pelancaran DALL-E 2 pada awal tahun, yang mengejutkan semua orang dengan berus geniusnya, OpenAI mengeluarkan generasi imej terbaharunya model "POINT-E" pada hari Selasa ", yang boleh menjana model 3D terus daripada teks.
Pautan kertas: https://arxiv.org/pdf/2212.08751.pdf
Berbanding dengan pesaing (seperti DreamFusion Google) berapa banyak Manakala GPU tunggal boleh berfungsi selama berjam-jam, POINT-E boleh menjana imej 3D dalam beberapa minit dengan hanya satu GPU.
Menurut ujian, POINT-E pada asasnya boleh mengeluarkan imej 3D dalam beberapa saat selepas input segera Selain itu, imej keluaran juga menyokong pengeditan tersuai, menyimpan dan fungsi lain.
6. AI yang boleh memainkan "Minecraft"
"Minecraft" ialah permainan yang sangat baik untuk menguji kecerdasan am AI. Pertama sekali, ia adalah permainan kotak pasir terbuka tanpa had yang sangat mencerminkan kreativiti pemain.
Kedua, permainan ini mempunyai pangkalan pemain sebanyak 140 juta, iaitu dua kali ganda jumlah penduduk UK. Dengan pangkalan pengguna yang begitu besar, terdapat bekalan data permainan yang tidak berkesudahan untuk pembelajaran AI.
Jadi, bolehkah AI menggunakan imaginasinya sebagaimana manusia boleh?
Jim Fan dan rakan sekerja bekerjasama untuk membangunkan AI "MineDojo" pertama untuk memainkan "Minecraft", yang boleh menyelesaikan banyak tugas di bawah gesaan bahasa semula jadi.
Pautan kertas: https://arxiv.org/pdf/2206.08853.pdf
Matlamat akhir peminat adalah untuk membina "GPT yang terkandung" . Pada masa ini, platform MineDojo adalah sumber terbuka sepenuhnya.
Pada masa yang sama, pasukan Jeff Clune mengumumkan model yang dipanggil Video Pra-Latihan (VPT), yang boleh mengeluarkan secara langsung pergerakan papan kekunci dan tetikus.
Pautan kertas: https://arxiv.org/pdf/2206.11795.pdf
VPT mempunyai perspektif yang lebih luas, Tetapi ia tidak dihadkan oleh syarat bahasa. Pada ketika ini, MineDojo dan VPT saling melengkapi.
7 Diplomat AI
CICERO yang dilancarkan oleh Meta AI ialah yang pertama mencapai prestasi peringkat manusia dalam permainan "Diplomasi. " Ejen kecerdasan buatan ekspresif.
Pautan kertas: https://www.science.org/doi/10.1126/science.ade9097
"Diplomasi" Ia ialah permainan strategi klasik tujuh pemain yang boleh dikatakan sebagai gabungan permainan papan Risiko, permainan kad poker dan rancangan TV Survivor. Permainan ini memerlukan rundingan bahasa semula jadi yang meluas untuk bekerjasama dan bersaing dengan manusia.
Namun, kemunculan CICERO menunjukkan bahawa kecerdasan buatan kini mempunyai kebolehan untuk memujuk orang lain dan menipu.
Pada masa ini, DeepMind juga telah mengumumkan pembangunan ejen AI diplomatnya sendiri. Jadi, apakah yang akan berlaku sekiranya CICERO menggunakan model AI ini?
8. Model Teks Audio
Whisper ialah model pengecaman pertuturan sumber terbuka berskala besar yang dikeluarkan oleh OpenAI Ia mempunyai keteguhan dan ketepatan tahap hampir manusia dalam bahasa Inggeris ketepatan pertuturan.
Pautan kertas: https://arxiv.org/pdf/2212.04356.pdf
Bisikan melalui 680 daripada Internet ,000 jam latihan mengenai data audio. Open AI menekankan bahawa keupayaan pengecaman pertuturan Whisper telah mencapai tahap manusia.
Bisikan sumber terbuka AI terbuka adakah untuk membuka kunci lebih banyak token teks untuk melatih GPT-4 yang dinanti-nantikan?
9. Gabungan nuklear
DeepMind dan Institut Teknologi Persekutuan Switzerland di Lausanne (EPFL) bersama-sama membangunkan sistem pembelajaran tetulang mendalam berkaitan gabungan nuklear yang boleh mengekalkan nuklear Penstabilan plasma gabungan dalam tokamak.
Pautan kertas: https://www.nature.com/articles/s41586-021-04301-9
Sama Bulan ini, Jabatan Tenaga A.S. mengumumkan satu kejayaan besar: Buat pertama kalinya, manusia telah mencapai keuntungan tenaga bersih daripada tindak balas pelakuran nuklear!
Ini adalah kali pertama manusia mencapai kejayaan ini. Dalam hidup ini, kita mungkin menjadi tamadun gabungan!
10. Transformer digunakan dalam biologi
Pada tahun 2021, AlphaFold memulakan penggunaan model bahasa untuk meramalkan struktur 3D protein.
Pada bulan Julai, DeepMind mengumumkan "Protein Universe"—mengembangkan pangkalan data protein AlphaFold kepada 200 juta struktur!
Selain itu, pasukan penyelidik NVIDIA AI juga telah mengembangkan rangka kerja model bahasa berskala besar BioNeMo untuk membantu syarikat bioteknologi dan penyelidik menjana, meramal dan memahami data biomolekul.
Penjelasan video: https://www.youtube.com/watch?v=PWcNlRI00jo&t=4399s
Di atas adalah pendapat Jim Fan pada 2022 Oktober Inventori sorotan AI besar. Sudah tentu, Fan juga berkata bahawa terdapat banyak karya menarik yang telah menyumbang kepada kemajuan kecerdasan buatan.
Setiap kertas adalah batu bata dalam bangunan AI, dan semua usaha harus diraikan.
Walau bagaimanapun, Fan juga pada akhirnya menekankan bahawa apabila sistem kecerdasan buatan menjadi semakin berkuasa, kita mesti sedar tentang potensi bahaya dan risiko serta mengambil langkah untuk mengurangkannya.
Sama ada melalui reka bentuk latihan yang teliti, penyeliaan yang sesuai atau kaedah perlindungan baharu, keselamatan dan etika kecerdasan buatan telah menjadi agenda yang dibincangkan oleh semakin ramai pakar AI.
Tidak dinafikan bahawa tahun 2022 adalah tahun yang penuh dengan keajaiban dan tahun yang menakjubkan. Apakah kejayaan yang akan dibuat pada tahun hadapan yang akan mengejutkan dunia? Kami menonton bersama anda.
Rujukan:
https://twitter.com/drjimfan/status/1607746957753057280?s=46&t=OVM_4zdRW2rQwqLohMdPpw
Atas ialah kandungan terperinci Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

https://undressaitool.ai/ adalah aplikasi mudah alih yang kuat dengan ciri -ciri AI canggih untuk kandungan dewasa. Buat imej atau video pornografi AI yang dihasilkan sekarang!

Tutorial menggunakan Undressai untuk membuat gambar/video lucah: 1. Buka pautan web alat yang sepadan; 2. Klik butang Alat; 3. Muat naik kandungan yang diperlukan untuk pengeluaran mengikut halaman yang diminta; 4. Simpan dan nikmati hasilnya.

Alamat rasmi Undress AI adalah: https: //undressaitool.ai/; Undressai adalah aplikasi mudah alih yang kuat dengan ciri -ciri AI yang canggih untuk kandungan dewasa. Buat imej atau video pornografi AI yang dihasilkan sekarang!

Tutorial menggunakan Undressai untuk membuat gambar/video lucah: 1. Buka pautan web alat yang sepadan; 2. Klik butang Alat; 3. Muat naik kandungan yang diperlukan untuk pengeluaran mengikut halaman yang diminta; 4. Simpan dan nikmati hasilnya.

Alamat rasmi Undress AI adalah: https: //undressaitool.ai/; Undressai adalah aplikasi mudah alih yang kuat dengan ciri -ciri AI yang canggih untuk kandungan dewasa. Buat imej atau video pornografi AI yang dihasilkan sekarang!

Tutorial menggunakan Undressai untuk membuat gambar/video lucah: 1. Buka pautan web alat yang sepadan; 2. Klik butang Alat; 3. Muat naik kandungan yang diperlukan untuk pengeluaran mengikut halaman yang diminta; 4. Simpan dan nikmati hasilnya.
![[Imej gaya Ghibli dengan AI] Memperkenalkan Cara Membuat Imej Percuma Dengan CHATGPT dan Hak Cipta](https://img.php.cn/upload/article/001/242/473/174707263295098.jpg?x-oss-process=image/resize,p_40)
Model terkini GPT-4O yang dikeluarkan oleh OpenAI bukan sahaja dapat menghasilkan teks, tetapi juga mempunyai fungsi penjanaan imej, yang telah menarik perhatian yang meluas. Ciri yang paling menarik ialah generasi "ilustrasi gaya Ghibli". Hanya muat naik foto ke Chatgpt dan berikan arahan mudah untuk menghasilkan imej yang mengasyikkan seperti kerja di Studio Ghibli. Artikel ini akan menerangkan secara terperinci proses operasi sebenar, pengalaman kesan, serta kesilapan dan isu hak cipta yang perlu diberi perhatian. Untuk butiran model terkini "O3" yang dikeluarkan oleh OpenAI, sila klik di sini ⬇️ Penjelasan terperinci mengenai Openai O3 (Chatgpt O3): Ciri-ciri, Sistem Harga dan Pengenalan O4-Mini Sila klik di sini untuk versi Bahasa Inggeris Artikel Ghibli ⬇️ Buat ji dengan chatgpt

Sebagai kaedah komunikasi baru, penggunaan dan pengenalan CHATGPT di kerajaan tempatan menarik perhatian. Walaupun trend ini sedang berjalan di pelbagai bidang, sesetengah kerajaan tempatan enggan menggunakan CHATGPT. Dalam artikel ini, kami akan memperkenalkan contoh pelaksanaan ChatGPT di kerajaan tempatan. Kami akan meneroka bagaimana kami mencapai peningkatan kualiti dan kecekapan dalam perkhidmatan kerajaan tempatan melalui pelbagai contoh pembaharuan, termasuk penciptaan dokumen dan dialog yang menyokong rakyat. Bukan sahaja pegawai kerajaan tempatan yang bertujuan untuk mengurangkan beban kerja kakitangan dan meningkatkan kemudahan untuk rakyat, tetapi juga berminat dengan kes penggunaan lanjutan.


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

VSCode Windows 64-bit Muat Turun
Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

Versi Mac WebStorm
Alat pembangunan JavaScript yang berguna

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Penyesuai Pelayan SAP NetWeaver untuk Eclipse
Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.
