Rumah >Peranti teknologi >AI >Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

WBOY
WBOYke hadapan
2023-04-18 10:49:021401semak imbas

Ledakan kecerdasan buatan telah memesongkan deria masa kita.

Bolehkah anda percaya bahawa Stable Diffusion baru berusia 4 bulan dan ChatGPT telah wujud kurang dari sebulan?

Untuk menggunakan metafora yang jelas, jika anda berkelip mata, anda akan terlepas industri baharu.

Dalam bidang AI pada tahun 2022, model generatif berskala besar bermunculan seperti cendawan selepas hujan, mengubah landskap keseluruhan industri AI.

Lebih-lebih lagi, model-model ini dengan pantas bergerak keluar dari makmal dan digunakan dalam realiti.

Sebagai contoh, teknologi LLM telah mengilhamkan dua bidang baru muncul - ejen membuat keputusan (permainan, robot, dll.) dan AI4Science.

Jim Fan, seorang murid Li Feifei, meringkaskan untuk kita sepuluh detik sorotan AI teratas pada tahun 2022. Mari kita putar semula masa dan lihat apa kejayaan AI menakjubkan yang akan berlaku pada tahun 2022.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

1 Penjanaan imej teks

DALLE-2 ialah yang pertama menjana imej resolusi tinggi yang realistik daripada sebarang tajuk Besar -model penyebaran skala untuk imej.

Ia melancarkan revolusi artistik AI dan melahirkan banyak aplikasi baharu, permulaan dan cara berfikir.

Tetapi DALLE-2 dilindungi di sebalik dinding OpenAI dan bukan sumber terbuka.

Selepas OpenAI, StabilityAI dan runwayml LMU mengambil langkah berani untuk melatih model text2image berskala Internet mereka sendiri berdasarkan algoritma "potensi resapan". Mereka memanggil model "penyebaran stabil" dan sumber terbuka kod dan pemberat.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Ternyata keterbukaan Stable Diffusion telah membawa perubahan besar kepada permainan.

Kini, banyak syarikat permulaan dan makmal penyelidikan sedang mencipta aplikasi baharu berdasarkan Stable Diffusion, dan Stable Diffusion sendiri terus dipertingkatkan oleh komuniti sumber terbuka.

Baru-baru ini, Stable Diffusion telah mencapai v2.1 dan boleh berjalan pada satu GPU.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Selain itu, terdapat dua model imej2teks daripada GoogleAI tahun ini. GoogleAI tidak mengeluarkan model mahupun API, tetapi dari kertas itu, kita masih dapat melihat banyak cerapan menarik.

Imej

https://imagen.research.google

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Parti

https://parti.research.google. Ia adalah model Transformer tanpa resapan.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

2. Penjanaan Teks-Teks

Semua orang tahu bahawa saya bercakap tentang ChatGPT!

Ini adalah satu-satunya apl dalam sejarah yang mencapai 1 juta pengguna dalam masa 5 hari.

ChatGPT juga telah banyak memberi inspirasi kepada kreativiti manusia kita.

Dalam senarai ini, lihat semua idea berguna dan imaginatif tentang ChatGPT: https://github.com/f/awesome-chat

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Kedua-dua ChatGPT dan GPT-3.5 menggunakan teknologi baharu yang dipanggil RLHF ("Pembelajaran Pengukuhan daripada Maklum Balas Manusia").

Ini juga bermakna projek segera mungkin hilang tidak lama lagi.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Kepopularan ChatGPT telah melahirkan gelombang pemula dan pesaing baharu, seperti Jasper Chat, YouChat, Replit’s Ghostwriter chat dan perplexity_ai.

Pesaing ini menawarkan kaedah carian intuitif sehinggakan eksekutif Google pun mula berpeluh!

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Model text-bot

Bagaimana untuk memberi GPT tangan dan kaki supaya mereka boleh membersihkan dapur anda yang tidak kemas?

Tidak seperti NLP, model robot perlu berinteraksi dengan dunia fizikal.

Tahun ini, Transformers besar yang telah dilatih akhirnya mula menyelesaikan masalah paling sukar dalam bidang robotik

VIMA

Pada bulan Oktober, rakan sekerja saya dan saya Mencipta "robot GPT" - pengubah bernama VIMA.

Ia boleh menerima sebarang teks bercampur, imej dan video sebagai gesaan dan mengeluarkan kawalan lengan robot.

Model kami dipanggil VIMA ("Perhatian VisuoMotor") dan merupakan sumber terbuka sepenuhnya.

Kini, ejen tunggal boleh menyelesaikan sasaran visual, tiruan video sekali sahaja, asas konsep baharu, kekangan visual, dll., dengan skalabiliti kapasiti model dan data yang kukuh.

RT-1

Mengikuti laluan yang sama ke VIMA, penyelidik dari GoogleAI mengeluarkan RT-1, pengubah Robot yang dilatih dalam 700 tugas dan 130K demonstrasi manusia.

Data ini dikumpul selama 17 bulan oleh 13 robot, tentera keluli literal!

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

4 Teks - Video

Pada asasnya, video ialah satu siri imej yang digabungkan bersama-sama dari semasa ke semasa, memberikan kita Mencipta ilusi pergerakan .

Jika kita boleh melakukan text2image, mengapa tidak menambah garis masa padanya untuk keseronokan tambahan?

Pada masa ini, terdapat 3 karya utama dalam medan teks-ke-video, tetapi tiada satu pun daripadanya adalah sumber terbuka.

Make-A-Video

Yang pertama ialah Make-A-Video Meta AI: Tidak memerlukan data teks-video berpasangan, anda boleh mendapatkan video teks daripada generasi.

Anda boleh mendaftar untuk akses percubaan di sini: https://makeavevideo.studio

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/abs / 2209.14792

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Video Imej

Video Imej Google AI: Ia menggunakan model resapan untuk menjana video definisi tinggi, berdasarkan penjana imej statik Imagen.

Demo: http://imagen.research.google/video/

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/abs/2210.02303

Phenaki

Phenaki daripada Google AI: Menjana video berpanjangan berubah-ubah daripada huraian teks domain terbuka.

Demo: https://phenaki.video

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/abs/2210.02399

5. Pemodelan Teks-3D

Daripada mereka bentuk produk inovatif kepada mencipta kesan visual yang hebat dalam filem dan permainan, pemodelan 3D menjadi generasi teks-X Lautan biru seterusnya daripada model.

Anehnya, terdapat banyak model generatif 3D yang menjanjikan muncul pada tahun 2022. Di sini, Fan menyenaraikan 3 model.

DreamFusion

Yang pertama muncul ialah DreamFusion yang dibangunkan bersama oleh pasukan penyelidik AI Google dan UC Berkeley.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/pdf/2209.14988.pdf

Model dilakukan menggunakan resapan teks-ke-imej 2D model Sintesis Teks-ke-3D.

Berdasarkan algoritma NeRF, DreamFusion boleh menjana model 3D daripada teks yang diberikan.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Model boleh dilihat dari mana-mana sudut, boleh dinyalakan semula di bawah sebarang pencahayaan dan boleh digubah ke dalam mana-mana persekitaran 3D.

Magic3D

Keputusan kedua ialah dua projek pasukan NVIDIA AI, dinamakan GET3D dan Magic3D.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas GET3D: https://nv-tlabs.github.io/GET3D/assets/paper.pdf

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas Magic3D: https://arxiv.org/pdf/2211.10440.pdf

Dilatih menggunakan imej 2D sahaja, GET3D boleh menjana grafik 3D dengan tekstur ketelitian tinggi dan butiran geometri yang kompleks.

Model ini membolehkan pengguna mengimport serta-merta bentuk mereka ke dalam pemapar 3D dan enjin permainan untuk penyuntingan seterusnya.

Magic3D adalah serupa dengan DreamFusion, menggunakan model teks-ke-imej untuk menghasilkan imej 2D, yang kemudiannya dioptimumkan ke dalam data NeRF (Neural Radiation Field) volumetrik, mengoptimumkan model kasar yang dijana pada resolusi rendah menjadi halus model pada resolusi tinggi.


Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Menurut pasukan NVIDIA AI, kaedah Magic3D yang terhasil boleh menjana objek 3D lebih pantas daripada DreamFusion.

Point-E

Susulan pelancaran DALL-E 2 pada awal tahun, yang mengejutkan semua orang dengan berus geniusnya, OpenAI mengeluarkan generasi imej terbaharunya model "POINT-E" pada hari Selasa ", yang boleh menjana model 3D terus daripada teks.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/pdf/2212.08751.pdf

Berbanding dengan pesaing (seperti DreamFusion Google) berapa banyak Manakala GPU tunggal boleh berfungsi selama berjam-jam, POINT-E boleh menjana imej 3D dalam beberapa minit dengan hanya satu GPU.

Menurut ujian, POINT-E pada asasnya boleh mengeluarkan imej 3D dalam beberapa saat selepas input segera Selain itu, imej keluaran juga menyokong pengeditan tersuai, menyimpan dan fungsi lain.

6. AI yang boleh memainkan "Minecraft"

"Minecraft" ialah permainan yang sangat baik untuk menguji kecerdasan am AI. Pertama sekali, ia adalah permainan kotak pasir terbuka tanpa had yang sangat mencerminkan kreativiti pemain.

Kedua, permainan ini mempunyai pangkalan pemain sebanyak 140 juta, iaitu dua kali ganda jumlah penduduk UK. Dengan pangkalan pengguna yang begitu besar, terdapat bekalan data permainan yang tidak berkesudahan untuk pembelajaran AI.

Jadi, bolehkah AI menggunakan imaginasinya sebagaimana manusia boleh?

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Jim Fan dan rakan sekerja bekerjasama untuk membangunkan AI "MineDojo" pertama untuk memainkan "Minecraft", yang boleh menyelesaikan banyak tugas di bawah gesaan bahasa semula jadi.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/pdf/2206.08853.pdf

Matlamat akhir peminat adalah untuk membina "GPT yang terkandung" . Pada masa ini, platform MineDojo adalah sumber terbuka sepenuhnya.

Pada masa yang sama, pasukan Jeff Clune mengumumkan model yang dipanggil Video Pra-Latihan (VPT), ​​​​yang boleh mengeluarkan secara langsung pergerakan papan kekunci dan tetikus.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/pdf/2206.11795.pdf

VPT mempunyai perspektif yang lebih luas, Tetapi ia tidak dihadkan oleh syarat bahasa. Pada ketika ini, MineDojo dan VPT saling melengkapi.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

7 Diplomat AI

CICERO yang dilancarkan oleh Meta AI ialah yang pertama mencapai prestasi peringkat manusia dalam permainan "Diplomasi. " Ejen kecerdasan buatan ekspresif.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://www.science.org/doi/10.1126/science.ade9097

"Diplomasi" Ia ialah permainan strategi klasik tujuh pemain yang boleh dikatakan sebagai gabungan permainan papan Risiko, permainan kad poker dan rancangan TV Survivor. Permainan ini memerlukan rundingan bahasa semula jadi yang meluas untuk bekerjasama dan bersaing dengan manusia.

Namun, kemunculan CICERO menunjukkan bahawa kecerdasan buatan kini mempunyai kebolehan untuk memujuk orang lain dan menipu.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pada masa ini, DeepMind juga telah mengumumkan pembangunan ejen AI diplomatnya sendiri. Jadi, apakah yang akan berlaku sekiranya CICERO menggunakan model AI ini?

8. Model Teks Audio

Whisper ialah model pengecaman pertuturan sumber terbuka berskala besar yang dikeluarkan oleh OpenAI Ia mempunyai keteguhan dan ketepatan tahap hampir manusia dalam bahasa Inggeris ketepatan pertuturan.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://arxiv.org/pdf/2212.04356.pdf

Bisikan melalui 680 daripada Internet ,000 jam latihan mengenai data audio. Open AI menekankan bahawa keupayaan pengecaman pertuturan Whisper telah mencapai tahap manusia.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Bisikan sumber terbuka AI terbuka adakah untuk membuka kunci lebih banyak token teks untuk melatih GPT-4 yang dinanti-nantikan?

9. Gabungan nuklear

DeepMind dan Institut Teknologi Persekutuan Switzerland di Lausanne (EPFL) bersama-sama membangunkan sistem pembelajaran tetulang mendalam berkaitan gabungan nuklear yang boleh mengekalkan nuklear Penstabilan plasma gabungan dalam tokamak.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Pautan kertas: https://www.nature.com/articles/s41586-021-04301-9

Sama Bulan ini, Jabatan Tenaga A.S. mengumumkan satu kejayaan besar: Buat pertama kalinya, manusia telah mencapai keuntungan tenaga bersih daripada tindak balas pelakuran nuklear!

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Ini adalah kali pertama manusia mencapai kejayaan ini. Dalam hidup ini, kita mungkin menjadi tamadun gabungan!

10. Transformer digunakan dalam biologi

Pada tahun 2021, AlphaFold memulakan penggunaan model bahasa untuk meramalkan struktur 3D protein.

Pada bulan Julai, DeepMind mengumumkan "Protein Universe"—mengembangkan pangkalan data protein AlphaFold kepada 200 juta struktur!

Selain itu, pasukan penyelidik NVIDIA AI juga telah mengembangkan rangka kerja model bahasa berskala besar BioNeMo untuk membantu syarikat bioteknologi dan penyelidik menjana, meramal dan memahami data biomolekul.

Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai

Penjelasan video: https://www.youtube.com/watch?v=PWcNlRI00jo&t=4399s

Di atas adalah pendapat Jim Fan pada 2022 Oktober Inventori sorotan AI besar. Sudah tentu, Fan juga berkata bahawa terdapat banyak karya menarik yang telah menyumbang kepada kemajuan kecerdasan buatan.

Setiap kertas adalah batu bata dalam bangunan AI, dan semua usaha harus diraikan.

Walau bagaimanapun, Fan juga pada akhirnya menekankan bahawa apabila sistem kecerdasan buatan menjadi semakin berkuasa, kita mesti sedar tentang potensi bahaya dan risiko serta mengambil langkah untuk mengurangkannya.

Sama ada melalui reka bentuk latihan yang teliti, penyeliaan yang sesuai atau kaedah perlindungan baharu, keselamatan dan etika kecerdasan buatan telah menjadi agenda yang dibincangkan oleh semakin ramai pakar AI.

Tidak dinafikan bahawa tahun 2022 adalah tahun yang penuh dengan keajaiban dan tahun yang menakjubkan. Apakah kejayaan yang akan dibuat pada tahun hadapan yang akan mengejutkan dunia? Kami menonton bersama anda.

Rujukan:

https://twitter.com/drjimfan/status/1607746957753057280?s=46&t=OVM_4zdRW2rQwqLohMdPpw

Atas ialah kandungan terperinci Li Feifei mengambil kira sepuluh sorotan AI teratas tahun ini: gabungan nuklear, ChatGPT dan AlphaFold ada dalam senarai. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam