cari
RumahPeranti teknologiAIBolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Apakah trend dalam pembangunan kecerdasan buatan pada tahun 2022?

Pastikan anda menyebut kebangkitan "AI berbilang modal", terutamanya alatan penjanaan teks ke imej.

Dari DALL-E kepada Imagen, Parti, Nuwa, dll., ia boleh menjana imej berkualiti tinggi yang menakjubkan.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Contoh paling tipikal ini ialah Dall-E2 OpenAI.

Sejak Dall-E keluar, anda mungkin telah melihatnya menjana banyak gambar gaya lukisan, seperti angkasawan menunggang kuda di angkasa.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Walau bagaimanapun, terdapat sangat sedikit imej yang menyatakan konsep abstrak melalui Dall-E.

Tidak, Gabriele Sgroi, seorang saintis pembelajaran mesin, datang untuk meneroka cara DALL-E melaksanakan tugasan ini.

Dia menguji pastel minyak dan gaya lukisan pada tema seperti kesedihan, cinta, kemarahan, kebahagiaan, keadilan dan ketidakadilan.

Gaya pastel minyak

Sedih

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Marah

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Kebahagiaan

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Cinta

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Gaya lukisan

Kesedihan

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Cinta

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Marah

Terdapat konsep abstrak lain untuk dihayati: keadilan dan ketidakadilan

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Keadilan

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Ketidakadilan

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Gabriele Sgroi percaya lukisan itu akan menjadi lebih Berwawasan, daripada mengehadkan imej emosi kepada ekspresi muka orang.

Semua imej dalam artikel ini (termasuk imej muka depan) dijana menggunakan DALL-E dengan memilih semua imej yang disediakan oleh generasi pertama daripada gesaan yang diberikan.

Seperti yang dapat dilihat daripada contoh-contoh ini, walaupun emosi yang diberikan tidak selalunya dapat dikenal pasti dengan jelas, DALL-E mempunyai kesan keseluruhan yang kuat untuk gaya lukisan Tunjukkan lebih banyak gambar abstrak dan kompleks.

Antaranya, kebanyakan gambar yang mewakili keadilan menggambarkan dewi Yunani, tetapi imej yang mewakili ketidakadilan benar-benar mengelirukan.

Secara keseluruhan, Sgroi memerhatikan bahawa keputusan banyak bergantung pada gaya yang dipilih.

Dan dalam kebanyakan kes, DALL-E akan menulis nama emosi pada lukisan yang dihasilkan.

Secara keseluruhannya, DALL-E nampaknya menunjukkan tahap pemahaman tentang emosi yang diuji, mengaitkannya dengan betul dengan ekspresi muka dan warna atau simbol yang biasanya dikaitkan dengannya sepasang.

Sgroi berkata adalah menarik untuk menyiasat lebih lanjut perbezaan dalam perwakilan emosi yang sama merentas gaya dan untuk mengkaji sama ada kecenderungan yang diperhatikan antara emosi positif dan negatif berlaku. benar dalam contoh lain masih wujud, ia akan menjadi menarik.

Adakah DALL-E gagal?

Ironinya, DALL-E 2 mendakwa pandai memahami gesaan teks yang digunakan untuk menjana imej.

Namun, sesetengah netizen mendapati apabila teks itu tidak dapat difahami buat masa ini, kandungan teks akan diletakkan dalam imej yang dihasilkan.

Seperti "Ini Bukan Paip", lukisan oleh artis Rene Magritte.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Terdapat juga kecerdasan buatan Janelle Shane yang meminta DALL-E 2 menjana logo syarikat, tetapi mendapati bahawa tiada gambar dapat mengeja perkataan dengan betul.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Contoh penjanaan Waffle House

Juga , anda boleh katakan DALL-E 2 memahami beberapa undang-undang saintifik.

Kerana ia boleh menggambarkan objek jatuh dengan mudah atau angkasawan terapung di angkasa.

Walau bagaimanapun, jika seseorang ingin menghasilkan anatomi, imej X-ray, bukti matematik atau pelan tindakan, imej yang terhasil mungkin betul secara cetek, tetapi pada asasnya Semua salah.

Contohnya dalam gambar sistem suria yang dilukis mengikut skala, boleh dikatakan kucar-kacir, dengan bentuk bumi di bahagian bawah. sudut kiri dan objek yang kelihatan seperti telur rebus di sudut kiri atas.

Penyelidik OpenAI Aditya Ramesh menerangkan bahawa ia cuba untuk membuat sesuatu yang serupa secara visual tanpa memahami maksudnya.

Jadi DALL-E 2 tidak tahu apa itu sains, ia hanya tahu membaca teks dan melukis ilustrasi.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Selain itu, apabila DALL-E 2 menjana wajah manusia, ia sangat realistik sehingga hampir sukar dipercayai.

Semasa latihan, OpenAI memperkenalkan langkah perlindungan deepfake untuk menghalangnya daripada mengingati wajah yang sering muncul di Internet.

Jika imej yang dimuat naik mengandungi wajah sebenar, malah orang yang tidak dikenali, sistem akan menolak untuk menjana kandungan tersebut.

Bagaimanapun, satu lagi masalah timbul, OpenAI berkata bahawa sistem ini dioptimumkan untuk imej dengan satu fokus perhatian

Contohnya, menghasilkan potret terperinci "seorang angkasawan merenung Bumi dengan ekspresi rindu di wajahnya" sangat berjaya.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Walau bagaimanapun, apabila DALL-E diminta menjana imej berbilang orang serentak, ia ranap secara langsung. Jadi ia menjadi sangat teruk dalam menghasilkan syot kumpulan dan adegan orang ramai.

Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi

Selain itu, DALL-E juga menjana beberapa imej berat sebelah.

Pada masa ini, pasukan OpenAI telah mula membetulkan bias melalui pembelajaran mesin.

Sebagai contoh, semasa latihan DALL-E 2, penyelidik melaraskan kaedah latihan dan meningkatkan berat imej wanita supaya mereka lebih berkemungkinan dihasilkan .

DALL-E akan membawa lebih banyak kejutan pada masa hadapan.

Atas ialah kandungan terperinci Bolehkah AI memetakan emosi? Lihat bagaimana DALL-E menyatakan abstraksi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Let's Dance: Gerakan berstruktur untuk menyempurnakan jaring saraf manusia kitaLet's Dance: Gerakan berstruktur untuk menyempurnakan jaring saraf manusia kitaApr 27, 2025 am 11:09 AM

Para saintis telah mengkaji secara meluas rangkaian saraf manusia dan mudah (seperti yang ada di C. elegans) untuk memahami fungsi mereka. Walau bagaimanapun, soalan penting timbul: Bagaimana kita menyesuaikan rangkaian saraf kita sendiri untuk berfungsi dengan berkesan bersama -sama dengan novel AI s

New Google Leak mendedahkan perubahan langganan untuk Gemini AINew Google Leak mendedahkan perubahan langganan untuk Gemini AIApr 27, 2025 am 11:08 AM

Gemini Google Advanced: Tahap Langganan Baru di Horizon Pada masa ini, mengakses Gemini Advanced memerlukan pelan premium AI $ 19.99/bulan. Walau bagaimanapun, laporan Pihak Berkuasa Android menunjukkan perubahan yang akan datang. Kod dalam google terkini p

Bagaimana Pecutan Analisis Data Menyelesaikan Bots Tersembunyi AIBagaimana Pecutan Analisis Data Menyelesaikan Bots Tersembunyi AIApr 27, 2025 am 11:07 AM

Walaupun gembar -gembur di sekitar keupayaan AI maju, satu cabaran penting bersembunyi dalam perusahaan AI perusahaan: kesesakan pemprosesan data. Walaupun CEO merayakan kemajuan AI, jurutera bergelut dengan masa pertanyaan yang perlahan, saluran paip yang terlalu banyak, a

Markitdown MCP boleh menukar mana -mana dokumen ke Markdowns!Markitdown MCP boleh menukar mana -mana dokumen ke Markdowns!Apr 27, 2025 am 09:47 AM

Dokumen pengendalian tidak lagi hanya mengenai pembukaan fail dalam projek AI anda, ia mengenai mengubah kekacauan menjadi kejelasan. Dokumen seperti PDF, PowerPoints, dan perkataan banjir aliran kerja kami dalam setiap bentuk dan saiz. Mengambil semula berstruktur

Bagaimana cara menggunakan Google ADK untuk ejen bangunan? - Analytics VidhyaBagaimana cara menggunakan Google ADK untuk ejen bangunan? - Analytics VidhyaApr 27, 2025 am 09:42 AM

Memanfaatkan kuasa Kit Pembangunan Ejen Google (ADK) untuk membuat ejen pintar dengan keupayaan dunia sebenar! Tutorial ini membimbing anda melalui membina ejen perbualan menggunakan ADK, menyokong pelbagai model bahasa seperti Gemini dan GPT. W

Penggunaan SLM Over LLM untuk Penyelesaian Masalah Berkesan - Analisis VidhyaPenggunaan SLM Over LLM untuk Penyelesaian Masalah Berkesan - Analisis VidhyaApr 27, 2025 am 09:27 AM

Ringkasan: Model bahasa kecil (SLM) direka untuk kecekapan. Mereka lebih baik daripada model bahasa yang besar (LLM) dalam persekitaran yang kurang sensitif, masa nyata dan privasi. Terbaik untuk tugas-tugas berasaskan fokus, terutamanya di mana kekhususan domain, kawalan, dan tafsiran lebih penting daripada pengetahuan umum atau kreativiti. SLMs bukan pengganti LLM, tetapi mereka sesuai apabila ketepatan, kelajuan dan keberkesanan kos adalah kritikal. Teknologi membantu kita mencapai lebih banyak sumber. Ia sentiasa menjadi promoter, bukan pemandu. Dari era enjin stim ke era gelembung internet, kuasa teknologi terletak pada tahap yang membantu kita menyelesaikan masalah. Kecerdasan Buatan (AI) dan AI Generatif Baru -baru ini tidak terkecuali

Bagaimana cara menggunakan model Google Gemini untuk tugas penglihatan komputer? - Analytics VidhyaBagaimana cara menggunakan model Google Gemini untuk tugas penglihatan komputer? - Analytics VidhyaApr 27, 2025 am 09:26 AM

Memanfaatkan kekuatan Google Gemini untuk Visi Komputer: Panduan Komprehensif Google Gemini, chatbot AI terkemuka, memanjangkan keupayaannya di luar perbualan untuk merangkumi fungsi penglihatan komputer yang kuat. Panduan ini memperincikan cara menggunakan

Gemini 2.0 Flash vs O4-Mini: Bolehkah Google lebih baik daripada Openai?Gemini 2.0 Flash vs O4-Mini: Bolehkah Google lebih baik daripada Openai?Apr 27, 2025 am 09:20 AM

Landskap AI pada tahun 2025 adalah elektrik dengan kedatangan Flash Gemini 2.0 Google dan Openai's O4-mini. Model-model canggih ini, yang dilancarkan minggu-minggu, mempunyai ciri-ciri canggih yang setanding dan skor penanda aras yang mengagumkan. Perbandingan mendalam ini

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).