cari
RumahPeranti teknologiAIGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Beberapa hari lalu, pasukan penyelidikan model besar Institut Penyelidikan Zhiyuan menggunakan sumber terbuka model AltDiffusion dwibahasa terkini, membawa kuasa kukuh penciptaan teks dan grafik AI peringkat profesional ke dunia China:

sokongan ciptaan Cina yang baik dan panjang; dan bahasa Inggeris diselaraskan, kesan visual yang mengejutkan tahap Stable Diffusion asal, ia boleh dikatakan sebagai mahir lukisan AI penceramah Cina bertaraf dunia.

Model inovatif AltCLIP ialah asas kerja ini, melengkapkan model CLIP asal dengan tiga keupayaan merentas bahasa yang lebih kukuh. Kedua-dua model AltDiffusion dan AltCLIP ialah model berbilang bahasa Cina dan Inggeris adalah peringkat pertama kerja, dan kod serta model telah menjadi sumber terbuka.

AltDiffusion

https://github.com/FlagAI-Open/FlagAI/tree/ master/examples/AltDiffusion

AltCLIP

https://github.com/ FlagAI-Open/FlagAI/examples/AltCLIP

Alamat percubaan angkasa HuggingFace:

https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion

Laporan Teknikal

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka


https://arxiv.org/abs/2211.06679

AltDiffusion Cina Profesional

——Lukisan halus Long Prompt + gaya Cina asli, memenuhi keperluan tinggi pakar penciptaan AI Cina

Terima kasih kepada dwibahasa Cina dan Inggeris yang berkuasa berdasarkan AltCLIP Dari segi keupayaan penjajaran, AltDiffusion telah mencapai tahap kesan visual yang serupa dengan Stable Diffusion Khususnya, ia mempunyai kelebihan unik untuk memahami bahasa Cina dan menjadi lebih baik dalam lukisan Cina pencipta gambar.

1. Penjanaan Long Prompt, kesan gambar tidak lebih rendah

Panjang Prompt ialah kawasan aliran air untuk menguji keupayaan model menjana teks dan grafik the Prompt, semakin sukar untuk menguji pemahaman bahasa , penjajaran imej dan teks serta keupayaan merentas bahasa.

Di bawah pelarasan input segera panjang bahasa Cina dan Inggeris yang sama, AltDiffusion adalah lebih ekspresif dalam banyak kes penjanaan imej: komposisi elemen yang kaya dan menarik, dan butirannya diterangkan dengan teliti dan tepat .

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

2 Memahami bahasa Cina dengan lebih baik dan lebih mahir dalam lukisan Cina

Kecuali untuk gesaan bahasa Cina dan Inggeris , prestasi input adalah serupa Selain itu, AltDiffusion juga boleh mengimbangi kekurangan gaya lukisan Cina di dunia Barat, menggunakan pasangan imej dan teks Cina untuk terus memperhalusi penjanaan ciri Cina, seperti gaya lukisan Cina model generasi, untuk menghasilkan "gaya Cina" yang sebenar.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

AltDiffusion lebih memahami bahasa Cina Ia boleh menerangkan maksud dalam konteks budaya Cina dan memahami niat pencipta dengan serta-merta. Contohnya, perihalan "The Grand Scene of the Tang Dynasty" mengelak daripada keluar topik kerana salah faham budaya.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Terutama untuk konsep yang berasal daripada budaya Cina, kami memahami dan menyatakannya dengan lebih tepat, bagi mengelakkan kekeliruan antara "gaya Jepun" dan "Cina gaya". Situasi yang tidak masuk akal. Contohnya, dengan Stable Diffusion, gesaan input yang sepadan dengan gaya watak sut Tang dalam bahasa Cina dan Inggeris, dan perbezaannya jelas sekali pandang:

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaGuru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Dalam penjanaan gaya tertentu, Ia akan menggunakan konteks budaya Cina secara asli sebagai subjek identiti untuk penciptaan gaya Contohnya, untuk gesaan dengan "seni bina purba" di bawah, seni bina Cina purba akan dijana secara lalai. Gaya kreatif lebih sesuai dengan identiti pencipta Cina.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

3 Cina dan Inggeris, penjajaran kesan yang dijana

AltDiffusion adalah berdasarkan Stable Diffusion, dengan menggantikan CLIP dalam Stable Diffusion asal ke dalam AltCLIP, dan seterusnya melatih model menggunakan pasangan imej dan teks bahasa Cina dan Inggeris. Terima kasih kepada keupayaan penjajaran bahasa AltCLIP yang berkuasa, kesan penjanaan AltDiffusion sangat hampir dengan Resapan Stabil dalam bahasa Inggeris, dan ia juga mencerminkan ketekalan dalam prestasi dwibahasa Cina dan Inggeris.

Sebagai contoh, selepas memasukkan Prompt Bahasa Cina dan Inggeris bagi "puppy in a hat" ke dalam AltDiffusion, kesan gambar yang dihasilkan pada asasnya diselaraskan, dengan ketekalan yang sangat tinggi:

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Setelah menambah deskriptor "budak Cina" pada gambar "budak lelaki", berdasarkan imej asal budak kecil itu, dia telah disesuaikan dengan tepat untuk menjadi tipikal " Kanak-kanak Cina, yang dipaparkan dalam generasi kawalan bahasa Menghasilkan keupayaan pemahaman bahasa yang sangat baik dan hasil ekspresi yang tepat.

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Buka ekosistem asal StableDiffusion

- alatan ekologi yang kaya dan aplikasi PromptsBook , anda boleh Kebolehmainan yang sangat baik

Perlu dinyatakan bahawa keupayaan penyepaduan ekologi AltDiffusion:

Semua alatan yang menyokong Stable Diffusion seperti Stable Diffusion WebUI, DreamBooth, dsb. boleh digunakan dalam model Penyebaran dwibahasa Cina-Inggeris kami menyediakan banyak pilihan untuk penciptaan AI Cina:

1 Stable Diffusion WebUI

Alat web yang sangat baik untuk penjanaan teks dan imej serta teks. dan penyuntingan imej; Apabila kita menukar pemandangan malam Universiti Peking menjadi Hogwarts (prompt: Hogwarts), dunia ajaib yang termenung dapat dipersembahkan dalam sekelip mata; 2. DreamBooth

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbukaAlat untuk nyahpepijat model melalui sebilangan kecil sampel untuk menjana gaya tertentu melalui alat ini, gaya tertentu boleh dijana menggunakan sebilangan kecil imej Cina pada AltDiffusion, seperti gaya "Havoc in Heaven". Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

3 Gunakan sepenuhnya Buku Gesaan Stable komuniti

Gesaan sangat penting untuk menjana model pengguna komuniti telah mengumpul kes kesan generasi kaya melalui a sejumlah besar percubaan gesaan. Pengalaman gesaan yang berharga ini hampir semuanya terpakai kepada pengguna AltDiffusion!

Selain itu, anda juga boleh menggabungkan bahasa Cina dan Inggeris untuk memadankan beberapa gaya dan unsur ajaib, atau terus meneroka gesaan bahasa Cina yang sesuai untuk AltDiffusion.

4. Mudah untuk pencipta Cina untuk memperhalusi

Sumber terbuka AltDiffusion menyediakan asas untuk model generasi Cina medan khusus Data digunakan untuk memperhalusi model untuk memudahkan ekspresi oleh pencipta Cina.

Berdasarkan AltCLIP dwibahasa pertama

- Meningkatkan secara menyeluruh tiga keupayaan merentas bahasa utama, penjajaran Cina-Inggeris, bahasa Cina yang lebih baik, ambang yang sangat rendah

Pemahaman bahasa, penjajaran gambar dan teks serta keupayaan merentas bahasa ialah tiga kebolehan yang diperlukan untuk penyelidikan merentas bahasa.

Banyak keupayaan peringkat profesional AltDiffusion diperoleh daripada idea perubahan menara inovatif AltCLIP, yang telah dipertingkatkan sepenuhnya dalam tiga keupayaan utama ini: keupayaan penjajaran bahasa Cina dan Inggeris dengan yang asal CLIP telah banyak dipertingkatkan dengan lancar menyambung kepada semua model dan alatan ekologi yang dibina pada CLIP asal, seperti Stable Diffusion pada masa yang sama, ia dikurniakan dengan keupayaan Cina yang berkuasa untuk mencapai hasil yang lebih baik dalam bahasa Cina pada beberapa set data. (Sila rujuk laporan teknikal untuk penjelasan terperinci)

Perlu dinyatakan bahawa kaedah penjajaran ini sangat mengurangkan ambang untuk melatih model perwakilan berbilang bahasa dan berbilang modal Berbanding dengan semula -melakukan pralatihan pasangan imej dan teks bahasa Cina Atau Inggeris, yang hanya memerlukan kira-kira 1% daripada sumber pengkomputeran dan data pasangan imej dan teks.

Mencapai kesan yang sama seperti versi asal Inggeris dalam penanda aras CLIP komprehensif

Dalam beberapa pengambilan semula data Contohnya, Flicker-30K mempunyai prestasi yang lebih baik daripada versi asal

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Flicker-30K mempunyai prestasi yang lebih baik daripada yang asal KLIP

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Hasil sifar tangkapan terbaik pada ImageNet Cina

Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka

Atas ialah kandungan terperinci Guru AI yang memahami bahasa Cina, gunung dan bulan yang terang dicat ini sangat menakjubkan! Model AltDiffusion dwibahasa Cina-Inggeris telah menjadi sumber terbuka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Memasak Inovasi: Bagaimana Kecerdasan Buatan Mengubah Perkhidmatan MakananMemasak Inovasi: Bagaimana Kecerdasan Buatan Mengubah Perkhidmatan MakananApr 12, 2025 pm 12:09 PM

AI Menambah Penyediaan Makanan Walaupun masih dalam penggunaan baru, sistem AI semakin digunakan dalam penyediaan makanan. Robot yang didorong oleh AI digunakan di dapur untuk mengautomasikan tugas penyediaan makanan, seperti membuang burger, membuat pizza, atau memasang SA

Panduan Komprehensif mengenai Python Namespaces & Variable ScopesPanduan Komprehensif mengenai Python Namespaces & Variable ScopesApr 12, 2025 pm 12:00 PM

Pengenalan Memahami ruang nama, skop, dan tingkah laku pembolehubah dalam fungsi Python adalah penting untuk menulis dengan cekap dan mengelakkan kesilapan runtime atau pengecualian. Dalam artikel ini, kami akan menyelidiki pelbagai ASP

Panduan Komprehensif untuk Model Bahasa Visi (VLMS)Panduan Komprehensif untuk Model Bahasa Visi (VLMS)Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

MediaTek meningkatkan barisan premium dengan Kompanio Ultra dan Dimensity 9400MediaTek meningkatkan barisan premium dengan Kompanio Ultra dan Dimensity 9400Apr 12, 2025 am 11:52 AM

Meneruskan irama produk, bulan ini MediaTek telah membuat satu siri pengumuman, termasuk Kompanio Ultra dan Dimensity 9400 yang baru. Produk ini mengisi bahagian perniagaan MediaTek yang lebih tradisional, termasuk cip untuk telefon pintar

Minggu ini di AI: Walmart menetapkan trend fesyen sebelum mereka pernah berlakuMinggu ini di AI: Walmart menetapkan trend fesyen sebelum mereka pernah berlakuApr 12, 2025 am 11:51 AM

#1 Google melancarkan Agent2Agent Cerita: Ia Isnin pagi. Sebagai perekrut berkuasa AI, anda bekerja lebih pintar, tidak lebih sukar. Anda log masuk ke papan pemuka syarikat anda di telefon anda. Ia memberitahu anda tiga peranan kritikal telah diperolehi, dijadualkan, dan dijadualkan untuk

AI Generatif Bertemu PsychobabbleAI Generatif Bertemu PsychobabbleApr 12, 2025 am 11:50 AM

Saya akan meneka bahawa anda mesti. Kita semua seolah -olah tahu bahawa psychobabble terdiri daripada pelbagai perbualan yang menggabungkan pelbagai terminologi psikologi dan sering akhirnya menjadi tidak dapat difahami atau sepenuhnya tidak masuk akal. Semua yang anda perlu lakukan untuk memuntahkan fo

Prototaip: saintis menjadikan kertas menjadi plastikPrototaip: saintis menjadikan kertas menjadi plastikApr 12, 2025 am 11:49 AM

Hanya 9.5% plastik yang dihasilkan pada tahun 2022 dibuat daripada bahan kitar semula, menurut satu kajian baru yang diterbitkan minggu ini. Sementara itu, plastik terus menumpuk di tapak pelupusan sampah -dan ekosistem -sekitar dunia. Tetapi bantuan sedang dalam perjalanan. Pasukan Engin

Kebangkitan Penganalisis AI: Mengapa ini boleh menjadi pekerjaan yang paling penting dalam Revolusi AIKebangkitan Penganalisis AI: Mengapa ini boleh menjadi pekerjaan yang paling penting dalam Revolusi AIApr 12, 2025 am 11:41 AM

Perbualan baru -baru ini dengan Andy Macmillan, Ketua Pegawai Eksekutif Platform Analytics Enterprise terkemuka Alteryx, menonjolkan peranan kritikal namun kurang dihargai ini dalam revolusi AI. Seperti yang dijelaskan oleh Macmillan, jurang antara data perniagaan mentah dan maklumat siap sedia

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna