Rumah > Artikel > Peranti teknologi > Kesan reka bentuk LOGO AI percuma sangat mengagumkan, Lei Jun membelanjakan 2 juta terlalu awal
Tidak lama kemudian, Stable Diffusion telah ditemui untuk tujuan baharu -
"Gabungan bentuk dan makna" yang paling kritikal dalam mereka bentuk LOGO jelas difahami olehnya. Saya melihat Kucing melukis kepala kucing dalam beberapa saat:
Huruf YOGA di kedai yoga telah diubah menjadi bentuk manusia, dan gayanya betul-betul betul:
Walaupun berdepan dengan fon Cina, AI boleh memahami maksud dengan baik dan dengan pantas melukis imej LOGO yang ingin disampaikan oleh Pihak A: Jika anda buka kedai dan guna ni, kenapa perlu berbelanja berpuluh atau ratusan ringgit untuk design LOGO? (doge) Walaupun sudah banyak AI yang mereka LOGO sebelum ini, jika dilihat dari kesan yang dijana kali ini, ia memang agak berbeza. Kekalkan sebahagian daripada perisa fon asalMalah, sebelum kajian ini, sudah banyak kajian mempertimbangkan cara menggunakan AI untuk mereka bentuk LOGO.
Dari sudut kesan, ia boleh dibahagikan kepada tiga kategori:
Pertama ialah menggunakan fon sebagai sekatan bentuk untuk memindahkan gaya gambar (seperti yang ditunjukkan dalam Rajah AB) ; yang kedua ialah menggunakan gaya gambar sebagai asas, Pindahkan fon ke gambar (Rajah D, kaitkan bentuk dan fon gambar yang berbeza untuk menjana reka bentuk LOGO gaya "image splicing" berwarna atau hitam (Rajah CE); ).
Namun, jika dibandingkan dengan LOGO yang direka oleh manusia di bawah, kesan reka bentuk AI di atas tidak boleh dikatakan hodoh, tetapi nampaknya kurang sedikit. menarik:Selepas penyiasatan menyeluruh, penulis mendapati bahawa LOGO yang direka oleh manusia bukanlah "lucah".
Pereka bentuk manusia akan mengekalkan ciri fon asal supaya orang dapat mengenali perkataan itu sepintas lalu, dan kemudian menambah beberapa inovasi, seperti menukar J dalam Jazz kepada alat muzik, tetapi orang lain masih boleh mengenalinya sepintas lalu. Kenali bentuk fon "JAZZ". Secara amnya, ia adalah untuk mengekalkan sebahagian daripada "rasa" fon sambil menambah rasa reka bentuk tertentu. Contohnya, ini rekaan "FROG" yang dihasilkan oleh Stable Diffusion masih bentuk fon asal, cuma G jadi katak kecil melompat keluar:
Jika anda menggunakan Stable Diffusion 2 untuk pemprosesan pasca selanjutnya, anda boleh merealisasikan lagi fungsi pewarnaan dan kelihatan lebih jelas:
Gaya LOGO yang dihasilkan juga boleh berubah dengan perubahan fon reka bentuk asal.
Sebagai contoh, ini adalah LOGO yoga berbeza yang dijana dalam 8 fon, setiap gaya berbeza: Sebaliknya, model AI lain Apabila menjana fon, saya lebih suka mengekalkan gaya saya sendiri (kepala anjing manual):Jadi, bagaimana reka bentuk fon ajaib AI ini membuatnya?
Gunakan lengkung Bezier untuk melaraskan bentuk hurufUntuk mengekalkan gaya fon asal pada tahap tertentu dan hanya menukar huruf tertentu dalam perkataan, pengarang menghasilkan "denda -tala" Kaedah bentuk huruf -adalah untuk membiarkan AI belajar menggunakan lengkung Bezier untuk mengubah bentuk sedikit huruf dalam fon yang berbeza.
(Rakan-rakan yang telah menggunakan "pen" dalam PS sepatutnya biasa dengan lengkung Bezier. Gunakannya untuk mengawal tetikus untuk melukis beberapa lengkung ajaib)
Bilangan titik kawalan tertentu akan diubah secara berulang mengikut kerumitan huruf dan gaya fon sehingga huruf yang direka bentuk memenuhi keperluan Jingga ialah titik awal dan biru ialah titik kawalan seterusnya ditambah:
Berapa besar pengaruh bilangan titik kawalan terhadap kesan penjanaan?
Sebagai contoh, ini adalah kesan menggunakan nombor titik kawalan yang berbeza untuk menjana huruf Jika nombor terlalu kecil, bentuk imej yang direka akan menjadi tidak jelas tetapi jika nombor itu terlalu besar, ia akan mudah memutarbelitkan bentuk asal fon:
Berdasarkan idea reka bentuk teras ini, pengarang menggabungkan Stable Diffusion dan CLIP untuk mereka bentuk keseluruhan reka bentuk fon model AI:
Antaranya, fungsi kehilangan ACAP (sekonformal mungkin) adalah berdasarkan algoritma triangulasi Delaunay, yang mengekang lagi bentuk huruf.
Sebagai contoh, ini adalah bentuk SELUAR (seluar) sebelum dan selepas ubah bentuk Anda boleh melihat bahawa ACAP mengekalkan bentuk seluar sambil mengekalkan kesan fon:
<.>
Pada masa yang sama, bagi mengekalkan lagi bentuk fon, penulis menggunakan penapis laluan rendah untuk memastikan huruf yang dilaraskan tidak terlalu menyimpang daripada huruf asal. Contohnya, ini ialah bentuk pelarasan B dalam Beruang: Mengaplikasikan model ini, kelajuan menjana setiap huruf tidaklah buruk. Pada GPU RTX 2080, ia mengambil masa kira-kira 5 minit untuk menghasilkan reka bentuk LOGO satu huruf. Pengenalan kepada pengarangWalaupun kertas yang disiarkan oleh pengarang di laman utama projek adalah tanpa nama: Tetapi pada arXiv, pengarang Nama mereka telah didedahkan Mereka adalah dari Universiti Tel Aviv, Universiti Reichman dan Tukang Emas, Universiti London: Pengarang bersama Shir Iluz, Sarjana Sains dalam Elektronik dan Kejuruteraan Elektrik dari Universiti Tel Aviv Hala tuju penyelidikannya sekarang ialah AI generatif, dan bidang minatnya ialah pembelajaran mendalam dan penglihatan komputer. Pengarang bersama Yael Vinker, pelajar kedoktoran dalam visi komputer di Universiti Tel Aviv, menerima ijazah sarjana muda dan sarjana dalam sains komputer dari Universiti Hebrew of Israel hala tuju penyelidikan juga adalah dalam pembelajaran mendalam dan Visi Komputer. Nampaknya 2 juta yuan yang dibelanjakan Lei Jun untuk mereka bentuk LOGO Xiaomi telah dibelanjakan terlalu awal Alamat tesis: https://arxiv.org /abs /2303.01818Alamat projek: https://wordasimage.github.io/Word-As-Image-Page/Atas ialah kandungan terperinci Kesan reka bentuk LOGO AI percuma sangat mengagumkan, Lei Jun membelanjakan 2 juta terlalu awal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!