Rumah >Peranti teknologi >AI >Menggunakan MaskFormer untuk imej dengan objek bertindih
Maskformer: merevolusikan segmentasi imej dengan perhatian topeng
Segmentasi imej, asas penglihatan komputer, manfaat daripada kemajuan dalam reka bentuk model. Maskformer menonjol sebagai pendekatan revolusioner, memanfaatkan mekanisme perhatian topeng untuk menangani cabaran untuk membahagikan objek bertindih-halangan penting untuk kaedah per-pixel tradisional. Artikel ini meneroka seni bina, pelaksanaan, dan aplikasi dunia Maskformer.
Model segmentasi imej tradisional sering berjuang dengan objek bertindih. Walau bagaimanapun, Maskformer menggunakan seni bina pengubah untuk mengatasi batasan ini. Walaupun model seperti R-CNN dan DETR menawarkan keupayaan yang sama, pendekatan unik MaskFormer menjamin peperiksaan yang lebih dekat.
Objektif Pembelajaran:
(Artikel ini adalah sebahagian daripada Blogathon Sains Data.)
Jadual Kandungan:
Apa itu Maskformer?
Maskformer cemerlang dalam kedua -dua segmentasi semantik dan contoh. Segmentasi semantik memberikan label kelas kepada setiap piksel, mengumpulkan objek yang sama bersama -sama. Segmentasi contoh, bagaimanapun, membezakan contoh individu kelas yang sama. Maskformer Uniquely mengendalikan kedua -dua jenis menggunakan pendekatan klasifikasi topeng bersatu. Pendekatan ini meramalkan label kelas dan topeng binari untuk setiap contoh objek, membolehkan topeng bertindih.
Senibina Model Maskformer
Maskformer menggunakan seni bina pengubah dengan struktur pengekod-decoder.
Rangkaian Neural Convolutional (CNN) Ekstrak Backbone Ciri -ciri Imej (F). Decoder piksel menghasilkan embeddings per-pixel (E), menangkap konteks tempatan dan global. Decoder pengubah menghasilkan per-segmen embeddings (q), melokalisasi contoh objek yang berpotensi. Produk titik piksel dan embedding topeng, diikuti oleh pengaktifan sigmoid, menghasilkan topeng binari. Untuk segmentasi semantik, topeng dan label kelas ini digabungkan melalui pendaraban matriks. Ini berbeza daripada transformer tradisional, di mana tulang belakang bertindak sebagai pengekod.
Menjalankan model
Bahagian bahagian ini menjalankan kesimpulan menggunakan Perpustakaan Transformers Face Hugging.
Mengimport perpustakaan:
Dari Transformers Import MaskformerFeatureExtractor, MaskformerForInStanceEgmentation dari gambar import pil permintaan import
Memuatkan model pra-terlatih:
Feature_Extractor = MaskFormerFeatureExtractor.from_pretrained ("facebook/maskformer-swin-base-coco") Model = MaskformerForInStanceseGmentation.From_pretrained ("Facebook/Maskformer-Swin-Base-Coco")
Penyediaan Imej:
url = "https://images.pexels.com/photos/5079180/pexels-photo-5079180.jpeg" image = image.open (requests.get (url, stream = true) .raw) input = feature_extractor (imej = imej, return_tensors = "pt")
Kesimpulan Model:
output = model (** input) class_queries_logits = outputs.class_queries_logits Masks_queries_logits = outputs.masks_queries_logits
Hasil Visualisasi:
hasil = feature_extractor.post_process_panoptic_segmentation (output, target_sizes = [image.size [::-1]) [0] Ramalan_panoptic_map = hasil ["Segmentation"] obor import import matplotlib.pyplot sebagai PLT PLT.IMSHOW (Ramalan_Panoptic_map) plt.axis ('off') plt.show ()
Aplikasi Dunia Sebenar MaskFormer
Maskformer mencari aplikasi dalam pelbagai bidang:
Kesimpulan
Pendekatan inovatif Maskformer untuk segmentasi imej, terutamanya pengendalian objek bertindih, menjadikannya alat yang berkuasa. Kepelbagaiannya merentasi tugas segmentasi semantik dan contohnya meletakkannya sebagai kemajuan yang signifikan dalam penglihatan komputer.
Sumber:
Takeaways Kunci:
Soalan Lazim:
Q1. Apa yang membezakan Maskformer dari model segmentasi tradisional? A. Mekanisme perhatian topeng dan seni bina pengubah membolehkan pengendalian yang lebih baik daripada objek bertindih.
S2. Adakah Maskformer mengendalikan kedua -dua segmentasi semantik dan contoh? A. Ya, ia cemerlang pada kedua -duanya.
Q3. Industri mana yang mendapat manfaat daripada Maskformer? A. Penjagaan kesihatan, analisis geospatial, dan keselamatan adalah benefisiari utama.
Q4. Bagaimanakah MaskFormer menjana imej tersegmentasi akhir? A. Dengan menggabungkan topeng binari dan label kelas melalui pendaraban matriks.
(Nota: Imej yang digunakan tidak dimiliki oleh penulis dan digunakan dengan kebenaran.)
Atas ialah kandungan terperinci Menggunakan MaskFormer untuk imej dengan objek bertindih. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!