cari
RumahPeranti teknologiAIAlgoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Apr 12, 2023 am 10:37 AM
pembelajaran yang mendalammodel bersepadu

Penterjemah |. Zhu Xianzhong

Sun Shujuan

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Gambar 1 : Muka depan projek Iluminado yang direka oleh pengarang asal sendiri

Pada tahun 2019, Pertubuhan Kesihatan Sedunia menganggarkan terdapat kira-kira 2.2 bilion orang cacat penglihatan di dunia, yang mana sekurang-kurangnya 1 bilion boleh dicegah atau masih mengalami masalah penglihatan. Apabila bercakap tentang penjagaan mata, dunia menghadapi banyak cabaran, termasuk ketidaksamaan dalam liputan dan kualiti perkhidmatan pencegahan, terapeutik dan pemulihan. Terdapat kekurangan kakitangan penjagaan mata terlatih dan perkhidmatan penjagaan mata kurang disepadukan ke dalam sistem kesihatan utama. Matlamat saya adalah untuk memberi inspirasi kepada tindakan untuk menangani cabaran ini bersama-sama. Projek yang dibentangkan dalam artikel ini adalah sebahagian daripada Iluminado, projek batu penjuru sains data semasa saya.

Matlamat Reka Bentuk Projek Capstone

Tujuan mencipta projek ini adalah untuk melatih model ensemble pembelajaran mendalam, dan akhirnya menjadikannya sangat mudah untuk keluarga berpendapatan rendah untuk melaksanakan model ini tersedia, dan diagnosis risiko penyakit awal boleh dilakukan dengan kos yang rendah. Dengan menggunakan prosedur model saya, pakar oftalmologi boleh menentukan sama ada campur tangan segera diperlukan berdasarkan fotografi fundus retina.

Sumber set data projek

OphthAI menyediakan set data imej pelbagai penyakit fundus (Retinal Fundus Multi-Disease Image Dataset, dirujuk sebagai "RFMiD") tersedia secara umum set data imej, set data ini mengandungi 3200 imej fundus yang ditangkap oleh tiga kamera fundus berbeza dan dijelaskan oleh dua pakar retina kanan berdasarkan konsensus yang diputuskan.

Imej ini diekstrak daripada beribu-ribu pemeriksaan yang dilakukan sepanjang 2009-2010, dengan pilihan kedua-dua imej berkualiti tinggi dan agak sedikit kualiti rendah, menjadikan Set Data lebih mencabar.

Set data dibahagikan kepada tiga bahagian, termasuk set latihan (60% atau 1920 imej), set penilaian (20% atau 640 imej) dan set ujian (20% dan 640 foto ). Secara purata, perkadaran orang yang mempunyai penyakit dalam set latihan, set penilaian dan set ujian masing-masing adalah 60±7%, 20±7% dan 20±5%. Tujuan asas set data ini adalah untuk menangani pelbagai penyakit mata yang timbul dalam amalan klinikal harian, dengan sejumlah 45 kategori penyakit/patologi dikenal pasti. Label ini boleh didapati dalam tiga fail CSV, iaitu RFMiD_Training_Labels.CSV, RFMiD_Validation_Labels.SSV dan RFMiD_Testing_Labels.CSV.

Sumber imej

Imej di bawah diambil menggunakan alat yang dipanggil kamera fundus. Kamera fundus ialah mikroskop berkuasa rendah khusus yang dipasang pada kamera denyar yang digunakan untuk mengambil gambar fundus, lapisan retina di bahagian belakang mata.

Kini, kebanyakan kamera fundus adalah pegang tangan, jadi pesakit hanya perlu melihat terus ke dalam kanta. Antaranya, bahagian kilat yang terang menunjukkan bahawa imej fundus telah diambil.

Kamera pegang tangan mempunyai kelebihannya kerana ia boleh dibawa ke lokasi yang berbeza dan boleh menempatkan pesakit berkeperluan khas, seperti pengguna kerusi roda. Selain itu, mana-mana pekerja yang mempunyai latihan yang diperlukan boleh mengendalikan kamera, membolehkan pesakit diabetes yang kurang mendapat perkhidmatan membuat pemeriksaan tahunan mereka dengan cepat, selamat dan cekap.

Situasi fotografi sistem pengimejan retina fundus:

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 2: Imej yang diambil berdasarkan ciri visual masing-masing : (a) retinopati diabetik (DR), (b) degenerasi makula berkaitan usia (ARMD) dan (c) jerebu sederhana (MH).

Di manakah diagnosis akhir dilakukan?

Proses saringan awal boleh dibantu dengan pembelajaran mendalam, tetapi diagnosis akhir dibuat oleh pakar oftalmologi menggunakan pemeriksaan slit lamp.

Proses ini juga dikenali sebagai diagnosis biomikroskopik, dan ia melibatkan pemeriksaan sel hidup. Doktor boleh melakukan pemeriksaan mikroskopik untuk menentukan sama ada terdapat sebarang kelainan pada mata pesakit.

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 3: Ilustrasi pemeriksaan lampu celah

Aplikasi pembelajaran mendalam dalam pengelasan imej retina

Berbeza daripada algoritma pembelajaran mesin tradisional, neural Konvolusi yang mendalam rangkaian (CNN) boleh menggunakan model berbilang lapisan untuk mengekstrak dan mengelaskan ciri secara automatik daripada data mentah.

Baru-baru ini, komuniti akademik telah menerbitkan sejumlah besar artikel mengenai penggunaan rangkaian neural convolutional (CNN) untuk mengenal pasti pelbagai penyakit mata, seperti retinopati diabetik dan hasil yang tidak normal (AUROC) >0.9) glaukoma, dsb.

Metrik Data

Skor AUROC meringkaskan keluk ROC kepada nombor yang menerangkan prestasi model apabila mengendalikan berbilang ambang serentak. Perlu diingat bahawa skor AUROC 1 mewakili skor sempurna, manakala skor AUROC 0.5 sepadan dengan tekaan rawak.

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 4: Perwakilan skematik keluk ROC

Kaedah yang digunakan - fungsi kehilangan entropi silang

Entropi silang sering digunakan sebagai fungsi kehilangan dalam pembelajaran mesin. Entropi silang ialah metrik dalam bidang teori maklumat yang membina definisi entropi dan biasanya digunakan untuk mengira perbezaan antara dua taburan kebarangkalian, manakala entropi silang boleh dianggap sebagai mengira jumlah entropi antara dua taburan.

Entropi silang juga berkaitan dengan kehilangan logistik, yang dipanggil kerugian logaritma. Walaupun kedua-dua ukuran ini datang daripada sumber yang berbeza, apabila digunakan sebagai fungsi kerugian untuk model klasifikasi, kedua-dua kaedah mengira kuantiti yang sama dan boleh digunakan secara bergantian.

(Untuk butiran khusus, sila rujuk: https://machinelearningmastery.com/logistic-regression-with-maximum-likelihood-estimation/)

Apakah itu cross-entropy ?

Entropi silang ialah ukuran perbezaan antara dua taburan kebarangkalian untuk set pembolehubah rawak atau peristiwa tertentu. Anda mungkin ingat bahawa maklumat mengukur bilangan bit yang diperlukan untuk mengekod dan menghantar peristiwa. Peristiwa berkemungkinan rendah cenderung mengandungi lebih banyak maklumat, manakala peristiwa berkemungkinan tinggi mengandungi kurang maklumat.

Dalam teori maklumat, kami suka menerangkan "kejutan" sesuatu peristiwa. Semakin kecil kemungkinan sesuatu peristiwa itu berlaku, semakin mengejutkannya, yang bermaksud ia mengandungi lebih banyak maklumat.

  • Peristiwa kebarangkalian rendah (mengejutkan): maklumat lanjut.
  • Peristiwa kebarangkalian tinggi (tidak mengejutkan): kurang maklumat.

Memandangkan kebarangkalian kejadian P(x), maklumat h(x) boleh dikira untuk peristiwa x, seperti berikut:

h(x) = -log(P(x))

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 4: Ilustrasi sempurna (Sumber imej: Vlastimil Martinek)

Entropi diperoleh daripada taburan kebarangkalian Bilangan bit diperlukan untuk menghantar acara yang dipilih secara rawak. Taburan condong mempunyai entropi yang lebih rendah, manakala taburan dengan kebarangkalian kejadian yang sama umumnya mempunyai entropi yang lebih tinggi.

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 5: Ilustrasi sempurna nisbah sasaran kepada kebarangkalian yang diramalkan (Sumber imej: Vlastimil Martinek)

Taburan kebarangkalian yang condong mempunyai "kejutan" yang lebih sedikit dan seterusnya mempunyai entropi yang lebih rendah kerana kemungkinan peristiwa mendominasi. Secara relatifnya, taburan keseimbangan adalah lebih mengejutkan dan mempunyai entropi yang lebih tinggi kerana peristiwa itu berkemungkinan sama berlaku.

  • Taburan kebarangkalian serong (tidak mengejutkan): entropi rendah.
  • Taburan kebarangkalian keseimbangan (mengejutkan): entropi tinggi.

Entropi H(x) boleh dikira untuk pembolehubah rawak dengan set x keadaan diskret x dan kebarangkaliannya P(x), seperti yang ditunjukkan dalam rajah di bawah:

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 6: Formula rentas entropi pelbagai peringkat (Sumber imej: Vlastimil Martinek)

Pengkelasan berbilang kategori - kami gunakan Entropi silang kategori ialah kes aplikasi khusus bagi entropi silang di mana sasaran menggunakan skema vektor pengekodan satu panas. (Pembaca yang berminat boleh merujuk artikel Vlastimil Martinek)

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 7: Gambar rajah penguraian sempurna pengiraan kehilangan panda dan kucing (Sumber imej: Vlastimil Martinek)

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 8: Penguraian sempurna bagi nilai kerugian 1 (Sumber imej: Vlastimil Martinek)

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 9: Penguraian sempurna bagi nilai kehilangan Rajah 2 (Sumber imej: Vlastimil Martinek)

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 9: Visual perwakilan tentang kebarangkalian dan kerugian (Sumber imej: Vlastimil Martinek)

Bagaimana pula dengan entropi silang binari?

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 10: Ilustrasi formula rentas entropi kategori (Sumber imej: Vlastimil Martinek)

Dalam kami projek Kami memilih untuk menggunakan klasifikasi binari - skema silang entropi binari, iaitu, skema silang entropi dengan sasaran 0 atau 1. Jika kita menukar sasaran kepada vektor pengekodan panas masing-masing [0,1] atau [1,0] dan meramalkan, maka kita boleh menggunakan formula entropi silang untuk mengira.

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 11: Ilustrasi formula pengiraan entropi silang binari (Sumber imej: Vlastimil Martinek)

Gunakan Kehilangan asimetri algoritma mengendalikan data tidak seimbang

Dalam persekitaran model berbilang label biasa, ciri set data mungkin mempunyai bilangan label positif dan negatif yang tidak seimbang. Pada ketika ini, kecenderungan set data untuk memihak kepada label negatif mempunyai pengaruh yang dominan pada proses pengoptimuman dan akhirnya membawa kepada kurang penekanan kecerunan label positif, sekali gus mengurangkan ketepatan keputusan ramalan.

Ini betul-betul situasi yang dihadapi oleh set data yang saya gunakan sekarang.

Algoritma kehilangan asimetri yang dibangunkan oleh BenBaruch et al (rujuk Rajah 12) digunakan dalam projek ini. Ini adalah kaedah untuk menyelesaikan klasifikasi berbilang label, tetapi terdapat juga yang serius masalah dalam kategori situasi pengagihan tidak seimbang.

Cara yang saya fikirkan ialah mengurangkan berat bahagian label negatif dengan mengubah suai komponen positif dan negatif entropi silang secara tidak simetri, dan akhirnya menyerlahkan positif yang dinyatakan di atas label yang lebih sukar diproses.

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 12: Algoritma pengelasan berbilang label asimetri (2020, pengarang: Ben-Baruch et al.)

Untuk Diuji seni bina

Untuk meringkaskan, projek ini menggunakan seni bina yang ditunjukkan dalam rajah:

Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina

Rajah 13 (Sumber gambar: Sixu)

Algoritma utama yang digunakan dalam seni bina di atas terutamanya termasuk:

  • DenseNet-121
  • InceptionV3
  • >Selain itu, kandungan berkaitan algoritma yang dinyatakan di atas pasti akan dikemas kini selepas saya menyiapkan projek Capstone artikel ini! Pembaca yang berminat sila nantikan!
  • Pengenalan penterjemah
  • Zhu Xianzhong, editor komuniti 51CTO, blogger pakar 51CTO, pensyarah, guru komputer di sebuah universiti di Weifang dan seorang veteran dalam industri pengaturcaraan bebas.
Tajuk asal:

Pembelajaran Ensemble Mendalam untuk Klasifikasi Imej Retina (CNN)

, oleh Cathy Kam

Atas ialah kandungan terperinci Algoritma pembelajaran ensemble mendalam untuk pengelasan imej retina. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajariApr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let ’

Memasak Inovasi: Bagaimana Kecerdasan Buatan Mengubah Perkhidmatan MakananMemasak Inovasi: Bagaimana Kecerdasan Buatan Mengubah Perkhidmatan MakananApr 12, 2025 pm 12:09 PM

AI Menambah Penyediaan Makanan Walaupun masih dalam penggunaan baru, sistem AI semakin digunakan dalam penyediaan makanan. Robot yang didorong oleh AI digunakan di dapur untuk mengautomasikan tugas penyediaan makanan, seperti membuang burger, membuat pizza, atau memasang SA

Panduan Komprehensif mengenai Python Namespaces & Variable ScopesPanduan Komprehensif mengenai Python Namespaces & Variable ScopesApr 12, 2025 pm 12:00 PM

Pengenalan Memahami ruang nama, skop, dan tingkah laku pembolehubah dalam fungsi Python adalah penting untuk menulis dengan cekap dan mengelakkan kesilapan runtime atau pengecualian. Dalam artikel ini, kami akan menyelidiki pelbagai ASP

Panduan Komprehensif untuk Model Bahasa Visi (VLMS)Panduan Komprehensif untuk Model Bahasa Visi (VLMS)Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

MediaTek meningkatkan barisan premium dengan Kompanio Ultra dan Dimensity 9400MediaTek meningkatkan barisan premium dengan Kompanio Ultra dan Dimensity 9400Apr 12, 2025 am 11:52 AM

Meneruskan irama produk, bulan ini MediaTek telah membuat satu siri pengumuman, termasuk Kompanio Ultra dan Dimensity 9400 yang baru. Produk ini mengisi bahagian perniagaan MediaTek yang lebih tradisional, termasuk cip untuk telefon pintar

Minggu ini di AI: Walmart menetapkan trend fesyen sebelum mereka pernah berlakuMinggu ini di AI: Walmart menetapkan trend fesyen sebelum mereka pernah berlakuApr 12, 2025 am 11:51 AM

#1 Google melancarkan Agent2Agent Cerita: Ia Isnin pagi. Sebagai perekrut berkuasa AI, anda bekerja lebih pintar, tidak lebih sukar. Anda log masuk ke papan pemuka syarikat anda di telefon anda. Ia memberitahu anda tiga peranan kritikal telah diperolehi, dijadualkan, dan dijadualkan untuk

AI Generatif Bertemu PsychobabbleAI Generatif Bertemu PsychobabbleApr 12, 2025 am 11:50 AM

Saya akan meneka bahawa anda mesti. Kita semua seolah -olah tahu bahawa psychobabble terdiri daripada pelbagai perbualan yang menggabungkan pelbagai terminologi psikologi dan sering akhirnya menjadi tidak dapat difahami atau sepenuhnya tidak masuk akal. Semua yang anda perlu lakukan untuk memuntahkan fo

Prototaip: saintis menjadikan kertas menjadi plastikPrototaip: saintis menjadikan kertas menjadi plastikApr 12, 2025 am 11:49 AM

Hanya 9.5% plastik yang dihasilkan pada tahun 2022 dibuat daripada bahan kitar semula, menurut satu kajian baru yang diterbitkan minggu ini. Sementara itu, plastik terus menumpuk di tapak pelupusan sampah -dan ekosistem -sekitar dunia. Tetapi bantuan sedang dalam perjalanan. Pasukan Engin

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

EditPlus versi Cina retak

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

Dreamweaver Mac版

Dreamweaver Mac版

Alat pembangunan web visual