Rumah  >  Artikel  >  Peranti teknologi  >  Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

PHPz
PHPzke hadapan
2023-10-20 18:45:041126semak imbas

Di ICDAR 2023, acara teratas dalam bidang pengecaman teks global (OCR), pasukan OCR Tencent memenangi empat kejuaraan berdasarkan algoritma yang dibangunkan sendiri Ini adalah kali keempat berturut-turut menyertai persidangan itu dan mencapai keputusan yang baik sejak 2017, 2019, dan 2021. Sebanyak 18 kejohanan pensijilan rasmi telah dimenangi, menunjukkan tahap teknologi OCR Tencent bertaraf dunia.

Persidangan ICDAR ialah persidangan akademik berwibawa yang diiktiraf dalam bidang analisis dan pengiktirafan imej dokumen global Ia diadakan setiap dua tahun Acara ini telah menarik hampir 8,000 pasukan dari lebih 100 negara untuk menyertai. Pertandingan ICDAR terkenal di dalam dan luar negara kerana kesukaran teknikalnya yang sangat tinggi dan kepraktisan yang kukuh Tidak seperti kedudukan tidak formal selepas permainan, pertandingan rasmi yang disahkan secara rasmi oleh ICDAR menggunakan set data baharu, dan maklumat serta maklumat pasukan yang mengambil bahagian. tidak diumumkan semasa pertandingan, sambil mengehadkan masa dan bilangan penyerahan keputusan, adalah "menaip buta" yang sangat sukar.

Tahun ini, pasukan Tencent OCR dianggotai bersama oleh Jabatan Platform Data Tencent dan Jabatan Seni Bina Teknologi WeChat Ia memberi tumpuan untuk menyertai dua pertandingan utama DSText (Pengiktirafan Teks Video Teks Kecil) dan SVRD (Pengestrakan Maklumat Berstruktur). dan mencapai kejuaraan trek 4 A.

Trek DSText, Tencent memenangi kesemua dua kejohanan

Pertandingan DSText (Pengecaman Teks Video Teks Kecil Padat) menyediakan dua tugas: penjejakan teks video dan pengecaman hujung-ke-hujung teks video. Oleh kerana teksnya sangat padat dan sangat kecil, ditambah pula dengan gangguan persekitaran (goncangan kamera, kabur gerakan, perubahan pencahayaan, dll.) dan pasca penyuntingan (pemotongan skrin berbilang kanta, latar belakang tiruan, penukaran antara muka permainan, dll.), ia adalah sukar untuk dikesan dan dijejak dengan tepat daripada bingkai video , Mengecam teks memerlukan keteguhan tinggi algoritma dan amat mencabar. Beberapa bingkai video pertandingan ditunjukkan di bawah:

Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

Bingkai skema pertandingan ICDAR-DSText

Dalam kesemua 2 tugasan pertandingan DSText, pasukan Tencent OCR memenangi kejuaraan dengan pendahuluan mutlak.

Antaranya, Tugasan 1 menyasarkan untuk menjejaki semua strim teks dalam video dan mengagregatkan bingkai pengesanan yang dimiliki oleh contoh teks yang sama antara bingkai video Penunjuk penilaian ialah Tencent mendahului tempat kedua dengan 12.04%.

Penjejakan Teks Video: Sijil KejohananPasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

Dalam Tugasan 2, direka untuk menilai prestasi pengiktirafan teks video secara menyeluruh, tugas itu memerlukan pengesanan teks yang betul pada setiap bingkai, penjejakan yang betul pada bingkai video dan penjejakan yang betul pada tahap urutan Pengenalan yang betul, indeks penilaian ialah OCR-MOTA, Tencent memenangi kejuaraan dengan

mendahului tempat kedua sebanyak 11.93%.

Teks video pengiktirafan hujung ke hujung: Sijil kejohananPasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

Trek SVRD, Tencent memenangi dua kejuaraan dengan kelebihan mutlak

SVRD (Pengekstrakan Maklumat Berstruktur) pertandingan termasuk dua trek utama, HUST-CELL dan BAIDU-FEST 4 tugasan: Pengekstrakan perhubungan entiti dokumen kompleks (Pemautan Entiti Kompleks E2E), pengekstrakan semantik entiti dokumen kompleks (Pelabelan Entiti Kompleks E2E), pengekstrakan maklumat berstruktur sifar (E2E Pengekstrakan Teks Berstruktur Sifar) dan pengekstrakan maklumat berstruktur sampel kecil ( Pengekstrakan Teks Berstruktur Sedikit Tangkapan). Oleh kerana susun atur yang kompleks dan struktur imej dokumen yang pelbagai, koleksi imej pemandangan semula jadi yang tidak teratur, latar belakang yang kompleks, pecah, lentur, ubah bentuk dan masalah lain, persaingan agak mencabar. Beberapa gambar pertandingan ditunjukkan di bawah:

Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

Contoh Pertandingan Pengekstrakan Maklumat Berstruktur ICDAR-SVRD

Dalam pertandingan SVRD, pasukan Tencent OCR memenangi sejumlah 2 kejuaraan.

Antaranya, Tugasan 2 (Pelabelan Entiti Kompleks E2E) bertujuan untuk mengekstrak entiti semantik pada imej dokumen yang kompleks, seperti tajuk, nama organisasi, tarikh, jumlah, nombor, nama produk, nama peribadi, dll. Tencent mempunyai kelebihan yang besar dalam tugas ini Memenangi kejuaraan

Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

E2E Pelabelan Entiti Kompleks: Sijil Kejohanan

Tugas 4 (E2E Few-shot Structured Text Extraction) Soalan pertandingan memerlukan pengekstrakan imej dalam 10 senario berbeza di bawah premis menyediakan yang sangat kecil jumlah data latihan Untuk maklumat penting, seperti kad bank, lesen perniagaan, invois teksi, resit beli-belah, invois pengangkutan, invois jumlah tetap, kertas, dsb., Tencent juga memenangi kejuaraan.

Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR

E2E Few-shot Structured Text Extraction: Sijil Juara

Menurut laporan, pasukan Tencent OCR ialah pasukan profesional dalam Tencent yang berdedikasi untuk menyelidik dan membangunkan teknologi OCR secara bebas Teknologi pengesanan dan pengecaman teks unik menyokong ratusan senario perniagaan dalam Tencent, seperti pengiklanan Tencent, WeChat, QQ, Tencent Cloud, Tencent Video dan produk aliran maklumat Tencent.

Atas ialah kandungan terperinci Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:jiqizhixin.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam