cari
RumahJavajavaTutorialBagaimanakah ekspresi biasa Java dengan cekap mengekstrak URL tertentu dalam teks HTML?

Java Ekspresi Biasa Cecair Ekstrak URL HTML: Panduan Praktikal

Artikel ini akan menunjukkan bagaimana untuk mengekstrak URL tertentu dari teks HTML menggunakan ungkapan biasa Java. Kami akan menggunakan contoh untuk menggambarkan bagaimana untuk mencapai tugas ini dengan cekap.

Bagaimanakah ekspresi biasa Java dengan cekap mengekstrak URL tertentu dalam teks HTML?

Soalan: Ekstrak semua URL bermula dengan "www." dan berakhir dengan ".com" atau ".cn" dari teks html.

Contoh HTML (termasuk URL):

 <a>www.baidu.com</a> <a>www.qq.com</a> <a>www.aaa.cn</a> www.eee.cn

Kod Java dan ungkapan biasa:

Kami menggunakan ungkapan biasa www\.\w (\.com|\.cn) untuk memadankan url. \w sepadan dengan satu atau lebih aksara alfanumerik, \. Memadankan nombor titik (memerlukan melarikan diri), ( ) digunakan untuk perlawanan kumpulan ".com" atau ".cn".

 String html = " <a>www.baidu.com</a> <a>www.qq.com</a> <a>www.aaa.cn</a> www.eee.cn";
String reg = "www \\. \\ w (\\. Com | \\. Cn)"; // Perhatikan bahawa anda perlu melepaskan corak corak backslash = corak.comPile (reg, corak.case_insensitive);
Matcher matcher = corak.matcher (html);

sementara (matcher.find ()) {
    System.out.println (matcher.group ());
}

Hasil yang berjalan:

 <code>www.baidu.com www.qq.com www.aaa.cn www.eee.cn</code>

Penerangan Kod:

  1. Pattern.compile(reg, Pattern.CASE_INSENSITIVE) : Menyusun ungkapan biasa, bendera CASE_INSENSITIVE menjadikan perlawanan kes-insensitif.
  2. pattern.matcher(html) : Mewujudkan objek Matcher untuk mencari perlawanan dalam teks HTML.
  3. matcher.find() : Cari perlawanan seterusnya.
  4. matcher.group() : Mengembalikan substring yang sepadan.

Petua Penting:

Untuk struktur HTML yang kompleks, parsing menggunakan ungkapan biasa mungkin tidak cukup dipercayai dan kesilapan terdedah kepada berlaku. Untuk parsing HTML yang lebih kompleks, adalah disyorkan untuk menggunakan perpustakaan parser HTML profesional, seperti JSOUP, untuk memastikan ketepatan dan kestabilan parsing. Contoh ini hanya digunakan untuk menunjukkan penggunaan asas ekspresi biasa.

Atas ialah kandungan terperinci Bagaimanakah ekspresi biasa Java dengan cekap mengekstrak URL tertentu dalam teks HTML?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Bagaimanakah subsistem loader kelas dalam JVM menyumbang kepada kebebasan platform?Bagaimanakah subsistem loader kelas dalam JVM menyumbang kepada kebebasan platform?Apr 23, 2025 am 12:14 AM

Loader kelas memastikan konsistensi dan keserasian program Java pada platform yang berbeza melalui format fail kelas bersatu, pemuatan dinamik, model delegasi induk dan bytecode bebas platform, dan mencapai kemerdekaan platform.

Adakah pengkompil Java menghasilkan kod khusus platform? Menjelaskan.Adakah pengkompil Java menghasilkan kod khusus platform? Menjelaskan.Apr 23, 2025 am 12:09 AM

Kod yang dihasilkan oleh pengkompil Java adalah platform bebas, tetapi kod yang akhirnya dilaksanakan adalah platform khusus. 1. Kod sumber Java disusun ke dalam bytecode bebas platform. 2. JVM menukar bytecode ke dalam kod mesin untuk platform tertentu, memastikan operasi silang platform tetapi prestasi mungkin berbeza.

Bagaimanakah JVM mengendalikan multithreading pada sistem operasi yang berbeza?Bagaimanakah JVM mengendalikan multithreading pada sistem operasi yang berbeza?Apr 23, 2025 am 12:07 AM

Multithreading adalah penting dalam pengaturcaraan moden kerana ia dapat meningkatkan respons program dan penggunaan sumber dan mengendalikan tugas serentak yang kompleks. JVM memastikan konsistensi dan kecekapan multithreads pada sistem operasi yang berbeza melalui pemetaan benang, mekanisme penjadualan dan mekanisme kunci penyegerakan.

Apakah maksud 'kemerdekaan platform' dalam konteks Java?Apakah maksud 'kemerdekaan platform' dalam konteks Java?Apr 23, 2025 am 12:05 AM

Kemerdekaan platform Java bermaksud bahawa kod yang ditulis boleh dijalankan di mana -mana platform dengan JVM dipasang tanpa pengubahsuaian. 1) Kod sumber Java dikumpulkan ke dalam bytecode, 2) bytecode ditafsirkan dan dilaksanakan oleh JVM, 3) JVM menyediakan fungsi pengurusan memori dan pengumpulan sampah untuk memastikan program berjalan pada sistem operasi yang berbeza.

Bolehkah aplikasi Java masih menghadapi pepijat atau isu khusus platform?Bolehkah aplikasi Java masih menghadapi pepijat atau isu khusus platform?Apr 23, 2025 am 12:03 AM

JavaapplicationscanIndeedencounterplatform-specificissuesdespitethejvm'sabstraction.reasonsinclude: 1) nativecodeandlibraries, 2) operatingsystemdifferences, 3) jvmimplementationsvariations

Bagaimanakah pengkomputeran awan mempengaruhi kepentingan kemerdekaan platform Java?Bagaimanakah pengkomputeran awan mempengaruhi kepentingan kemerdekaan platform Java?Apr 22, 2025 pm 07:05 PM

Pengkomputeran awan dengan ketara meningkatkan kemerdekaan platform Java. 1) Kod Java dikumpulkan ke dalam bytecode dan dilaksanakan oleh JVM pada sistem operasi yang berbeza untuk memastikan operasi silang platform. 2) Gunakan Docker dan Kubernet untuk menggunakan aplikasi Java untuk meningkatkan kebolehgunaan dan skalabiliti.

Apakah peranan yang dimainkan oleh kemerdekaan platform Java dalam penggunaannya yang meluas?Apakah peranan yang dimainkan oleh kemerdekaan platform Java dalam penggunaannya yang meluas?Apr 22, 2025 pm 06:53 PM

Java'splatformindependenceallowsdeveloperstowritecodeonceandrunitonanydeviceorOSwithaJVM.Thisisachievedthroughcompilingtobytecode,whichtheJVMinterpretsorcompilesatruntime.ThisfeaturehassignificantlyboostedJava'sadoptionduetocross-platformdeployment,s

Bagaimanakah teknologi kontena (seperti Docker) mempengaruhi kepentingan kemerdekaan platform Java?Bagaimanakah teknologi kontena (seperti Docker) mempengaruhi kepentingan kemerdekaan platform Java?Apr 22, 2025 pm 06:49 PM

Teknologi kontena seperti Docker meningkatkan daripada menggantikan kemerdekaan platform Java. 1) Memastikan konsistensi di seluruh persekitaran, 2) Menguruskan kebergantungan, termasuk versi JVM tertentu, 3) memudahkan proses penempatan untuk menjadikan aplikasi Java lebih mudah disesuaikan dan boleh diurus.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini