cari
RumahJavajavaTutorialBagaimana untuk Mengekalkan Pemisah Baris Apabila Menukar HTML kepada Teks Menggunakan Jsoup?

How to Preserve Line Breaks When Converting HTML to Text Using Jsoup?

Memelihara Pemisah Baris dalam Penukaran HTML-ke-Teks Menggunakan Jsoup

Apabila menukar HTML kepada teks biasa menggunakan jsoup, mengekalkan pemisah baris boleh penting untuk mengekalkan kebolehbacaan dan struktur output. Secara lalai, kaedah text() jsoup tidak mengekalkan pemisah baris yang terdapat dalam kod HTML.

Penyelesaian:

Untuk mengekalkan pemisah baris dengan berkesan, gunakan br2nl() kaedah, yang menggabungkan penambahbaikan berikut:

  1. Kekalkan Baris Baharu Sedia Ada: Jika HTML asal mengandungi aksara baris baharu (n), ia disimpan dalam output.
  2. Tukar
    dan

    Teg:

    Pemisahan baris diperkenalkan dengan menambahkan n pada kandungan
    tag. Selain itu, nn ditambahkan pada kandungan

    teg untuk menandakan perenggan baharu.

  3. Pasca Pemprosesan: HTML yang diubah suai dipaparkan dan mana-mana baki baris baharu yang terlepas (\n) ditukar kepada baris baharu sebenar (n). Untuk memastikan pengendalian yang betul bagi aksara khas lain, rentetan yang terhasil dibersihkan menggunakan Jsoup.clean().

Penggunaan:

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class LineBreakPreserver {

    public static String br2nl(String html) {
        if (html == null) {
            return html;
        }

        Document document = Jsoup.parse(html);
        document.outputSettings(new Document.OutputSettings().prettyPrint(false));
        document.select("br").append("\n");
        document.select("p").prepend("\n\n");
        String s = document.html().replaceAll("\\n", "\n");
        return Jsoup.clean(s, "", Whitelist.none(), new Document.OutputSettings().prettyPrint(false));
    }

    public static void main(String[] args) {
        String html = ""-//W3C//DTD HTML 4.0 Transitional//EN \">" +
                "  <title></title> <style>body{ font-size: 12px;font-family: verdana, arial, helvetica, sans-serif;}</style>  <p><b>hello world</b></p>
<p><br><b>yo</b> <a href="%5C%22http://google.com%5C%22">googlez</a></p>  ";

        String result = br2nl(html);
        System.out.println(result);
    }
}</code>

Output:

hello world
yo googlez

Atas ialah kandungan terperinci Bagaimana untuk Mengekalkan Pemisah Baris Apabila Menukar HTML kepada Teks Menggunakan Jsoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Kemerdekaan Platform Java: Keserasian dengan OS yang berbezaKemerdekaan Platform Java: Keserasian dengan OS yang berbezaMay 13, 2025 am 12:11 AM

Javaachievesplatformindependencethroughthejavavirtualmachine (JVM), membenarkancodetorunondifferentoperatingsystemswithoutmodification.thejvmcompilesjavacodeintoplatform-bebastbytecode, yang mana-mana

Ciri -ciri apa yang menjadikan Java masih kuatCiri -ciri apa yang menjadikan Java masih kuatMay 13, 2025 am 12:05 AM

Javaispowerfulduetoitsplatformindantrectence, orientednature orientednature, richstandardlibrary, perfanksapabilities, andstrongSecurityfeatures.1) PlatformIndendenceAllowsApplicationStorAnanydeviceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceDeviceViceDeviceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceViceD

Ciri -ciri Java Teratas: Panduan Komprehensif untuk PemajuCiri -ciri Java Teratas: Panduan Komprehensif untuk PemajuMay 13, 2025 am 12:04 AM

Fungsi Java teratas termasuk: 1) pengaturcaraan berorientasikan objek, menyokong polimorfisme, meningkatkan fleksibiliti kod dan pemeliharaan; 2) mekanisme pengendalian pengecualian, meningkatkan keteguhan kod melalui blok percubaan-catch-finally; 3) pengumpulan sampah, memudahkan pengurusan memori; 4) generik, meningkatkan keselamatan jenis; 5) Ekspresi AMBDA dan pengaturcaraan berfungsi untuk menjadikan kod lebih ringkas dan ekspresif; 6) Perpustakaan standard yang kaya, menyediakan struktur data dan algoritma yang dioptimumkan.

Adakah Java benar -benar platform bebas? Bagaimana 'tulis sekali, jalankan di mana sahaja' berfungsiAdakah Java benar -benar platform bebas? Bagaimana 'tulis sekali, jalankan di mana sahaja' berfungsiMay 13, 2025 am 12:03 AM

Javaisnotentirelyplatformindependentduetojvmvariationsandnativecodeintegration, butitlargelyupholdsitsworapromise.1) javacompil estobytecoderunbythejvm, membolehkanCross-platformexecution.2) Walau bagaimanapun, setiap satuplatformrequiresaspecificjvm, dandifferencesinjvmimpleme

Demystifying the JVM: Kunci anda untuk memahami pelaksanaan JavaDemystifying the JVM: Kunci anda untuk memahami pelaksanaan JavaMay 13, 2025 am 12:02 AM

Thjavavirtualmachine (jvm) isanabstractcomputingmachinecrucialforjavaexecutionasitrunsjavabytecode, enablingthe "writeonce, rayanywhere" kemampuan.TheJvm'skeycomponentlude: 1)

Adakah Java masih merupakan bahasa yang baik berdasarkan ciri -ciri baru?Adakah Java masih merupakan bahasa yang baik berdasarkan ciri -ciri baru?May 12, 2025 am 12:12 AM

Javaremainsagoodlanguageduetoitscontinuousevolutionandrobustecosystem.1)

Apa yang menjadikan Java hebat? Ciri dan faedah utamaApa yang menjadikan Java hebat? Ciri dan faedah utamaMay 12, 2025 am 12:11 AM

Javaisgreatduetoitsplatformindantrect, robustoopsupport, extensivelibraries, andstrongcommunity.1) platformindependenceviajvmallowscodetorunonvariousplatforms.2)

Ciri -ciri Java 5 Teratas: Contoh dan PenjelasanCiri -ciri Java 5 Teratas: Contoh dan PenjelasanMay 12, 2025 am 12:09 AM

Lima ciri utama Java adalah polimorfisme, ekspresi lambda, streamsapi, generik dan pengendalian pengecualian. 1. Polimorfisme membolehkan objek kelas yang berbeza digunakan sebagai objek kelas asas biasa. 2. Ekspresi Lambda menjadikan kod lebih ringkas, terutama sesuai untuk mengendalikan koleksi dan aliran. 3.StreamsAPI dengan cekap memproses set data yang besar dan menyokong operasi deklaratif. 4. Generik menyediakan jenis keselamatan dan kebolehgunaan semula, dan kesilapan jenis ditangkap semasa penyusunan. 5. Pengendalian Pengecualian membantu mengendalikan kesilapan dengan elegan dan menulis perisian yang boleh dipercayai.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

EditPlus versi Cina retak

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa