Rumah  >  Artikel  >  Java  >  Bagaimana untuk Memisahkan Rentetan Memelihara Pembatas?

Bagaimana untuk Memisahkan Rentetan Memelihara Pembatas?

Barbara Streisand
Barbara Streisandasal
2024-10-24 18:19:03861semak imbas

How to Split Strings Preserving Delimiters?

Memisahkan Rentetan dengan Pembatas Dipelihara

Apabila bekerja dengan rentetan berbilang baris, selalunya menjadi perlu untuk membahagikannya kepada bahagian komponennya menggunakan pembatas. Walau bagaimanapun, kelakuan lalai String.split() membuang pembatas, hanya meninggalkan teks yang diekstrak.

Masalah:

Pertimbangkan rentetan berikut:

(Text1)(DelimiterA)(Text2)(DelimiterC)(Text3)(DelimiterB)(Text4)

Memisahkan rentetan ini menggunakan String.split() menghasilkan:

  • Teks1
  • Teks2
  • Teks3
  • Teks4
  • Teks4

    Output yang Diingini:

    Untuk mengekalkan pembatas dan membelah rentetan sewajarnya, kami memerlukan pendekatan yang mengekalkan pembatas.

    Penyelesaian :

    JDK menyediakan cara untuk mencapai perkara ini menggunakan ciri Pandangan Ke hadapan dan di belakang Ungkapan Biasa (regex). Begini caranya:

<code class="java">System.out.println(Arrays.toString("a;b;c;d".split("(?<=;)")));
System.out.println(Arrays.toString("a;b;c;d".split("(?=;)")));
System.out.println(Arrays.toString("a;b;c;d".split("((?<;=;)|(?=;))")));</code>

Ini menghasilkan output berikut:

  • [a;, b;, c;, d]
  • [a , ;b, ;c, ;d]
  • [a, ;, b, ;, c, ;, d]

Output terakhir sejajar dengan format yang dikehendaki, di mana setiap pembatas dikekalkan dan rentetan dipecahkan kepada bahagian yang berasingan.

Penjelasan Regex:

  • (?<=;): Melihat ke belakang untuk tanda koma bertitik dan memilih ruang letak lebar sifar di hadapannya.
  • (?=;): Memandang ke hadapan untuk koma bertitik dan memilih ruang letak lebar sifar selepasnya.
  • ((?<;=) ;)|(?=;)): Kumpulan yang sepadan dengan sama ada ruang letak lebar sifar sebelum koma bernoktah atau selepas koma bernoktah.

Dengan menggabungkan corak ini, kami membahagikan rentetan pada setiap pembatas dengan berkesan sambil mengekalkan pembatas itu sendiri sebagai sebahagian daripada output.

Peningkatan Kebolehbacaan:

Untuk kebolehbacaan yang lebih baik, pertimbangkan untuk menggunakan ungkapan biasa bernama seperti berikut:

<code class="java">static public final String WITH_DELIMITER = "((?<=%1$s)|(?=%1$s))";

public void someMethod() {
    final String[] aEach = "a;b;c;d".split(String.format(WITH_DELIMITER, ";"));
    ...
}</code>

Ini menjadikan ungkapan biasa lebih jelas dan lebih mudah untuk dikekalkan.

Atas ialah kandungan terperinci Bagaimana untuk Memisahkan Rentetan Memelihara Pembatas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn