Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengekalkan Ruang dan Tempoh Semasa Mengalih Keluar Aksara Bukan ASCII dalam Fail Teks Python?

Bagaimana untuk Mengekalkan Ruang dan Tempoh Semasa Mengalih Keluar Aksara Bukan ASCII dalam Fail Teks Python?

Linda Hamilton
Linda Hamiltonasal
2024-10-19 20:30:29505semak imbas

How to Preserve Spaces and Periods While Removing Non-ASCII Characters in Python Text Files?

Mengendalikan Aksara Bukan ASCII, Memelihara Ruang dan Tempoh

Apabila berurusan dengan fail teks, selalunya perlu mengalih keluar aksara bukan ASCII semasa memelihara entiti tertentu seperti ruang dan noktah. Kod Python yang disediakan berjaya menapis aksara bukan ASCII tetapi secara tidak sengaja juga menghilangkan ruang dan noktah.

Untuk menangani isu ini, kami perlu mengubah suai fungsi onlyascii() untuk mengecualikan ruang dan noktah secara eksplisit daripada proses penapisan . Berikut ialah versi yang dikemas kini:

<code class="python">def onlyascii(char):
    if char == ' ' or char == '.':
        return char
    elif ord(char) < 48 or ord(char) > 127:
        return ''
    else:
        return char</code>

Dalam fungsi onlyascii() yang disemak ini, kami menyemak sama ada aksara itu ialah ruang (' ') atau titik ('.') dan mengembalikannya jika ya. Pengubahsuaian ini memastikan entiti ini dikekalkan dalam rentetan yang ditapis.

Untuk menggunakan fungsi onlyascii() yang dikemas kini, kami boleh mengubah suai fungsi get_my_string() untuk menapis aksara menggunakan fungsi ini:

<code class="python">def get_my_string(file_path):
    f = open(file_path, 'r')
    data = f.read()
    f.close()
    filtered_data = filter(onlyascii, data)
    filtered_data = filtered_data.lower()
    return ''.join(filtered_data)</code>

Kaedah join() digunakan untuk menggabungkan aksara daripada iterable dikembalikan oleh fungsi filter(), menghasilkan rentetan.

Dengan melaksanakan pengubahsuaian ini, anda boleh mengalih keluar aksara bukan ASCII sambil mengekalkan ruang dan noktah dalam rentetan teks anda, memenuhi keperluan projek khusus anda.

Atas ialah kandungan terperinci Bagaimana untuk Mengekalkan Ruang dan Tempoh Semasa Mengalih Keluar Aksara Bukan ASCII dalam Fail Teks Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn