Rumah >pembangunan bahagian belakang >Tutorial Python >Contoh mengira bilangan perkataan dalam teks menggunakan fungsi len dalam Python
Contoh aplikasi fungsi len dalam Python: Cara menggunakannya untuk mengira bilangan perkataan dalam teks
Dalam pengaturcaraan Python, fungsi len ialah fungsi yang sangat berguna, yang digunakan untuk mengembalikan panjang objek atau bilangan unsur. Dalam artikel ini, kami akan memperkenalkan cara menggunakan fungsi len untuk mengira bilangan perkataan dalam teks dan memberikan contoh kod khusus.
Sebelum anda mula menulis kod, anda perlu memahami cara mentakrifkan perkataan. Dalam artikel ini, kita akan menggunakan ruang sebagai pemisah perkataan, iaitu sebarang rentetan antara dua ruang dianggap sebagai perkataan.
Berikut ialah contoh kod ringkas yang menunjukkan cara menggunakan fungsi len untuk mengira bilangan perkataan dalam teks:
def count_words(text): word_count = len(text.split()) return word_count text = "Python是一种简单易学但功能强大的编程语言。它被广泛应用于各种领域,包括软件开发、数据分析和人工智能等。" word_count = count_words(text) print("文本中的单词数量为:", word_count)
Dalam kod di atas, mula-mula fungsi yang dipanggil count_words ditakrifkan, yang menerima teks parameter rentetan. Idea pelaksanaan fungsi ini adalah untuk memisahkan teks rentetan teks kepada perkataan satu demi satu melalui kaedah split, dan menggunakan fungsi len untuk mendapatkan panjang senarai perkataan, iaitu bilangan perkataan. Akhirnya, bilangan perkataan dikembalikan.
Dalam kod sampel, kami menetapkan teks yang mengandungi berbilang ayat kepada teks pembolehubah, kemudian memanggil fungsi count_words untuk mengira bilangan perkataan dalam teks dan mencetak hasilnya.
Jalankan kod di atas dan bilangan perkataan dalam teks output ialah: 17. Ini kerana terdapat 17 rentetan yang dipisahkan ruang dalam teks, yang membentuk 17 perkataan.
Sudah tentu, dalam aplikasi sebenar, anda mungkin perlu melakukan beberapa prapemprosesan pada teks, seperti mengalih keluar tanda baca dan pemisah baris, dsb. Berikut ialah contoh kod yang dipertingkatkan yang menunjukkan cara untuk mempraproses teks dan kemudian mengira bilangan perkataan:
import re def count_words(text): text = re.sub(r'[^ws]', '', text) # 去除标点符号 text = text.replace(' ', '') # 去除换行符 word_count = len(text.split()) return word_count text = """Python是一种简单易学但功能强大的编程语言。 它被广泛应用于各种领域,包括软件开发、数据分析和人工智能等。""" word_count = count_words(text) print("文本中的单词数量为:", word_count)
Dalam kod yang dipertingkatkan, kami mula-mula menggantikan semua tanda baca dengan ungkapan biasa, menggunakan kaedah re.sub. Kemudian, baris baharu telah dialih keluar menggunakan kaedah .ganti. Akhir sekali, kira bilangan perkataan mengikut kaedah sebelumnya.
Jalankan kod yang dipertingkatkan dan bilangan perkataan dalam teks output ialah: 18. Dengan mengalih keluar tanda baca dan pemisah baris, kami membersihkan teks dan mendapat kiraan perkataan yang lebih tepat.
Untuk meringkaskan, perkara di atas ialah contoh penggunaan fungsi len untuk mengira bilangan perkataan dalam teks, membelah rentetan kepada perkataan dengan kaedah split, dan menggunakan fungsi len untuk mendapatkan panjang senarai perkataan. Dalam aplikasi praktikal, anda boleh melakukan prapemprosesan teks seperti yang diperlukan untuk mendapatkan hasil yang lebih tepat. Saya harap artikel ini akan membantu anda memahami dan menggunakan fungsi len!
Atas ialah kandungan terperinci Contoh mengira bilangan perkataan dalam teks menggunakan fungsi len dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!