Rumah >pembangunan bahagian belakang >Tutorial Python >Kira panjang perkataan dalam rentetan menggunakan Python
Mencari panjang perkataan individu dalam rentetan input yang diberikan menggunakan Python ialah masalah yang mesti diselesaikan. Kami ingin mengira bilangan aksara setiap perkataan dalam input teks dan memaparkan keputusan dalam gaya berstruktur seperti senarai. Tugas itu memerlukan memecahkan rentetan input dan memisahkan setiap perkataan. Kemudian hitung panjang setiap perkataan berdasarkan bilangan aksara di dalamnya. Matlamat asas adalah untuk mencipta fungsi atau prosedur yang boleh menerima input dengan cekap, menentukan panjang perkataan, dan hasil output tepat pada masanya. Menangani isu ini adalah penting dalam pelbagai aplikasi, termasuk pemprosesan teks, pemprosesan bahasa semula jadi dan analisis data, di mana statistik panjang perkataan boleh memberikan maklumat yang bernas dan membolehkan analisis tambahan.
Gunakan fungsi gelung dan split().
Gunakan fungsi map() dengan len dan split()
Gunakan kaedah re.split() dalam modul semula
Gunakan kamus untuk menyimpan panjang perkataan
Teknik pemprosesan dan analisis teks Python yang asas dan mudah adalah untuk mendapatkan panjang perkataan menggunakan gelung dan fungsi split(). Dengan menggunakan teknik ini untuk memecahkan rentetan input kepada perkataan komponennya, kita boleh menentukan panjang setiap perkataan dengan menyemak semula senarai perkataan. Dalam kaedah ini, fungsi split() adalah penting kerana ia pada asasnya menandakan teks input berdasarkan aksara ruang, dengan itu memisahkan perkataan antara satu sama lain. Senarai perkataan yang terhasil berfungsi sebagai asas untuk pengiraan panjang perkataan kami yang lain. Teknik ini merupakan bahagian penting dalam mana-mana set alat analisis teks kerana ia berkesan dan mudah untuk memahami dan mengekstrak maklumat penting daripada input teks.
Tentukan fungsi findWordLengths yang mengambil rentetan input sebagai parameter.
Gunakan fungsi split() untuk memisahkan rentetan input kepada perkataan individu, menggunakan ruang sebagai pemisah untuk memisahkannya. Simpan hasilnya dalam senarai yang dipanggil perkataan.
Mulakan senarai kosong "wordLengths" untuk menyimpan panjang perkataan.
Untuk setiap perkataan dalam senarai perkataan, lakukan perkara berikut:
a. Gunakan fungsi len() untuk mengira panjang perkataan semasa.
b. Tambahkan panjang perkataan semasa ke senarai "wordLengths".
Kembalikan senarai "wordLengths".
def findWordLengths(input_string): words = input_string.split() wordLengths = [] for word in words: wordLengths.append(len(word)) return wordLengths input_string = "Today feels like a productive day" result = findWordLengths(input_string) print("The words lengths are as:", result)
The words lengths are as: [5, 5, 4, 1, 10, 3]
Kaedah menentukan panjang perkataan dalam Python menggabungkan fungsi map() dengan len dan split() untuk memberikan jawapan yang elegan dan cekap kepada masalah bekerja dengan data teks. Pendekatan ini memanfaatkan kuasa fungsi terbina dalam Python, yang boleh digabungkan untuk menentukan dengan cepat panjang perkataan individu dalam rentetan input. Kaedah split() menggunakan ruang sebagai pembatas, dengan berkesan memisahkan rentetan input kepada perkataan berasingan, dan merupakan asas kepada strategi ini. Hasilnya ialah penciptaan senarai istilah yang menjadi asas untuk siasatan lanjut. Menggunakan kaedah map(), kami menukar senarai ini menjadi senarai lelaran yang mengandungi panjang semua perkataan dengan menggunakan fungsi len() pada setiap perkataan.
Tentukan fungsi findWordLengths yang mengambil rentetan input sebagai hujahnya. Parameter ini akan mengandungi rentetan input kami.
Gunakan fungsi split() untuk memisahkan rentetan input kepada perkataan individu, menggunakan ruang sebagai pembatas. Simpan hasilnya dalam senarai yang dipanggil perkataan.
Gunakan fungsi map() untuk menggunakan fungsi len() pada setiap perkataan dalam senarai perkataan, kerana fungsi len() mengira panjangnya. Ini akan menghasilkan lelaran yang mengandungi panjang satu perkataan.
Tukar iterable yang diperoleh daripada map() kepada senarai untuk mendapatkan panjang satu perkataan.
Mengembalikan senarai panjang perkataan.
def findWordLengths(input_string): words = input_string.split() wordLengths = list(map(len, words)) return wordLengths input_string = "Hello my name is Rahul" result = findWordLengths(input_string) print("The words lengths are as:", result)
The words lengths are as: [5, 2, 4, 2, 5]
Ekspresi biasa ialah alat yang berkesan untuk pengubahsuaian teks dan padanan corak. Dengan bijak mengesan aksara ruang putih sebagai pemisah perkataan, fungsi re.split() boleh berfungsi sebagai teknik yang boleh dipercayai untuk mengetag frasa kepada perkataan dalam kes ini. Untuk memisahkan perkataan dengan tepat, corak ungkapan biasa r's+' sepadan dengan satu atau lebih huruf ruang putih berturut-turut. Kaedah ini berfungsi dengan baik apabila mengendalikan format teks input yang berbeza, membenarkan corak ruang putih yang berbeza dan menyediakan pengiraan panjang perkataan yang tepat. Penggunaan ungkapan biasa menjadikannya cekap walaupun semasa memproses sejumlah besar data input. Selain itu, kekurangan perpustakaan lain memudahkan pelaksanaan.
Masukkan ayat yang mengandungi perkataan.
Pisah ayat kepada perkataan menggunakan kaedah re.split() dan ungkapan biasa r's+'.
Mulakan senarai kosong untuk menyimpan panjang perkataan.
Lelaran setiap perkataan dalam senarai perkataan:
a. Kira panjang perkataan semasa.
b. Menambahkan panjang perkataan pada senarai panjang perkataan.
Senarai panjang perkataan keluaran.
import re def word_lengths(sentence): words = re.split(r'\s+', sentence) word_lengths = [] for word in words: length = len(word) word_lengths.append(length) return word_lengths sentence = "This is a sample sentence" result = word_lengths(sentence) print(result)
[4, 2, 1, 6, 8]
使用字典保存单词长度来确定字符串中单词长度的方法将 Python 内置数据结构的有效性与简单的算法相结合,以提供有效且适应性强的结果。该技术通过使用 len() 函数迭代计算字典中每个单词的长度,为字典中的每个单词生成键值对。给出单词的长度作为匹配值,并将单词设置为键。由于这个清晰简单的过程,字长的收集是精确和有效的。
生成的词典提供每个单词对应的单词长度,捕获文本的广泛视图。为了进一步处理或分析数据,这种格式可以轻松检索字长。
输入包含单词的句子。
使用 split() 方法将句子拆分为单词,这将为我们的输入字符串创建单词列表。
初始化一个空字典来存储单词长度。
迭代单词列表中的每个单词,如下所示:
a。计算当前单词的长度。
b。向字典中添加一个条目,以单词为键,以单词长度为值。
输出包含单词长度的字典。
def word_lengths(sentence): words = sentence.split() word_lengths_dict = {} for word in words: length = len(word) word_lengths_dict[word] = length return word_lengths_dict sentence = "This is how the length of words is calculated" result = word_lengths(sentence) print(result)
{'This': 4, 'is': 2, 'how': 3, 'the': 3, 'length': 6, 'of': 2, 'words': 5, 'is': 2, 'calculated': 10}
总而言之,我们研究了四种不同的 Python 方法来计算字符串中的单词长度。对于简单的工作,前两种方法(使用循环和 split() 函数或带有 len 和 split() 的 map() 函数)提供了简单性和有效性。第三个选项利用 re 模块中的 re.split() 方法,展示了正则表达式的强大功能,适合在复杂的文本处理应用程序中使用。最后但并非最不重要的一点是,使用字典来跟踪单词长度提供了一种系统且实用的方法来检索和处理单词数据。每种方法都具有特定的优点,使程序员能够根据特定需求和编码偏好选择最佳选项。
Atas ialah kandungan terperinci Kira panjang perkataan dalam rentetan menggunakan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!