Rumah >pembangunan bahagian belakang >Tutorial Python >Kumpulan perkataan dengan aksara permulaan dan akhir yang serupa menggunakan Python

Kumpulan perkataan dengan aksara permulaan dan akhir yang serupa menggunakan Python

PHPz
PHPzke hadapan
2023-08-19 20:25:05796semak imbas

Kumpulan perkataan dengan aksara permulaan dan akhir yang serupa menggunakan Python

Dalam Python, kita boleh mengumpulkan perkataan dengan stat dan aksara akhir yang serupa menggunakan kaedah seperti kamus dan gelung, menggunakan ungkapan biasa dan melaksanakan pemahaman senarai. Tugas ini melibatkan menganalisis koleksi perkataan dan mengenal pasti kumpulan perkataan yang berkongsi permulaan yang sama dan watak penamat. Ini boleh menjadi teknik yang berguna dalam pelbagai aplikasi pemprosesan bahasa semula jadi, seperti klasifikasi teks, perolehan maklumat dan semakan ejaan. Dalam artikel ini, kami akan meneroka kaedah ini untuk mengumpulkan perkataan aksara permulaan dan akhir yang serupa dalam Python.

Kaedah 1:Menggunakan Kamus dan gelung

Kaedah ini menggunakan kamus untuk mengumpulkan perkataan berdasarkan aksara permulaan dan akhir yang serupa. Dengan mengulangi senarai perkataan dan mengekstrak aksara permulaan dan akhir setiap perkataan, kita boleh mencipta kunci untuk kamus. Perkataan itu kemudiannya dilampirkan pada senarai yang sepadan dalam kamus, membentuk kumpulan berdasarkan aksara permulaan dan akhir mereka.

语法

list_name.append(element)

Di sini, fungsi append() ialah kaedah senarai yang digunakan untuk menambah elemen pada penghujung list_name. List_name ialah senarai di mana kaedah tambah digunakan.

Contoh

在下面的示例中,我们定义了一个名为group_words的函数,它以一个单词列个单词列一表。化一个空字典groups来存储单词组。对于输入列表中的每个单词,我们提取其起始字符(perkataan[0])和结束字符(perkataan[−1])。然后我们使用这些字符创建一个锃。

如果字典中已经存在该键,则将当前单词添加到相应的列表中。否则,我店们廬廬词为第一个元素的新列表。最后,我们返回分组的结果字典。

def group_words(words):
    groups = {}
    for word in words:
        start_char = word[0]
        end_char = word[-1]
        key = (start_char, end_char)
        if key in groups:
            groups[key].append(word)
        else:
            groups[key] = [word]
    return groups

words = ['apple', 'banana', 'ant', 'cat', 'dog', 'elephant','amazon grape']
result = group_words(words)
print(result)

输出

{('a', 'e'): ['apple', 'amazon grape'], ('b', 'a'): ['banana'], ('a', 't'): ['ant'], ('c', 't'): ['cat'], ('d', 'g'): ['dog'], ('e', 't'): ['elephant']}

方法二:使用正则表达式

在这种方法中,我们使用正则表达式来匹配每个单词中的模式。通过定义物获单词的起始和结束字符,我们可以提取这些字符并创建一个用于分组的键。

语法

import re
result = re.split(pattern, string)

Di sini, fungsi re.split daripada modul semula mengambil dua parameter: corak dan rentetan. Corak ialah ungkapan biasa yang mentakrifkan kriteria pemisahan, manakala rentetan ialah rentetan input untuk dipecahkan. Fungsi ini mengembalikan senarai subrentetan hasil daripada operasi belah berdasarkan corak yang ditentukan.

Contoh

在下面的方法中,我们使用re模块和正则表达式来匹配每个单词的起始和店们正则表达式来匹配每个单词的起始和店们中。一个名为

group_words的函数,它接受一个单词列表作为输入。在循环中, 3组。

import re

def group_words(words):
    groups = {}
    for word in words:
        match = re.match(r'^(.)(.*)(.)$', word)
        if match:
            start_char = match.group(1)
            end_char = match.group(3)
            key = (start_char, end_char)
            if key in groups:
                groups[key].append(word)
            else:
                groups[key] = [word]
    return groups

words = ['apple', 'banana', 'ant', 'cat', 'dog', 'elephant','amazon grape']
result = group_words(words)
print(result)
输出
{('a', 'e'): ['apple', 'amazon grape'], ('b', 'a'): ['banana'], ('a', 't'): ['ant'], ('c', 't'): ['cat'], ('d', 'g'): ['dog'], ('e', 't'): ['elephant']}
Kaedah 3:Menggunakan Pemahaman Senarai

Pemahaman senarai menawarkan cara yang ringkas dan cekap untuk mengumpulkan perkataan berdasarkan aksara permulaan dan akhir mereka. Dengan menggunakan pemahaman kamus dan pemahaman senarai seterusnya, kami boleh mencipta kamus kumpulan dan mengisinya dengan perkataan yang sepadan.

Contoh

Dalam contoh di bawah, kami mentakrifkan kumpulan_perkataan fungsi yang mengambil senarai perkataan sebagai input. Menggunakan pemahaman senarai tunggal, kami membuat kumpulan kamus awal dengan semua kunci ditetapkan kepada senarai kosong. Dalam pemahaman senarai seterusnya, kami mengulangi setiap perkataan dalam senarai input. Untuk setiap perkataan, kami mengakses senarai yang sepadan dalam kamus menggunakan (perkataan[0], perkataan[−1]) sebagai kunci dan menambahkan perkataan itu padanya.

语法

[expression for item in list if condition]

在这里,语法由方括号包围的表达式和一个用于迭代列表的for循环组成。此天于。的if条件来过滤元素。对于满足条件的列表中的每个项目,都会对表达式进行求值,并将结果收集到一个新列表中。

def group_words(words):
    groups = {(word[0], word[-1]): [] for word in words}
    [groups[(word[0], word[-1])].append(word) for word in words]
    return groups

words = ['apple', 'banana', 'ant', 'cat', 'dog', 'elephant','amazon grape']
result = group_words(words)
print(result)

输出

{('a', 'e'): ['apple', 'amazon grape'], ('b', 'a'): ['banana'], ('a', 't'): ['ant'], ('c', 't'): ['cat'], ('d', 'g'): ['dog'], ('e', 't'): ['elephant']}

Kesimpulan

在本文中,我们讨论了如何使用Python中的各种方法将具有相似起始和结束字绬束字物们使用了三种不同的方法来对单词进行分组:使用字典和循环、使用正则表达式和使用列表推导式。通过使用这些技术,您可以高效地对单词进軌,分物进軌,分物些得有价值的见解,为各种自然语言处理应用打开了可能性。

Atas ialah kandungan terperinci Kumpulan perkataan dengan aksara permulaan dan akhir yang serupa menggunakan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:tutorialspoint.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam
Artikel sebelumnya:Mainkan bunyi dalam PythonArtikel seterusnya:Mainkan bunyi dalam Python