Maison >développement back-end >Tutoriel Python >Comment découvrir des sous-chaînes communes en Python à l'aide de difflib ?
Comparer deux chaînes pour identifier leur sous-chaîne commune est une tâche fondamentale dans la manipulation de chaînes. Ce guide complet présente une solution basée sur Python utilisant le module difflib pour effectuer cette opération efficacement.
Utilisation de la méthode Find_Longest_Match de difflib
Le module difflib, qui fait partie de la bibliothèque standard de Python, fournit un tableau de séquences -utilitaires de comparaison. Parmi eux, find_longest_match trouve la sous-chaîne commune la plus longue entre deux chaînes.
Considérons deux chaînes :
string1 = "apple pie available" string2 = "come have some apple pies"
Pour trouver leur sous-chaîne commune à l'aide de find_longest_match :
from difflib import SequenceMatcher match = SequenceMatcher(None, string1, string2).find_longest_match() print(match) # -> Match(a=0, b=15, size=9) print(string1[match.a:match.a + match.size]) # -> apple pie print(string2[match.b:match.b + match.size]) # -> apple pie
Dans Dans cet exemple, le résultat est :
Match(a=0, b=15, size=9) apple pie apple pie
Cela indique que la sous-chaîne commune la plus longue est "tarte aux pommes" et que les deux chaînes partagent cette sous-chaîne.
Compatibilité avec les versions Python
Pour les versions Python antérieures à 3.9, la méthode find_longest_match() nécessite des arguments légèrement différents :
SequenceMatcher(None, string1, string2).find_longest_match(0, len(string1), 0, len(string2))
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!