Maison >Java >javaDidacticiel >Comment diviser du texte séparé par des virgules tout en ignorant les virgules entre guillemets ?

Comment diviser du texte séparé par des virgules tout en ignorant les virgules entre guillemets ?

Barbara Streisand
Barbara Streisandoriginal
2024-12-02 08:16:10932parcourir

How to Split Comma-Separated Text While Ignoring Commas Within Quotes?

Diviser le texte séparé par des virgules à l'exclusion des guillemets

Lors du traitement d'un texte séparé par des virgules avec des guillemets intégrés, il devient nécessaire d'ignorer les virgules dans les guillemets. sections. Ce problème survient lors de l'utilisation de la méthode string.split(",") par défaut en Python.

Considérez la chaîne suivante :

"123,test,444,\"don't split, this\",more test,1"

Le fractionnement de cette chaîne à l'aide de la méthode par défaut donnerait ce qui suit résultat :

["123", "test", "444", "\"don't split", " this\"", "more test", "1"]

Comme vous pouvez le constater, la virgule à l'intérieur de la section citée n'est pas ignorée. Pour résoudre ce problème, une expression régulière est requise.

str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)")

Explication de l'expression régulière :

  • **, : divise la chaîne par des virgules.
  • **(?=(d $)) : assertion Lookahead qui garantit que la scission se produit uniquement si elle est suivie d'un nombre pair de doubles guillemets.
  • *(?:w"w") : capture plusieurs chaînes entre guillemets.
  • *.$ : capture le texte non cité restant.

Cette expression régulière garantit que seules les virgules en dehors des sections citées sont reconnus comme séparateurs.

Alternativement, l'utilisation du modificateur (?x) dans Python vous permet de décomposer l'expression régulière en plusieurs lignes pour une meilleure lisibilité :

str.split("(?x)\n\
        ,          \n\
        (?=\n\
        (?:       \n\
            [^\"]*  \n\
            \"       \n\
            [^\"]*  \n\
            \"       \n\
        )*       \n\
        [^\"]*    \n\
        $        \n\
        )          \n")

Ce code divise efficacement la chaîne d'entrée dans une liste où chaque élément représente une sous-chaîne séparée par une virgule en dehors de toute section citée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn