Maison  >  Article  >  développement back-end  >  Comment fusionner élégamment deux dictionnaires (dict) en Python

Comment fusionner élégamment deux dictionnaires (dict) en Python

不言
不言original
2018-06-02 15:44:371714parcourir

Le dictionnaire est le seul type de mappage dans le langage Python. Nous le rencontrons souvent dans notre travail quotidien. L'article suivant vous présente principalement les informations pertinentes sur la façon de fusionner élégamment deux dictionnaires (dict) en Python. L'introduction à travers l'exemple de code est très détaillée. Les amis dans le besoin peuvent s'y référer.

Préface

Les dictionnaires sont l'un des types de données les plus puissants de Python. Cet article vous donnera une introduction détaillée à Python fusionnant deux dictionnaires. . Le contenu pertinent de (dict) est partagé pour la référence et l'étude de chacun. Pas grand chose à dire, jetons un coup d'œil à l'introduction détaillée.

Une ligne de code fusionne deux dicts

Supposons qu'il y ait deux dicts x et y, fusionnez-les dans un nouveau dict, non Changer les valeurs de x et y, comme

 x = {'a': 1, 'b': 2}
 y = {'b': 3, 'c': 4}

s'attend à obtenir un nouveau résultat Z, si la clé est la même, y couvre x. Le résultat souhaité est

>>> z
{'a': 1, 'b': 3, 'c': 4}

Dans PEP448, il existe une nouvelle syntaxe qui peut être implémentée, et cette syntaxe est prise en charge dans python3.5, fusionnez le code Ce qui suit est une ligne de code appropriée

z = {**x, **y}

. Étant donné que de nombreuses personnes utilisent encore python2, pour les personnes possédant python2 et python3.0-python3.4, il existe une méthode plus élégante, mais elle nécessite deux lignes de code.

z = x.copy()
z.update(y)

Dans la méthode ci-dessus, y écrasera le contenu dans x, donc le résultat final est b=3.

Comment le faire en une seule ligne sans utiliser python3.5

Si vous n'utilisez pas encore Python 3.5 ou si vous avez besoin d'écrire du code rétrocompatible, et vous voulez le faire en une seule expression Lors de l'exécution dans une fonction, le moyen le plus efficace est de la mettre dans une fonction :

def merge_two_dicts(x, y):
 """Given two dicts, merge them into a new dict as a shallow copy."""
 z = x.copy()
 z.update(y)
 return z

Puis complétez l'appel avec une seule ligne de code :

 z = merge_two_dicts(x, y)

Vous pouvez également définir une fonction pour fusionner plusieurs dicts, comme

def merge_dicts(*dict_args):
 """
 Given any number of dicts, shallow copy and merge into a new dict,
 precedence goes to key value pairs in latter dicts.
 """
 result = {}
 for dictionary in dict_args:
 result.update(dictionary)
 return result

alors vous pouvez l'utiliser comme ceci :

z = merge_dicts(a, b, c, d, e, f, g)

Dans tout cela, la même clé couvre le précédent.

Quelques manifestations inélégantes

articles

Certaines personnes Cette méthode sera utilisé :

 z = dict(x.items() + y.items())

Il s'agit en fait de créer deux listes dans la mémoire, puis de créer une troisième liste. Une fois la copie terminée, créez. Nouveau dict, supprimez les trois premières listes. Cette méthode consomme des performances, et pour python3, elle ne peut pas être exécutée correctement car items() renvoie un objet.

>>> c = dict(a.items() + b.items())
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for +: &#39;dict_items&#39; and 
&#39;dict_items&#39;

Vous devez explicitement le convertir dans une liste, z = dict(list(x.items()) + list(y.items())) , ce qui est un gaspillage de performances. De plus, la méthode d'union des listes renvoyées par items() échouera également pour python3. De plus, la méthode d'union entraîne une incertitude dans les valeurs des clés répétées. Par conséquent, si vous comparez deux, il existe des exigences de priorité pour la fusion de dict. , cette méthode est donc totalement inappropriée.

>>> x = {&#39;a&#39;: []}
>>> y = {&#39;b&#39;: []}
>>> dict(x.items() | y.items())
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
TypeError: unhashable type: &#39;list&#39;

Voici un exemple où y devrait avoir la priorité, mais en raison de l'ordre arbitraire défini, la valeur de x est conservée :

>>> x = {&#39;a&#39;: 2}
>>> y = {&#39;a&#39;: 1}
>>> dict(x.items() | y.items())
{&#39;a&#39;: 2}

Constructeur

Certaines personnes l'utilisent également de cette façon

z = dict(x, **y)

C'est très bien, beaucoup plus efficace que la méthode précédente en deux étapes, mais la lisibilité est mauvaise et pas assez pythonique. Si la clé n'est pas une chaîne, l'opération échouera quand même. en python3

>>> c = dict(a, **b)
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
TypeError: keyword arguments must be strings

Maître Guido van Rossum a dit : Déclarer dict({}, {1:3}) est illégal car c'est un abus du mécanisme après tout. Bien que cette méthode soit plus hacky, elle est trop opportuniste.

Quelques performances médiocres mais méthodes plus élégantes

Les méthodes suivantes, bien que peu performantes, sont bien meilleures que la méthode des éléments . Et prend en charge la priorité.

{k: v for d in dicts for k, v in d.items()}

Cela peut être fait en python2.6 avec

 dict((k, v) for d in dicts for k, v in d.items())

itertools.chain enchaînera les itérateurs sur les paires clé-valeur dans le bon ordre :

import itertools
z = dict(itertools.chain(x.iteritems(), y.iteritems()))

Test de performances

Ce qui suit a été réalisé sur Ubuntu 14.04, en Python 2.7 (System Python) :

>>> min(timeit.repeat(lambda: merge_two_dicts(x, y)))
0.5726828575134277
>>> min(timeit.repeat(lambda: {k: v for d in (x, y) for k, v in d.items()} ))
1.163769006729126
>>> min(timeit.repeat(lambda: dict(itertools.chain(x.iteritems(),y.iteritems()))))
1.1614501476287842
>>> min(timeit.repeat(lambda: dict((k, v) for d in (x, y) for k, v in d.items())))
2.2345519065856934

dans In python3.5

>>> min(timeit.repeat(lambda: {**x, **y}))
0.4094954460160807
>>> min(timeit.repeat(lambda: merge_two_dicts(x, y)))
0.7881555100320838
>>> min(timeit.repeat(lambda: {k: v for d in (x, y) for k, v in d.items()} ))
1.4525277839857154
>>> min(timeit.repeat(lambda: dict(itertools.chain(x.items(), y.items()))))
2.3143140770262107
>>> min(timeit.repeat(lambda: dict((k, v) for d in (x, y) for k, v in d.items())))
3.2069112799945287

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn