Maison >développement back-end >Tutoriel Python >Impossible de décomposer le JSON imbriqué dans le dataframe Spark

Impossible de décomposer le JSON imbriqué dans le dataframe Spark

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBavant: 2024-02-11 10:51:03535parcourir

无法分解 Spark 数据框中的嵌套 JSON

Contenu des questions

Je suis nouveau sur Spark. J'essaie d'aplatir le dataframe mais je ne parviens pas à le faire via "exploser".

La structure originale du bloc de données est la suivante :

id|approvaljson
1|[{"approvertype":"1st line manager","status":"approved"},{"approvertype":"2nd line manager","status":"approved"}]
2|[{"approvertype":"1st line manager","status":"approved"},{"approvertype":"2nd line manager","status":"rejected"}]

Je dois le convertir vers le schéma suivant ?

id|approvaltype|status
1|1st line manager|approved
1|2nd line manager|approved
2|1st line manager|approved
2|2nd line manager|rejected

Je l'ai essayé

df_exploded = df.withcolumn("approvaljson", explode("approvaljson"))

Mais j'ai eu l'erreur :

Cannot resolve "explode(ApprovalJSON)" due to data type mismatch:
parameter 1 requires ("ARRAY" or "MAP") type, however, "ApprovalJSON"
is of "STRING" type.;

Réponse correcte

Analysez d'abord la chaîne de type json dans un tableau de structures, puis utilisez inline pour diviser le tableau en lignes et colonnes

df1 = df.withcolumn("approvaljson", f.from_json("approvaljson", schema="array<struct<approvertype string, status string>>"))
df1 = df1.select("id", f.inline('approvaljson'))

Résultats

df1.show()

+---+----------------+--------+
| ID|    ApproverType|  Status|
+---+----------------+--------+
|  1|1st Line Manager|Approved|
|  1|2nd Line Manager|Approved|
|  2|1st Line Manager|Approved|
|  2|2nd Line Manager|Rejected|
+---+----------------+--------+

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

架构 json 字符串 spark

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：Créer un webhook pour vous connecter à OpenAI dans Google Cloud FunctionsArticle suivant：Créer un webhook pour vous connecter à OpenAI dans Google Cloud Functions

Articles Liés

Voir plus