python 序列化之JSON與pickle詳解-Python教學-PHP中文網

首頁

後端開發

Python教學

python 序列化之JSON與pickle詳解

高洛峰

Oct 29, 2016 am 10:17 AM

javascriptjsonpicklepython

JSON模組

JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式。它是基於ECMAScript的一個子集。 JSON採用完全獨立於語言的文字格式，但也使用了類似C語言家族的習慣(包括C、C++、Java、JavaScript、Perl、Python等)。這些特性使JSON成為理想的資料交換語言。易於人閱讀和編寫，同時也易於機器解析和生成(一般用於提升網路傳輸速率)。
JSON在python中分別由list和dict組成。

一、python類型資料和JSON資料格式互相轉換

python 序列化之JSON與pickle詳解一、python類型資料與JSON資料格式互相轉換

一、python型別資料與JSON資料格式互相轉換

pthon 中str型別至JSON轉為unicodecode型，None轉為null,dict對應為

二、資料型別，None轉為null,dict對應類型資料編解碼

所謂簡單類型就是指上表中出現的python類型。

dumps:　　將物件序列化

#coding:utf-8
import json

# 简单编码===========================================
print json.dumps([&#39;foo&#39;, {&#39;bar&#39;: (&#39;baz&#39;, None, 1.0, 2)}])
# ["foo", {"bar": ["baz", null, 1.0, 2]}]

#字典排序
print json.dumps({"c": 0, "b": 0, "a": 0}, sort_keys=True)
# {"a": 0, "b": 0, "c": 0}

#自定义分隔符
print json.dumps([1,2,3,{&#39;4&#39;: 5, &#39;6&#39;: 7}], sort_keys=True, separators=(&#39;,&#39;,&#39;:&#39;))
# [1,2,3,{"4":5,"6":7}]
print json.dumps([1,2,3,{&#39;4&#39;: 5, &#39;6&#39;: 7}], sort_keys=True, separators=(&#39;/&#39;,&#39;-&#39;))
# [1/2/3/{"4"-5/"6"-7}]

#增加缩进，增强可读性，但缩进空格会使数据变大
print json.dumps({&#39;4&#39;: 5, &#39;6&#39;: 7}, sort_keys=True,indent=2, separators=(&#39;,&#39;, &#39;: &#39;))
# {
#   "4": 5,
#   "6": 7
# }


# 另一个比较有用的dumps参数是skipkeys，默认为False。
# dumps方法存储dict对象时，key必须是str类型，如果出现了其他类型的话，那么会产生TypeError异常，如果开启该参数，设为True的话，会忽略这个key。
data = {&#39;a&#39;:1,(1,2):123}
print json.dumps(data,skipkeys=True)
#{"a": 1}

dump:　　將物件序列化並儲存到檔案

#將物件序列化並儲存到檔案obj = ['foo', {'bar': ('baz', None , 1.0, 2)}]

with open(r"c:json.txt","w+") as f:

json.dump(obj,f)

loads:　㜀將序列化字串序列化將序列化字串化

loads:　㜀

import json

obj = [&#39;foo&#39;, {&#39;bar&#39;: (&#39;baz&#39;, None, 1.0, 2)}]
a= json.dumps(obj)
print json.loads(a)
# [u&#39;foo&#39;, {u&#39;bar&#39;: [u&#39;baz&#39;, None, 1.0, 2]}]

load:　　將序列化字串從檔案讀取並反序列化

with open(r"c:json.txt","r") as f: print json.load(f)

三、自訂複雜資料型別編解碼

例如我們碰到物件datetime，或是自訂的類別物件等json預設不支援的資料型別時，我們就需要自訂編解碼函數。有兩種方法來實作自訂編解碼。

1、方法一：自訂編解碼函數

#! /usr/bin/env python
# -*- coding:utf-8 -*-
# __author__ = "TKQ"
import datetime,json

dt = datetime.datetime.now()



def time2str(obj):
    #python to json
    if isinstance(obj, datetime.datetime):
        json_str = {"datetime":obj.strftime("%Y-%m-%d %X")}
        return json_str
    return obj

def str2time(json_obj):
    #json to python
    if "datetime" in json_obj:
        date_str,time_str = json_obj["datetime"].split(&#39; &#39;)
        date = [int(x) for x in date_str.split(&#39;-&#39;)]
        time = [int(x) for x in time_str.split(&#39;:&#39;)]
        dt = datetime.datetime(date[0],date[1], date[2], time[0],time[1], time[2])
        return dt
    return json_obj


a = json.dumps(dt,default=time2str)
print a
# {"datetime": "2016-10-27 17:38:31"}
print json.loads(a,object_hook=str2time)
# 2016-10-27 17:38:31

2、方法二：繼承JSONEncoder和JSONDecoder類，重寫相關方法

#! /usr/bin/env python
# -*- coding:utf-8 -*-
# __author__ = "TKQ"
import datetime,json

dt = datetime.datetime.now()
dd = [dt,[1,2,3]]

class MyEncoder(json.JSONEncoder):
    def default(self,obj):
        #python to json
        if isinstance(obj, datetime.datetime):
            json_str = {"datetime":obj.strftime("%Y-%m-%d %X")}
            return json_str
        return obj

class MyDecoder(json.JSONDecoder):
    def __init__(self):
        json.JSONDecoder.__init__(self, object_hook=self.str2time)

    def str2time(self,json_obj):
        #json to python
        if "datetime" in json_obj:
            date_str,time_str = json_obj["datetime"].split(&#39; &#39;)
            date = [int(x) for x in date_str.split(&#39;-&#39;)]
            time = [int(x) for x in time_str.split(&#39;:&#39;)]
            dt = datetime.datetime(date[0],date[1], date[2], time[0],time[1], time[2])
            return dt
        return json_obj


# a = json.dumps(dt,default=time2str)
a =MyEncoder().encode(dd)
print a
# [{"datetime": "2016-10-27 18:14:54"}, [1, 2, 3]]
print MyDecoder().decode(a)
# [datetime.datetime(2016, 10, 27, 18, 14, 54), [1, 2, 3]]

pickle模組

python的picklekle序列化。基本上功能使用和JSON模組沒有太大差別，方法也同樣是dumps/dump和loads/load。 cPickle是pickle模組的C語言編譯版本相對速度較快。

與JSON不同的是pickle不是用於多種語言間的資料傳輸，它僅作為python物件的持久化或python程式間進行互相傳輸物件的方法，因此它支援了python所有的資料類型。

pickle反序列化後的對象與原對像是等值的副本對象，類似與deepcopy。

dumps/dump序列化

from datetime import date

try:
    import cPickle as pickle    #python 2
except ImportError as e:
    import pickle   #python 3


src_dic = {"date":date.today(),"oth":([1,"a"],None,True,False),}
det_str = pickle.dumps(src_dic)
print det_str
# (dp1
# S&#39;date&#39;
# p2
# cdatetime
# date
# p3
# (S&#39;\x07\xe0\n\x1b&#39;
# tRp4
# sS&#39;oth&#39;
# p5
# ((lp6
# I1
# aS&#39;a&#39;
# aNI01
# I00
# tp7
# s.
with open(r"c:\pickle.txt","w") as f:
    pickle.dump(src_dic,f)

loads/load反序列化🎜

from datetime import date

try:
    import cPickle as pickle    #python 2
except ImportError as e:
    import pickle   #python 3


src_dic = {"date":date.today(),"oth":([1,"a"],None,True,False),}
det_str = pickle.dumps(src_dic)
with open(r"c:\pickle.txt","r") as f:
    print pickle.load(f)
# {&#39;date&#39;: datetime.date(2016, 10, 27), &#39;oth&#39;: ([1, &#39;a&#39;], None, True, False)}

🎜JSON和pickle模組的區別🎜🎜1、JSON只能處理基本資料類型。 pickle能處理所有Python的資料類型。 🎜🎜2、JSON用於各種語言之間的字元轉換。 pickle用於Python程式物件的持久化或Python程式間物件網路傳輸，但不同版本的Python序列化可能還有差異。 🎜🎜🎜🎜

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

您如何切成python陣列？May 01, 2025 am 12:18 AM

Python列表切片的基本語法是list[start:stop:step]。 1.start是包含的第一個元素索引，2.stop是排除的第一個元素索引，3.step決定元素之間的步長。切片不僅用於提取數據，還可以修改和反轉列表。

在什麼情況下，列表的表現比數組表現更好？May 01, 2025 am 12:06 AM

ListSoutPerformarRaysin：1）DynamicsizicsizingandFrequentInsertions/刪除，2）儲存的二聚體和3）MemoryFeliceFiceForceforseforsparsedata，butmayhaveslightperformancecostsinclentoperations。

如何將Python數組轉換為Python列表？May 01, 2025 am 12:05 AM

toConvertapythonarraytoalist，usEthelist（）constructororageneratorexpression.1）intimpthearraymoduleandcreateanArray.2）USELIST（ARR）或[XFORXINARR] to ConconverTittoalist，請考慮performorefformanceandmemoryfformanceandmemoryfformienceforlargedAtasetset。

當Python中存在列表時，使用數組的目的是什麼？May 01, 2025 am 12:04 AM

choosearraysoverlistsinpythonforbetterperformanceandmemoryfliceSpecificScenarios.1）largenumericaldatasets：arraysreducememoryusage.2）績效 - 臨界雜貨：arraysoffersoffersOffersOffersOffersPoostSfoostSforsssfortasssfortaskslikeappensearch orearch.3）testessenforcety：arraysenforce：arraysenforc