看到struct這麼英文單詞,大家應該不陌生,因為c/c++中就有struct,在那裡struct叫做結構體。在Python中也使用struct,這充分說明了這個struct應該和c/c++中的struct有很深的淵源。 Python正是使用struct模組執行Python值和C結構體之間的轉換,從而形成Python位元組物件。它使用格式字串作為底層C結構體的緊湊描述,進而根據這個格式字串轉換成Python值。
我們知道python只定義了6種資料型,字串,整數,浮點數,列表,元組,字典。但是C語言中有些字節型的變量,在python中該如何實現呢?這一點頗為重要,特別是要在網路上進行資料傳輸的話。
python提供了一個struct模組來提供轉換。下面就介紹這個模組中的幾個方法。
pack(fmt, v1, v2, ...) ------ 根據所給的fmt所描述的格式將值v1,v2,...轉換為一個字串。
unpack(fmt, bytes) ------ 根據所給予的fmt所描述的格式將bytes反向解析出來,並傳回一個元組。
calcsize(fmt) ------ 根據所給予的fmt所描述的格式傳回該結構的大小。
struct.pack():
struct.pack用於將Python的值根據格式符,轉換為字串(因為Python中沒有位元組(Byte)類型,可以把這裡的字串理解為位元組流,或位元組數組)。其函數原型為:struct.pack(fmt, v1, v2, ...),參數fmt是格式字串,關於格式字串的相關資訊下面有所介紹。 v1, v2, ...表示要轉換的python值。下面的範例將兩個整數轉換為字串(位元組流):
>>> import struct
>>> a=20
>>> b=400
>>> str=struct.pack ('ii',a,b) #轉換成位元組流,雖然還是字串,但可以在網路上傳送
>>> print len(str) #ii 表示兩個 #可以看到長度為8個位元組,剛好是兩個int型資料的長度
>>> print str
x00x00x00x90x01x00x00' #其中十六進位的0x00000014, 0x00001009分別表示20和400
>>>
由此我們就可以任意的進行組包了,比如下面一個打包的例子,只介紹其中的pack🜜HH🜎% ds" % len(data)
buffer = struct.pack(format,opcode,blocknumber,data)
我們要對一個資料進行打包,加上一些個包頭,我們根據下面的格式符信息,知道H是unsigned short是2個位元組,而s是char型。所以這個buffer就是2個位元組的opcode,2個位元組的blocknumber,和len長的char。
Python模組——struct(位元組流,組包拆包實現)
struct.unpack():
我們接著上面的例子運行:
> a
'ii',str)>>> print 'a1',a1a1 20>>> print 'a2=',a2a2= 400可以看到「ii」以四個字可以看到「ii」以四個字節為分界,把8個位元組的str分成了兩個int型的整數。 struct.calcsize():用來計算特定格式的輸出的大小,是幾個字節,例如:>>> struct.calcsize('HH4s')8>>> struct.calcsize ('ii')8>>>>>> format='!HH%ds' % len('hello python')>>> struct.calcsize(format)16>>> struct.calcsize(format)
16
>>>