Heim  >  Artikel  >  Backend-Entwicklung  >  Tutorial zum Betrieb von Bytestreams/Binärstreams mit dem Strukturmodul in Python

Tutorial zum Betrieb von Bytestreams/Binärstreams mit dem Strukturmodul in Python

高洛峰
高洛峰Original
2017-02-20 10:46:061771Durchsuche

Vor kurzem habe ich Python-Netzwerkprogrammierung gelernt und bin auf die Verwendung des Strukturmoduls gestoßen. Ich war mir nicht sicher, was es tut Relevante Informationen und ein grobes Verständnis davon. Dieser Artikel stellt hauptsächlich die Funktionsweise des Byte-Streams/Binär-Streams durch das Strukturmodul in Python vor.

Vorwort

Kürzlich wird Python zum Parsen des MNIST-Datensatzes im IDX-Dateiformat verwendet, und die Binärdatei muss gelesen werden. in dem ich verwende, ist das Strukturmodul. Ich habe viele Tutorials im Internet durchgesehen und sie waren alle sehr gut, aber für Anfänger nicht besonders geeignet. Deshalb habe ich einige Notizen neu geordnet, um Ihnen den schnellen Einstieg zu erleichtern.

Hinweis: Die folgenden vier Begriffe im Tutorial sind synonym: Binärstrom, Binärarray, Bytestrom, Bytearray

Schnell loslegen

Konvertieren Sie im Strukturmodul eine Ganzzahl, eine Gleitkommazahl oder einen Zeichenstrom (Zeichenarray) in einen Bytestrom (Wortabschnittsarray). , müssen Sie die Formatzeichenfolge fmt verwenden, um dem Strukturmodul mitzuteilen, welcher Objekttyp konvertiert werden soll. Beispielsweise ist eine Ganzzahl „i“, eine Gleitkommazahl „f“ und ein ASCII-Codezeichen „s“. '.

def demo1():
 # 使用bin_buf = struct.pack(fmt, buf)将buf为二进制数组bin_buf
 # 使用buf = struct.unpack(fmt, bin_buf)将bin_buf二进制数组反转换回buf

 # 整型数 -> 二进制流
 buf1 = 256
 bin_buf1 = struct.pack('i', buf1) # 'i'代表'integer'
 ret1 = struct.unpack('i', bin_buf1)
 print bin_buf1, &#39; <====> &#39;, ret1

 # 浮点数 -> 二进制流
 buf2 = 3.1415
 bin_buf2 = struct.pack(&#39;d&#39;, buf2) # &#39;d&#39;代表&#39;double&#39;
 ret2 = struct.unpack(&#39;d&#39;, bin_buf2)
 print bin_buf2, &#39; <====> &#39;, ret2

 # 字符串 -> 二进制流
 buf3 = &#39;Hello World&#39;
 bin_buf3 = struct.pack(&#39;11s&#39;, buf3) # &#39;11s&#39;代表长度为11的&#39;string&#39;字符数组
 ret3 = struct.unpack(&#39;11s&#39;, bin_buf3)
 print bin_buf3, &#39; <====> &#39;, ret3

 # 结构体 -> 二进制流
 # 假设有一个结构体
 # struct header {
 # int buf1;
 # double buf2;
 # char buf3[11];
 # }
 bin_buf_all = struct.pack(&#39;id11s&#39;, buf1, buf2, buf3)
 ret_all = struct.unpack(&#39;id11s&#39;, bin_buf_all)
 print bin_buf_all, &#39; <====> &#39;, ret_all

Die Ausgabeergebnisse lauten wie folgt:

Tutorial zum Betrieb von Bytestreams/Binärstreams mit dem Strukturmodul in Python
Demo1-Ausgabeergebnisse

Detaillierte Erläuterung des Strukturmoduls

Hauptfunktionen

Die drei wichtigsten Funktionen im Strukturmodul sind pack(), unpack() , calcsize()

# 按照给定的格式化字符串,把数据封装成字符串(实际上是类似于c结构体的字节流)
string = struct.pack(fmt, v1, v2, ...)

# 按照给定的格式(fmt)解析字节流string,返回解析出来的tuple
tuple = unpack(fmt, string)

# 计算给定的格式(fmt)占用多少字节的内存
offset = calcsize(fmt)

Formatzeichenfolge in Struktur

Formate unterstützt in struct Wie in der folgenden Tabelle gezeigt:


Format C Type Python 字节数
x pad byte no value 1
c char string of length 1 1
b signed char integer 1
B unsigned char integer 1
? _Bool bool 1
h short integer 2
H unsigned short integer 2
i int integer 4
I unsigned int integer or lon 4
l long integer 4
L unsigned long long 4
q long long long 8
Q unsigned long long long 8
f float float 4
d double float 8
s char[] string 1
p char[] string 1
P void * long  

Hinweis 1: q und Q sind nur interessant, wenn die Maschine den 64-Bit-Betrieb unterstützt

Hinweis 2: Vor dem Format kann jeweils eine Zahl stehen, die die Zahl angibt

Hinweis 3: Das s-Format stellt eine Zeichenfolge einer bestimmten Länge dar, 4s stellt eine Zeichenfolge der Länge 4 dar, aber p stellt eine Pascal-Zeichenfolge dar

Hinweis 4: P wird zum Konvertieren eines Zeigers verwendet, seine Länge hängt von der Länge des Maschinenworts ab

Hinweis 5: Der letzte kann sein Wird zur Darstellung des Zeigertyps verwendet und belegt 4 Wörter. Abschnitt

Um Daten mit Strukturen in C auszutauschen, muss auch berücksichtigt werden, dass einige C- oder C++-Compiler die Byteausrichtung verwenden, normalerweise für 32- Bitsysteme in Einheiten von 4 Bytes. Daher wird die Struktur entsprechend der lokalen Maschinenbyte-Reihenfolge konvertiert. Das erste Zeichen im Format kann wie folgt verwendet werden:


Character Byte order Size and alignment
@ native native 凑够4个字节
= native standard 按原字节数
little-endian standard 按原字节数
> big-endian standard 按原字节数
! network (= big-endian) standard 按原字节数

Die Verwendungsmethode besteht darin, die erste Position von fmt einzufügen, genau wie „@5s6sif“.

Weitere Tutorials zum Betrieb von Byte-Stream/Binär-Stream durch das Strukturmodul in Python, achten Sie bitte auf die chinesische PHP-Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn