Heim >Backend-Entwicklung >Python-Tutorial >Tutorial zum Betrieb von Bytestreams/Binärstreams mit dem Strukturmodul in Python
Vor kurzem habe ich Python-Netzwerkprogrammierung gelernt und bin auf die Verwendung des Strukturmoduls gestoßen. Ich war mir nicht sicher, was es tut Relevante Informationen und ein grobes Verständnis davon. Dieser Artikel stellt hauptsächlich die Funktionsweise des Byte-Streams/Binär-Streams durch das Strukturmodul in Python vor.
Vorwort
Kürzlich wird Python zum Parsen des MNIST-Datensatzes im IDX-Dateiformat verwendet, und die Binärdatei muss gelesen werden. in dem ich verwende, ist das Strukturmodul. Ich habe viele Tutorials im Internet durchgesehen und sie waren alle sehr gut, aber für Anfänger nicht besonders geeignet. Deshalb habe ich einige Notizen neu geordnet, um Ihnen den schnellen Einstieg zu erleichtern.
Hinweis: Die folgenden vier Begriffe im Tutorial sind synonym: Binärstrom, Binärarray, Bytestrom, Bytearray
Schnell loslegen
Konvertieren Sie im Strukturmodul eine Ganzzahl, eine Gleitkommazahl oder einen Zeichenstrom (Zeichenarray) in einen Bytestrom (Wortabschnittsarray). , müssen Sie die Formatzeichenfolge fmt verwenden, um dem Strukturmodul mitzuteilen, welcher Objekttyp konvertiert werden soll. Beispielsweise ist eine Ganzzahl „i“, eine Gleitkommazahl „f“ und ein ASCII-Codezeichen „s“. '.
def demo1(): # 使用bin_buf = struct.pack(fmt, buf)将buf为二进制数组bin_buf # 使用buf = struct.unpack(fmt, bin_buf)将bin_buf二进制数组反转换回buf # 整型数 -> 二进制流 buf1 = 256 bin_buf1 = struct.pack('i', buf1) # 'i'代表'integer' ret1 = struct.unpack('i', bin_buf1) print bin_buf1, ' <====> ', ret1 # 浮点数 -> 二进制流 buf2 = 3.1415 bin_buf2 = struct.pack('d', buf2) # 'd'代表'double' ret2 = struct.unpack('d', bin_buf2) print bin_buf2, ' <====> ', ret2 # 字符串 -> 二进制流 buf3 = 'Hello World' bin_buf3 = struct.pack('11s', buf3) # '11s'代表长度为11的'string'字符数组 ret3 = struct.unpack('11s', bin_buf3) print bin_buf3, ' <====> ', ret3 # 结构体 -> 二进制流 # 假设有一个结构体 # struct header { # int buf1; # double buf2; # char buf3[11]; # } bin_buf_all = struct.pack('id11s', buf1, buf2, buf3) ret_all = struct.unpack('id11s', bin_buf_all) print bin_buf_all, ' <====> ', ret_all
Die Ausgabeergebnisse lauten wie folgt:
Demo1-Ausgabeergebnisse
Detaillierte Erläuterung des Strukturmoduls
Hauptfunktionen
Die drei wichtigsten Funktionen im Strukturmodul sind pack()
, unpack()
, calcsize()
# 按照给定的格式化字符串,把数据封装成字符串(实际上是类似于c结构体的字节流) string = struct.pack(fmt, v1, v2, ...) # 按照给定的格式(fmt)解析字节流string,返回解析出来的tuple tuple = unpack(fmt, string) # 计算给定的格式(fmt)占用多少字节的内存 offset = calcsize(fmt)
Formatzeichenfolge in Struktur
Formate unterstützt in struct Wie in der folgenden Tabelle gezeigt:
Format | C Type | Python | 字节数 |
---|---|---|---|
x | pad byte | no value | 1 |
c | char | string of length 1 | 1 |
b | signed char | integer | 1 |
B | unsigned char | integer | 1 |
? | _Bool | bool | 1 |
h | short | integer | 2 |
H | unsigned short | integer | 2 |
i | int | integer | 4 |
I | unsigned int | integer or lon | 4 |
l | long | integer | 4 |
L | unsigned long | long | 4 |
q | long long | long | 8 |
Q | unsigned long long | long | 8 |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | string | 1 |
p | char[] | string | 1 |
P | void * | long |
Hinweis 1: q und Q sind nur interessant, wenn die Maschine den 64-Bit-Betrieb unterstützt
Hinweis 2: Vor dem Format kann jeweils eine Zahl stehen, die die Zahl angibt
Hinweis 3: Das s-Format stellt eine Zeichenfolge einer bestimmten Länge dar, 4s stellt eine Zeichenfolge der Länge 4 dar, aber p stellt eine Pascal-Zeichenfolge dar
Hinweis 4: P wird zum Konvertieren eines Zeigers verwendet, seine Länge hängt von der Länge des Maschinenworts ab
Hinweis 5: Der letzte kann sein Wird zur Darstellung des Zeigertyps verwendet und belegt 4 Wörter. Abschnitt
Um Daten mit Strukturen in C auszutauschen, muss auch berücksichtigt werden, dass einige C- oder C++-Compiler die Byteausrichtung verwenden, normalerweise für 32- Bitsysteme in Einheiten von 4 Bytes. Daher wird die Struktur entsprechend der lokalen Maschinenbyte-Reihenfolge konvertiert. Das erste Zeichen im Format kann wie folgt verwendet werden:
Character | Byte order | Size and alignment |
---|---|---|
@ | native | native 凑够4个字节 |
= | native | standard 按原字节数 |
little-endian | standard 按原字节数 | |
> | big-endian | standard 按原字节数 |
! | network (= big-endian) | standard 按原字节数 |
Die Verwendungsmethode besteht darin, die erste Position von fmt einzufügen, genau wie „@5s6sif“.
Weitere Tutorials zum Betrieb von Byte-Stream/Binär-Stream durch das Strukturmodul in Python, achten Sie bitte auf die chinesische PHP-Website!