Maison > Article > développement back-end > Quelles sont les techniques de codage et de décodage d’octets en Python ?
Quelles sont les techniques d'encodage et de décodage d'octets en Python ?
L'encodage et le décodage d'octets sont des problèmes que nous rencontrons souvent lors du traitement de données textuelles. En Python, il existe de nombreuses fonctions et modules intégrés qui nous aident à effectuer des opérations de codage et de décodage d'octets. Cet article présentera plusieurs techniques courantes de codage et de décodage d’octets et donnera des exemples de code correspondants.
La fonction encode() est une méthode en Python permettant d'encoder une chaîne Unicode en une séquence d'octets. Son utilisation générale est la suivante : string.encode(encoding), où encoding est le format d'encodage qui doit être utilisé. Les formats d'encodage couramment utilisés incluent UTF-8, UTF-16, ASCII, etc. Voici un exemple :
str = "你好,世界!" encoded_str = str.encode("UTF-8") print(encoded_str)
Le résultat est : b'Bonjour tout le monde ! '. Le résultat est un objet de type octets qui peut être enregistré directement dans un fichier ou transféré sur le réseau.
La fonction decode() est une méthode en Python permettant de décoder une séquence d'octets en une chaîne Unicode. Son utilisation générale est la suivante : séquence d'octets.decode (encodage), où encodage est le format de décodage qui doit être utilisé. Voici un exemple :
bytes = b'你好,世界!' decoded_str = bytes.decode("UTF-8") print(decoded_str)
Le résultat est : Bonjour tout le monde !
En Python, les objets chaîne et les objets octets peuvent être convertis les uns vers les autres. Les objets chaîne peuvent être codés en appelant la méthode encode() et les objets octets peuvent être décodés en appelant la méthode decode(). Voici un exemple :
str = "你好,世界!" encoded_bytes = str.encode("UTF-8") decoded_str = encoded_bytes.decode("UTF-8") print(decoded_str)
Le résultat est : Bonjour tout le monde !
Le module codecs est un module en Python spécialement conçu pour gérer l'encodage et le décodage des caractères. Il fournit la fonction open(), qui peut spécifier le format d'encodage lors de la lecture et de l'écriture de fichiers. Voici un exemple :
import codecs with codecs.open("file.txt", "w", encoding="UTF-8") as f: f.write("你好,世界!") with codecs.open("file.txt", "r", encoding="UTF-8") as f: content = f.read() print(content)
Le résultat est : Bonjour tout le monde !
Base64 est un format d'encodage courant qui peut être utilisé pour convertir des données binaires en caractères ASCII imprimables. Le module base64 de Python fournit les méthodes b64encode() et b64decode() pour l'encodage et le décodage Base64. Voici un exemple :
import base64 data = b"Hello, World!" encoded_data = base64.b64encode(data) print(encoded_data) decoded_data = base64.b64decode(encoded_data) print(decoded_data)
Les résultats de sortie sont : b'SGVsbG8sIFdvcmxkIQ==' et b'Hello, World !'.
Ci-dessus sont quelques techniques courantes d'encodage et de décodage d'octets en Python et leurs exemples de code. Le codage et le décodage d'octets constituent une partie importante du traitement des données textuelles. La maîtrise de ces compétences peut nous permettre de traiter les données textuelles de manière plus flexible. J'espère que cet article vous aidera !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!