Heim >Backend-Entwicklung >Python-Tutorial >Interne Funktionsweise von Python

Interne Funktionsweise von Python

Susan Sarandon
Susan SarandonOriginal
2024-11-04 13:45:02497Durchsuche

Internal Working Of Python

Hier ist die vollständige Codedatei: Code

1. Quellcode

Wenn Sie ein Python-Skript schreiben, handelt es sich um für Menschen lesbaren Text. Dieser Quellcode ist der Ausgangspunkt für alles.

Ihr Python-Quellcode, geschrieben in einer .py-Datei, ist für Menschen lesbar. Dieser Code definiert, was Ihr Programm tut, indem er Variablen, Funktionen, Schleifen usw. angibt.

2. Kompilierung zu Bytecode (Compiler)

Wenn Sie ein Python-Programm ausführen, besteht der erste Schritt darin, den Quellcode in Bytecode zu kompilieren. Dies übernimmt der Python-Interpreter:

  • Syntaxprüfung: Stellt sicher, dass keine Syntaxfehler vorliegen.
  • Kompilierung: Übersetzt den Quellcode auf hoher Ebene in Bytecode, eine plattformunabhängige Darstellung auf niedrigerer Ebene. Dieser Bytecode befindet sich normalerweise in .pyc-Dateien im Verzeichnis __pycache__.
    • Compiler: Python verwendet einen Interpreter, kompiliert Ihren Quellcode jedoch zunächst in eine niedrigere Form, die als Bytecode bekannt ist.
  • Tokenisierung: Zerlegt Ihren Code in kleine Teile, sogenannte Token (wie Schlüsselwörter, Operatoren, Bezeichner).
  • Parsing: Analysiert die Token, um sicherzustellen, dass sie den Syntaxregeln von Python entsprechen.
  • Kontrollflussdiagramm (CFG): Stellt alle Pfade dar, die ein Programm während seiner Ausführung durchlaufen könnte.
  • Bytecode-Generierung: Konvertiert die analysierten Token in Bytecode, eine Reihe von Anweisungen für die Python Virtual Machine (PVM).

Internal Working Of Python

Lassen Sie uns tiefer in die Materie eintauchen.

Python-Compiler: Obwohl Python als interpretierte Sprache bekannt ist, verfügt es über einen Kompilierungsschritt. Hier ist die Aufschlüsselung:

Tokenisierung:

  • Zerlegt Ihren Code in kleine Teile, sogenannte Token (wie Schlüsselwörter, Operatoren, Bezeichner).
  1. Quellcode: Beginnt mit Ihrem geschriebenen Code.
  2. Tokenizer (Lexer): Dies zerlegt den Quellcode in kleinere Teile, sogenannte Token, wie Schlüsselwörter (für, wenn), Operatoren ( , -), Bezeichner (Variablennamen) und Literale (wie Zahlen oder Zeichenfolgen). .
  3. Parsing: Analysiert die Token, um sicherzustellen, dass sie den Syntaxregeln von Python entsprechen.
  4. Syntaxanalyse: Der Parser nimmt diese Token und prüft sie anhand der Grammatikregeln von Python.
  5. Parse Tree: Erstellt eine Baumstruktur aus den Token, die die grammatikalische Struktur des Codes darstellt.
  6. Semantische Analyse: Stellt sicher, dass der Code in Bezug auf Datentypen, Umfang und andere kontextspezifische Regeln sinnvoll ist.
  7. Kontrollflussdiagramm (CFG): Stellt alle Pfade dar, die ein Programm während seiner Ausführung durchlaufen könnte.
    • Kontrollflussdiagramm: Stellt alle möglichen Pfade dar, die während der Ausführung durch den Code genommen werden könnten.
    • Knoten und Kanten: Jeder Knoten stellt einen grundlegenden Codeblock dar, und Kanten stellen den Kontrollfluss von einem Block zum anderen dar.
  8. Bytecode-Generierung: Konvertiert die analysierten Token in Bytecode, eine Reihe von Anweisungen für die Python Virtual Machine (PVM).
    • Der Bytecode ist eine kompaktere Darstellung Ihres Quellcodes auf niedrigerer Ebene, optimiert für die Ausführung. Es ist plattformunabhängig, d. h. es kann auf jedem System mit einem kompatiblen PVM ausgeführt werden.
    • Bytecode: Der analysierte Code wird in Bytecode umgewandelt, eine plattformunabhängige Darstellung auf niedrigerer Ebene.
    • Befehlssatz: Dieser Bytecode ist ein Satz von Anweisungen, die die Python Virtual Machine (PVM) ausführen kann. Bytecode wird in .pyc-Dateien im Verzeichnis __pycache__ gespeichert, um zukünftige Ausführungen zu beschleunigen.

3. Bytecode wird geladen (Bytecode)

Nach der Kompilierung lädt die Python Virtual Machine den Bytecode:

  • Lesen aus dem Cache: Wenn der Bytecode zuvor kompiliert und nicht geändert wurde, wird er aus dem Cache (__pycache__) gelesen. Dadurch wird die Ausführung beschleunigt, da der Kompilierungsschritt übersprungen wird.
    • Der Bytecode wird in den Speicher geladen und kann ausgeführt werden. Der Bytecode wird dann vom PVM ausgeführt und interpretiert die Anweisungen zur Ausführung der Programmaufgaben.

4. Ausführung durch PVM (PVM)

Das PVM interpretiert nun den Bytecode und führt ihn aus:

  • Anweisungsausführung: Der PVM liest jede Bytecode-Anweisung und führt sie aus. Jede Anweisung entspricht einer bestimmten Operation, wie dem Laden eines Werts, dem Ausführen einer Arithmetik oder dem Aufrufen einer Funktion.
  • Speicherverwaltung: Verwaltet die Zuweisung und Freigabe von Speicher für Variablen und Objekte.

Speicherverwaltung in Python:

  1. Referenzzählung: Python verfolgt, wie viele Referenzen es auf ein Objekt im Speicher gibt. Wenn der Referenzzähler auf Null fällt, kann der vom Objekt belegte Speicher zurückgefordert werden.
  2. Objektzuordnung: Python-Objekte (wie Ganzzahlen, Zeichenfolgen, Listen) werden im Speicher erstellt, wenn der Code ausgeführt wird.
  3. Garbage Collection: Python verfügt über einen Garbage Collector, der bei der Speicherverwaltung hilft, indem er Speicher freigibt, der nicht mehr verwendet wird (d. h. Objekte mit einem Referenzzähler von Null).
  4. Speicherpooling: Python verwendet Speicherpools, um kleine Objekte effizienter zuzuweisen. Dieses Pooling trägt dazu bei, den Aufwand für die häufige Zuweisung und Freigabe kleiner Speicherblöcke zu reduzieren.
  5. Speicheroptimierung: Python wendet verschiedene Optimierungen an, um die Speichernutzung zu minimieren, wie zum Beispiel:
    • Das PVM führt verschiedene Laufzeitoptimierungen durch, um die Effizienz zu verbessern, wie z. B. die Just-in-Time-Kompilierung (JIT) in einigen Implementierungen (wie PyPy).
    • Wiederverwendung kleiner Ganzzahlen und interner Zeichenfolgen.
    • Effiziente Verwaltung von Datenstrukturen (z. B. Tupel, Listen, Wörterbücher).

Beispiele:

  • Bytecode-Caching: Der PVM speichert kompilierten Bytecode zwischen, um zu vermeiden, dass der Quellcode jedes Mal neu kompiliert wird. Dies beschleunigt nachfolgende Läufe.
  • Konstante Faltung: Dies beinhaltet die Vereinfachung konstanter Ausdrücke zur Kompilierungszeit und nicht zur Laufzeit. Beispielsweise könnte 3 * 2 zu 6 vorberechnet werden.

Zusammengefasst: Der PVM ist wie ein Orchesterdirigent, der den Bytecode nahtlos in Aktionen umwandelt, die Ihr Computer ausführen kann. Das Schöne daran ist, dass Python-Code dank PVM portierbar ist und ohne Modifikation auf verschiedenen Plattformen ausgeführt werden kann.

Wie können wir sehen, dass Bytecode generiert wurde oder nicht?

Wenn Sie ein Python-Modul importieren, kompiliert Python den Quellcode in Bytecode und speichert ihn im Verzeichnis __pycache__. Dies trägt dazu bei, zukünftige Importe zu beschleunigen, da das Modul nicht bei jedem Import neu kompiliert werden muss.

Hier ist der Prozess:

  • Erster Import: Wenn Sie ein Modul zum ersten Mal importieren, kompiliert Python die .py-Datei in Bytecode.
  • pycache-Verzeichnis: Der Bytecode wird im __pycache__-Verzeichnis gespeichert und hat einen Namen wie Modulname.cpython-312.pyc. # 312 ist die Python-Version.
  • Nachfolgende Importe: Bei nachfolgenden Importen überprüft Python das Verzeichnis __pycache__ auf den kompilierten Bytecode und verwendet ihn, wenn sich der Quellcode nicht geändert hat, wodurch der Importvorgang beschleunigt wird.

Beispiel:

Wir haben byte.py. Wenn wir nach der Ausführung von byte.py Code aus hello_world.py importieren, können wir sehen, dass es in diesem bestimmten Ordner ein Verzeichnis __pycache__ gibt, und wir können .pyc-Dateien sehen:

from hello_world import greet

greet("Byte code")


Durch die Verwendung von py_compile

py_compile-Modul, mit dem Sie Python-Quelldateien in Bytecode-Dateien kompilieren können. Dies ist eine praktische Möglichkeit, die Skriptausführung für zukünftige Ausführungen zu beschleunigen.

In byte.py

import py_compile

py_compile.compile('hello_world.py')

  • Das py_compile-Modul kompiliert hello_world.py in Bytecode.
  • Der resultierende Bytecode wird im Verzeichnis pycache gespeichert, wodurch eine Datei mit dem Namen hello_world.cpython-38.pyc (oder ähnlich, abhängig von Ihrer Python-Version) erstellt wird.

Bytecode generieren:

  • Das gesamte Skript wird ausgeführt, um den Bytecode zu generieren. Das bedeutet, dass jeder Code der obersten Ebene (wie print("Hello, World!") und print("c")) während des Kompilierungsprozesses ausgeführt wird.

Resultierender Bytecode:

  • Der Bytecode enthält alle Funktionen, Klassen und ausführbaren Anweisungen, die Python verwendet, um zukünftige Importe des Skripts zu beschleunigen.

dis-Modul

Das dis-Modul in Python wird verwendet, um Bytecode in eine besser lesbare Form zu zerlegen. Dies kann Ihnen helfen zu verstehen, was Ihr Python-Code unter der Haube tut. Es ist besonders nützlich zum Debuggen oder zum Erlernen der Interna von Python.

  • In internal.py haben wir
from hello_world import greet

greet("Byte code")


Ausgabe

import py_compile

py_compile.compile('hello_world.py')

  • Das Programm beginnt mit dem Import des dis-Moduls, einem leistungsstarken Tool zur Analyse von CPython-Bytecode. CPython ist die Standardimplementierung von Python und Bytecode ist eine Zwischensprache für den Python-Interpreter.
  • Als nächstes habe ich eine einfache Funktion namens „greet“ definiert. Diese Funktion übernimmt einen Parameternamen und gibt eine Begrüßung aus. Obwohl die Funktion selbst recht einfach ist, ist das, was in Python unter der Haube passiert, komplizierter, als es auf den ersten Blick erscheinen mag.
  • Die Funktion „assembly_function“ nutzt dis.dis(), um die Funktion „greet“ zu disassemblieren. dis.dis() übersetzt Python-Funktionen in den Low-Level-Bytecode, den die virtuelle Maschine von Python tatsächlich ausführt. Dieser Bytecode ist Pythons Interpretation unserer Begrüßungsfunktion und kommt dem Maschinencode einen Schritt näher.
  • Wenn das Skript „assembly_function()“ aufruft, präsentiert die Konsolenausgabe den Bytecode unserer Begrüßungsfunktion.

Das sagt uns der Bytecode:

  • LOAD_GLOBAL(0): Dieser Opcode wird verwendet, um die globale Variable zu laden, in diesem Fall die Druckfunktion.
  • LOAD_CONST(1): Dies lädt den konstanten Wert „Hallo,“ auf den Stapel.
  • LOAD_FAST(0): Dieser Opcode lädt den lokalen Variablennamen auf den Stapel.
  • FORMAT_VALUE(0): Dies formatiert unsere Namenszeichenfolge und bereitet sie für die Einfügung in die Zeichenfolge vor, die gerade erstellt wird.
  • BUILD_STRING(2): Dies nimmt die beiden obersten Werte auf dem Stapel („Hallo“, und Name) und erstellt die endgültige Zeichenfolge.
  • CALL_FUNCTION(1): Diese Zeile ruft die Funktion auf (globale Druckfunktion, die wir auf den Stapel geladen haben), mit der Argumentanzahl in Klammern (wir haben ein Argument, unsere formatierte Zeichenfolge).
  • POP_TOP: Dadurch wird die Oberseite des Stapels entfernt (das Ergebnis des vorherigen Aufrufs, da print None zurückgibt).
  • LOAD_CONST(0): Lädt Keine.
  • RETURN_VALUE: Dies ist der Rückgabewert der Greet-Funktion, der, da es keine explizite Return-Anweisung gibt, None ist.
  • Im Wesentlichen zeigt der Bytecode die einzelnen Operationen, die Python ausführt, um unsere Begrüßungsfunktion auszuführen. Das Verständnis dieser Anweisungen ist für Entwickler von entscheidender Bedeutung, um zu verstehen, wie Python Code ausführt, Funktionen optimiert und Ressourcen verwaltet – all dies geschieht nahtlos unter der Haube, wenn wir unseren Python-Code ausführen.

Ist das nicht ein herrlicher Tauchgang in den Python-Maschinenraum? Codieren Sie weiter und erforschen Sie weiterhin die Tiefen des Maschinenraums dieser Sprache?!

Das obige ist der detaillierte Inhalt vonInterne Funktionsweise von Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn