Heim >Backend-Entwicklung >Python-Tutorial >Wie verwaltet Python String-IDs: Internierung, Speicherwiederverwendung und Optimierung?
String-IDs in Python: Internierung und Speicherwiederverwendung
In Python sind Strings unveränderlich. Wie die ersten Beispiele zeigen, kann sich die ID eines String-Literals jedoch bei wiederholter Auswertung ändern. Dieses Verhalten ist auf eine Kombination aus Pythons internen String-Verarbeitungsmechanismen und Speicheroptimierungsstrategien zurückzuführen.
CPythons Internierung
Obwohl dies in der Dokumentation von CPython nicht explizit definiert ist, interniert der Interpreter häufig Strings die häufig verwendet werden. Dabei werden häufig referenzierte Zeichenfolgen in einer globalen Tabelle gespeichert und derselbe Speicherort für identische Zeichenfolgen wiederverwendet. Wenn also zwei Zeichenfolgenliterale im selben Codeblock erscheinen oder an unterschiedliche Variablen gebunden sind, können sie dieselbe ID haben, wenn sie intern sind.
Speicherwiederverwendung und Garbage Collection
Sobald ein String-Objekt erstellt wurde, ist sein Speicherort nicht dauerhaft daran gebunden. Der Garbage Collector von Python kann Speicher von nicht verwendeten Objekten, einschließlich String-Objekten, zurückgewinnen. Wenn an keiner Stelle im Code mehr auf eine Zeichenfolge verwiesen wird, kann ihr Speicherort von einem neuen Zeichenfolgenobjekt wiederverwendet werden. Dies kann bei mehrmaliger Auswertung zu unterschiedlichen IDs für dasselbe String-Literal führen.
Compiler-Optimierungen
Python-Compiler führen häufig zur Laufzeit Optimierungen am Code durch. Für Zeichenfolgenliterale, die bestimmte Kriterien erfüllen (z. B. nur ASCII-Buchstaben, Ziffern oder Unterstriche enthalten), kann der Compiler sie internieren und ihre Erstellung optimieren. Dies bedeutet, dass nachfolgende Auswertungen desselben String-Literals innerhalb des optimierten Codes möglicherweise dieselbe ID erzeugen.
Dynamische Bindung und String-Internierung
Wenn eine Variable an a gebunden ist Mit einem String-Literal erstellt Python ein neues Objekt, das auf den internierten String verweist. Wenn der Name der Variablen die oben genannten Kriterien erfüllt, kann sie ebenfalls interniert werden, was dazu führt, dass der Variablenname und sein Wert dieselbe ID haben.
Verkettung und Internierung
Das Verketten von Zeichenfolgen in Python kann manchmal zu einer Internierung führen, wenn die resultierende Zeichenfolge innerhalb der Optimierungsgrenze des Compilers liegt (4096 Zeichen in Python 3.7). Daher können zwei verkettete Zeichenfolgen dieselbe ID haben, wenn sie einen gültigen Bezeichner ergeben und innerhalb des Grenzwerts liegen.
Das obige ist der detaillierte Inhalt vonWie verwaltet Python String-IDs: Internierung, Speicherwiederverwendung und Optimierung?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!