Heim  >  Artikel  >  Backend-Entwicklung  >  Wie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen

Wie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen

王林
王林nach vorne
2019-08-24 09:51:012616Durchsuche

PHP gilt als einfach, aber es ist nicht leicht, es zu beherrschen. Wir müssen nicht nur in der Lage sein, es zu verwenden, sondern auch das zugrunde liegende Funktionsprinzip kennen.

PHP ist eine dynamische Sprache, die für die Webentwicklung geeignet ist. Genauer gesagt handelt es sich um ein Software-Framework, das die Sprache C verwendet, um eine große Anzahl von Komponenten zu implementieren. Im engeren Sinne kann es als leistungsstarkes UI-Framework betrachtet werden.

Was ist der Zweck, die zugrunde liegende Implementierung von PHP zu verstehen? Wenn Sie dynamische Sprache gut nutzen möchten, müssen Sie zunächst verstehen, dass Speicherverwaltungs- und Framework-Modelle unserer Referenz würdig sind. Durch erweiterte Entwicklung können wir leistungsfähigere Funktionen erreichen und die Leistung unserer Programme optimieren.

1. PHP-Designkonzept und -Eigenschaften

Multiprozessmodell: Da PHP ein Multiprozessmodell ist, stören sich verschiedene Anforderungen nicht gegenseitig, was gewährleistet Dass eine Anfrage hängen bleibt Der Verlust hat keine Auswirkungen auf den Gesamtdienst. Natürlich hat PHP mit der Entwicklung der Zeit bereits das Multithreading-Modell unterstützt. Schwach typisierte Sprache: Im Gegensatz zu C/C++, Java, C# und anderen Sprachen ist PHP eine schwach typisierte Sprache. Der Typ einer Variablen wird nicht zu Beginn bestimmt und es kann zu einer impliziten oder expliziten Typkonvertierung kommen. Die Flexibilität dieses Mechanismus ist in der Webentwicklung sehr praktisch sind detailliert in. Das Modell Engine (Zend) + Komponente (ext) reduziert die interne Kopplung. Die mittlere Schicht (Sapi) isoliert den Webserver und PHP. Die Syntax ist einfach und flexibel, ohne zu viele Spezifikationen. Mängel führen zu gemischten Stilen, aber egal wie schlecht ein Programmierer ist, er wird kein Programm schreiben, das zu unverschämt ist und die Gesamtsituation gefährdet.

2. Das vierschichtige System von PHP

Die Kernarchitektur von PHP ist wie folgt:

Wie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen

Aus dem Bild ist ersichtlich, dass PHP von unten nach oben ein 4-Schichten-System ist:

Zend-Engine: Zend ist vollständig in reinem C implementiert und ist der Kernbestandteil von PHP. Es übersetzt PHP-Code (lexikalisch). , Syntaxanalyse usw.) Der Kompilierungsprozess verarbeitet ausführbare Opcodes und implementiert entsprechende Verarbeitungsmethoden, implementiert grundlegende Datenstrukturen (wie Hashtable, oo), Speicherzuweisung und -verwaltung und stellt entsprechende API-Methoden für externe Aufrufe bereit Die Peripheriefunktionen sind alle rund um Zend implementiert. Erweiterungen: Rund um die Zend-Engine stellen Erweiterungen verschiedene grundlegende Dienste auf Komponentenbasis bereit (z. B. Array-Serien), Standardbibliotheken usw., die alle durch Erweiterungen implementiert werden können nach Bedarf, um Funktionserweiterungen, Leistungsoptimierungen und andere Zwecke zu erreichen (z. B. sind die PHP-Mittelschicht und die Rich-Text-Analyse, die derzeit von Tieba verwendet werden, typische Erweiterungsanwendungen). Sapi: Der vollständige Name von Sapi ist Server Application Programming Interface. Dabei handelt es sich um eine Server-Anwendungsprogrammierschnittstelle, die es PHP ermöglicht, über eine Reihe von Hook-Funktionen mit PHP zu interagieren. PHP kann erfolgreich integriert werden Da es von Anwendungen der oberen Schicht entkoppelt und isoliert ist, kann PHP nicht mehr überlegen, wie es mit verschiedenen Anwendungen kompatibel sein soll, und die Anwendung selbst kann auch unterschiedliche Verarbeitungsmethoden basierend auf ihren eigenen Eigenschaften implementieren. Oberschichtanwendung: Dies ist das PHP-Programm, das wir normalerweise schreiben. Wir erhalten verschiedene Anwendungsmodi über verschiedene Sapi-Methoden, z. B. die Implementierung von Webanwendungen über den Webserver, deren Ausführung im Skriptmodus auf der Befehlszeile usw.

Wenn PHP ein Auto ist, dann ist der Rahmen des Autos PHP selbst, Zend ist der Motor (Motor) des Autos und die verschiedenen Komponenten unter Ext sind die Räder des Autos B. eine Straße, und das Auto kann auf verschiedenen Straßentypen fahren, und die Ausführung eines PHP-Programms bedeutet, dass das Auto auf der Straße fährt. Deshalb brauchen wir: einen leistungsstarken Motor + die richtigen Räder + die richtige Spur.

3. Sapi

Wie oben erwähnt, ermöglicht Sapi externen Anwendungen den Datenaustausch mit PHP über eine Reihe von Schnittstellen und kann spezifische Funktionen entsprechend den Eigenschaften verschiedener Schnittstellen implementieren Einige unserer gängigen Sapi-Verarbeitungsmethoden sind:

Apache2handler: Dies ist die Verarbeitungsmethode, wenn Apache als Webserver verwendet wird und im mod_PHP-Modus ausgeführt wird. cgi: Dies ist eine weitere direkte Interaktionsmethode zwischen Webserver und PHP, das berühmte Fastcgi-Protokoll. In den letzten Jahren wurde fastcgi + PHP immer häufiger verwendet und ist auch die einzige Methode, die von asynchronen Webservern unterstützt wird. cli: Anwendungsmodus für Befehlszeilenaufrufe

4. PHP-Ausführungsprozess und Opcode

Werfen wir zunächst einen Blick auf den Prozess der Ausführung von PHP-Code.

Wie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen

Wie Sie auf dem Bild sehen können, implementiert PHP einen typischen dynamischen Sprachausführungsprozess: Nach Erhalt eines Codestücks, nach Durchlaufen von Phasen wie der lexikalischen Analyse und der Syntaxanalyse, der Quelle Das Programm wird in Anweisungen (Opcodes) übersetzt, und dann führt die virtuelle ZEND-Maschine diese Anweisungen nacheinander aus, um den Vorgang abzuschließen. PHP selbst ist in C implementiert, daher sind die letztendlich aufgerufenen Funktionen alle C-Funktionen. Tatsächlich können wir PHP als eine in C entwickelte Software betrachten.

Der Kern der PHP-Ausführung sind die übersetzten Anweisungen, bei denen es sich um Opcodes handelt.

Opcode ist die grundlegendste Einheit der PHP-Programmausführung. Ein Opcode besteht aus zwei Parametern (op1, op2), einem Rückgabewert und einer Verarbeitungsfunktion. Das PHP-Programm wird letztendlich in die sequentielle Ausführung einer Reihe von Opcode-Verarbeitungsfunktionen übersetzt.

Mehrere gängige Verarbeitungsfunktionen:

PHP

ZEND_ASSIGN_SPEC_CV_CV_HANDLER: Variablenzuweisung ($a=$b)

ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER: Funktionsaufruf

ZEND_CONCAT_SPEC_CV_CV_HANDLER: String-Verkettung $a.$b

ZEND_ADD_SPEC_CV_CONST_HANDLER: Addition $a+2

ZEND_IS_EQUAL_SPEC_CV_CONST : Beurteilung der Gleichheit $a==1

ZEND_IS_IDENTICAL_SPEC_CV_CONST: Beurteilung der Gleichheit $a===1

5. HashTable – Kerndatenstruktur

HashTable ist die Kerndatenstruktur von Zend. Sie wird verwendet, um fast alle gängigen Funktionen in PHP zu implementieren. Darüber hinaus sind in Zend auch Funktionssymboltabellen und globale Variablen enthalten auf Hash-Tabelle zu erreichen.

Die Hash-Tabelle von PHP weist die folgenden Eigenschaften auf:

1. Unterstützt typische Schlüssel-Wert-Abfragen

2. Kann als Array verwendet werden

3, das Hinzufügen und Löschen von Knoten ist O(1)-Komplexität

4. Schlüssel unterstützt gemischte Typen: Es gibt sowohl assoziative Arrays als auch Index-Arrays

5. Wert unterstützt gemischte Typen: Array ("string " ,2332)

6. Unterstützt lineare Durchquerung: wie foreach

Zend-Hash-Tabelle implementiert eine typische Hash-Tabellen-Hash-Struktur und sorgt gleichzeitig für Vorwärts- und Rückwärtsbewegungen durch Anhängen einer doppelten Verknüpfung list Funktion zum Durchlaufen eines Arrays. Seine Struktur ist wie folgt:

Wie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen

Es ist ersichtlich, dass es in der Hash-Tabelle sowohl eine Schlüssel->Wert-Hash-Struktur als auch einen doppelt verknüpften Listenmodus gibt Dass Es kann sehr bequem eine schnelle Suche und eine lineare Durchquerung unterstützen.

Hash-Struktur: Die Hash-Struktur von Zend ist ein typisches Hash-Tabellenmodell, das eine verknüpfte Liste verwendet, um Konflikte zu lösen. Es ist zu beachten, dass die Hash-Tabelle von Zend eine selbstwachsende Datenstruktur ist. Wenn die Anzahl der Hash-Tabellen voll ist, wird sie dynamisch um das Zweifache erweitert und Elemente neu positioniert. Die Anfangsgröße beträgt 8. Darüber hinaus hat Zend selbst bei der Durchführung der schnellen Schlüssel->Wertsuche einige Optimierungen vorgenommen, um den Prozess durch den Austausch von Raum gegen Zeit zu beschleunigen. Beispielsweise wird in jedem Element eine Variable nKeyLength verwendet, um die Länge des Schlüssels zur schnellen Bestimmung zu identifizieren.

Doppelt verknüpfte Liste: Die Zend-Hash-Tabelle implementiert die lineare Durchquerung von Elementen durch eine verknüpfte Listenstruktur. Theoretisch reicht es aus, eine einseitig verknüpfte Liste zum Durchlaufen zu verwenden. Der Hauptzweck der Verwendung einer zweiseitig verknüpften Liste besteht darin, das Durchlaufen schnell zu löschen und zu vermeiden. Die Zend-Hash-Tabelle ist eine zusammengesetzte Struktur, die gängige assoziative Arrays unterstützt und auch als sequentielle Indexnummern verwendet werden kann und sogar eine Mischung aus beiden ermöglicht.

PHP-Assoziatives Array: Assoziatives Array ist eine typische hash_table-Anwendung. Ein Abfrageprozess durchläuft die folgenden Schritte (wie aus dem Code ersichtlich ist, handelt es sich hierbei um einen üblichen Hash-Abfrageprozess und es werden einige schnelle Urteile hinzugefügt, um die Suche zu beschleunigen.):

PHP

getKeyHashValue h;
index = n & nTableMask;
Bucket *p = arBucket[index];
while (p) {
if ((p->h == h) & (p->nKeyLength == nKeyLength)) {
RETURN p->data;  
}
p=p->next;
}
RETURN FALTURE;

PHP-Index-Array:

Das Index-Array ist unser gemeinsames Array, auf das über Indizes zugegriffen wird. Beispiel: $arr[0], Zend HashTable wird intern normalisiert und der Hash-Wert und nKeyLength (0) werden auch dem Indextypschlüssel zugewiesen. Die interne Mitgliedsvariable nNextFreeElement ist die aktuell zugewiesene maximale ID, die nach jedem Push automatisch um eins erhöht wird. Es ist dieser Normalisierungsprozess, der es PHP ermöglicht, eine Mischung aus assoziativen und nicht-assoziativen Daten zu erreichen. Aufgrund der Besonderheit des Push-Vorgangs wird die Reihenfolge der Indexschlüssel im PHP-Array nicht durch die Größe des Index bestimmt, sondern durch die Reihenfolge des Pushs. Zum Beispiel: $arr[1] = 2; $arr[2] = 3; für Schlüssel vom Typ Double behandelt Zend HashTable sie als Indexschlüssel

6 >

PHP ist eine schwach typisierte Sprache und unterscheidet die Variablentypen nicht streng. PHP muss beim Deklarieren von Variablen den Typ nicht angeben. PHP kann während der Programmausführung implizite Konvertierungen von Variablentypen durchführen. Wie bei anderen stark typisierten Sprachen kann auch eine explizite Typkonvertierung im Programm durchgeführt werden. PHP-Variablen können in einfache Typen (int, string, bool), Sammlungstypen (Array-Ressourcenobjekt) und Konstanten (const) unterteilt werden. Alle oben genannten Variablen haben unter der Haube die gleiche zval-Struktur.

Zval ist eine weitere sehr wichtige Datenstruktur in Zend, die zum Identifizieren und Implementieren von PHP-Variablen verwendet wird. Die Datenstruktur ist wie folgt:

Wie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen

Zval besteht hauptsächlich aus bestehend aus drei Teilen:

Typ: Gibt den Typ der Variablen an (Ganzzahl, Zeichenfolge, Array usw.)

refcount&is_ref: Wird zur Implementierung der Referenzzählung verwendet (detaillierte Einführung später)

Wert: Der Kernteil, der die tatsächlichen Daten der Variablen speichert

Zvalue wird zum Speichern der tatsächlichen Daten einer Variablen verwendet. Da mehrere Typen gespeichert werden müssen, ist zvalue eine Union und implementiert somit eine schwache Typisierung.

Die entsprechende Beziehung zwischen PHP-Variablentypen und ihrer tatsächlichen Speicherung ist wie folgt:

1, IS_LONG   -> lvalue

2, IS_DOUBLE -> dvalue

3 , IS_ARRAY  -> ht

4, IS_STRING -> str

5, IS_RESOURCE -> lvalue

Referenzzählung wird häufig beim Speicherrecycling, bei String-Operationen usw. verwendet. Variablen in PHP sind eine typische Anwendung der Referenzzählung. Die Referenzzählung von Zval wird über die Mitgliedsvariablen is_ref und ref_count implementiert. Durch die Referenzzählung können mehrere Variablen dieselben Daten teilen. Vermeiden Sie den enormen Verbrauch, der durch häufiges Kopieren entsteht.

Beim Ausführen einer Zuweisungsoperation verweist Zend die Variable auf denselben zval und ref_count++ und während der nicht gesetzten Operation auf den entsprechenden ref_count-1. Der Zerstörungsvorgang wird nur ausgeführt, wenn ref_count auf 0 reduziert wird. Wenn es sich um eine Referenzzuweisung handelt, ändert Zend is_ref auf 1.

PHP-Variablen realisieren die gemeinsame Nutzung von Daten durch Referenzzählung. Was passiert, wenn Sie den Wert einer der Variablen ändern? Wenn Zend beim Versuch, eine Variable zu schreiben, feststellt, dass der ZVAL, auf den die Variable zeigt, von mehreren Variablen gemeinsam genutzt wird, kopiert es einen ZVAL mit einem Ref_Count von 1 und verringert den RefCount des ursprünglichen ZVAL. Dieser Vorgang wird als „ZVAL-Trennung“ bezeichnet ". Es ist ersichtlich, dass Zend nur dann Kopiervorgänge ausführt, wenn ein Schreibvorgang auftritt. Daher wird dies auch als Copy-on-Write (Kopieren beim Schreiben) bezeichnet.

Für Referenzvariablen gelten entgegengesetzte Anforderungen wie für Nicht-Referenztypen . Referenzzuweisungsvariablen müssen gebündelt werden.

Ganzzahlen und Gleitkommazahlen gehören zu den Grundtypen in PHP und sind auch einfache Variablen. Für Ganzzahlen und Gleitkommazahlen werden die entsprechenden Werte direkt in zvalue gespeichert. Ihre Typen sind lang bzw. doppelt.

Wie aus der zvalue-Struktur ersichtlich ist, unterscheidet PHP im Gegensatz zu stark typisierten Sprachen wie C nicht zwischen int, unsigned int, long, long long und anderen Typen. Nur Ganzzahlen. Ein Typ ist lang. Daraus ist ersichtlich, dass in PHP der Wertebereich von Ganzzahlen durch die Anzahl der Compiler-Bits bestimmt wird und nicht festgelegt ist.

Bei Gleitkommazahlen wird, ähnlich wie bei ganzen Zahlen, nicht zwischen Float und Double, sondern nur Double unterschieden.

Was soll ich in PHP tun, wenn der Ganzzahlbereich außerhalb der Grenzen liegt? In diesem Fall wird es automatisch in den Double-Typ konvertiert. Sie müssen dabei vorsichtig sein, da dies zu vielen Tricks führt.

Zeichenvariablen sind wie Ganzzahlen auch Grundtypen und einfache Variablen in PHP. Aus der zvalue-Struktur ist ersichtlich, dass in PHP ein String aus einem Zeiger auf die tatsächlichen Daten und einer Längenstruktur besteht, die dem String in C++ ähnelt. Da die Länge im Gegensatz zu c durch eine tatsächliche Variable dargestellt wird, kann es sich bei der Zeichenfolge um Binärdaten (einschließlich) handeln. Gleichzeitig ist das Ermitteln der Zeichenfolgenlänge strlen eine O(1)-Operation.

Beim Hinzufügen, Ändern oder Anhängen von String-Operationen weist PHP den Speicher neu zu, um neue Strings zu generieren. Aus Sicherheitsgründen fügt PHP beim Generieren einer Zeichenfolge immer noch

hinzu. Gängige String-Splicing-Methoden und Geschwindigkeitsvergleich:

Angenommen, es gibt die folgenden 4 Variablen: $strA= '. 123'; $strB = '456'; $intA=123; intB=456;

Jetzt vergleichen und erklären wir die folgenden String-Splicing-Methoden:

PHP

$res = $strA.$strB und $res = „$strA$strB“

In diesem Fall mallociert Zend einen Teil des Speichers neu und verarbeitet ihn entsprechend seiner Geschwindigkeit ist im Allgemeinen

$strA = $strA.$strB

Dies ist die schnellste Methode. Zend wird direkt basierend auf dem aktuellen strA neu lokalisiert, um wiederholtes Kopieren zu vermeiden

$res = $ intA.$intB

Dies ist langsamer, da eine implizite Formatkonvertierung erforderlich ist. Bei der tatsächlichen Programmierung sollten Sie auch darauf achten,

$strA = sprintf ( "%s%s",$ strA.$strB);

Dies ist der langsamste Weg, da sprintf keine Sprachstruktur in PHP ist. Die Identifizierung und Verarbeitung des Formats nimmt außerdem viel Zeit in Anspruch. Die Sprintf-Methode ist jedoch die am besten lesbare Methode und kann in der Praxis je nach den spezifischen Umständen flexibel ausgewählt werden.

PHP-Arrays werden natürlich durch Zend HashTable implementiert.

Wie implementiert man eine foreach-Operation? Foreach auf einem Array wird durch Durchlaufen der doppelt verknüpften Liste in der Hashtabelle vervollständigt. Bei Index-Arrays ist die Durchquerung von foreach viel effizienter als bei for, sodass keine Suche nach Schlüssel->Werten erforderlich ist. Die Zähloperation ruft direkt die Operation HashTable->NumOfElements, O(1) auf. Für eine Zeichenfolge wie „123“ konvertiert Zend sie in ihre Ganzzahlform. $arr[‘123’] und $arr[123] sind äquivalent

Ressourcentypvariablen sind die komplexesten Variablen in PHP und stellen ebenfalls eine zusammengesetzte Struktur dar.

Zval von PHP kann ein breites Spektrum an Datentypen darstellen, es ist jedoch schwierig, benutzerdefinierte Datentypen vollständig zu beschreiben. Da es keine effiziente Möglichkeit gibt, diese zusammengesetzten Strukturen darzustellen, gibt es keine Möglichkeit, herkömmliche Operatoren für sie zu verwenden. Um dieses Problem zu lösen, müssen Sie lediglich über einen im Wesentlichen willkürlichen Bezeichner (Label), der als Ressource bezeichnet wird, auf den Zeiger verweisen.

In zval wird lval für Ressourcen als Zeiger verwendet, der direkt auf die Adresse der Ressource zeigt. Die Ressource kann eine beliebige zusammengesetzte Struktur sein. Die bekannten Ressourcen mysqli, fsock, memcached usw.

So verwenden Sie Ressourcen:

Registrierung: Sie möchten einen benutzerdefinierten Datentyp als Ressource verwenden. Zuerst müssen Sie es registrieren, und Zend weist ihm eine weltweit eindeutige Kennung zu. Holen Sie sich eine Ressourcenvariable: Für Ressourcen verwaltet Zend eine id->hash_tale der tatsächlichen Daten. Für eine Ressource wird nur ihre ID in zval aufgezeichnet. Suchen Sie beim Abrufen den spezifischen Wert in der hash_table über die ID und geben Sie ihn zurück. Ressourcenzerstörung: Die Datentypen von Ressourcen sind vielfältig. Zend selbst hat keine Möglichkeit, es zu zerstören. Daher müssen Benutzer bei der Registrierung von Ressourcen eine Zerstörungsfunktion bereitstellen. Wenn Ressourcen nicht festgelegt sind, ruft Zend die entsprechende Funktion auf, um die Zerstörung abzuschließen. Löschen Sie es auch aus der globalen Ressourcentabelle.

Eine Ressource kann lange bestehen bleiben, nicht nur nachdem alle Variablen, die auf sie verweisen, den Gültigkeitsbereich verlassen, sondern auch nachdem eine Anfrage endet und eine neue Anfrage gestellt wird. Diese Ressourcen werden als persistente Ressourcen bezeichnet, da sie während des gesamten Lebenszyklus der SAPI bestehen bleiben, sofern sie nicht ausdrücklich zerstört werden. In vielen Fällen können persistente Ressourcen die Leistung bis zu einem gewissen Grad verbessern. In unserem gemeinsamen mysql_pconnect weisen persistente Ressourcen beispielsweise Speicher über pemalloc zu, sodass sie nicht freigegeben werden, wenn die Anforderung endet.
Für Zend gibt es keinen Unterschied zwischen den beiden.

Wie werden lokale Variablen und globale Variablen in PHP implementiert? Bei einer Anfrage kann PHP jederzeit zwei Symboltabellen (symbol_table und active_symbol_table) sehen, wobei erstere zur Verwaltung globaler Variablen verwendet wird. Letzteres ist ein Zeiger, der auf die aktuell aktive Variablensymboltabelle zeigt. Wenn das Programm eine Funktion aufruft, weist zend ihr eine Symboltabelle x zu und zeigt active_symbol_table auf a. Auf diese Weise wird die Unterscheidung zwischen globalen und lokalen Variablen erreicht.

Variablenwerte abrufen: Die PHP-Symboltabelle wird über hash_table implementiert. Beim Abrufen wird der entsprechende zval entsprechend der Kennung ermittelt und zurückgegeben.

Globale Variablen in Funktionen verwenden: In Funktionen können wir globale Variablen verwenden, indem wir sie explizit als global deklarieren. Erstellen Sie einen Verweis auf die Variable mit demselben Namen in symbol_table in active_symbol_table. Wenn in symbol_table keine Variable mit demselben Namen vorhanden ist, wird diese zuerst erstellt.

Weitere verwandte Fragen finden Sie auf der chinesischen PHP-Website: Praktisches PHP-Video-Tutorial

Das obige ist der detaillierte Inhalt vonWie versteht man den zugrunde liegenden Funktionsmechanismus und die Prinzipien von PHP? Es reicht aus, diesen Artikel zu verstehen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:cnblogs.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen