


Warum sollte man „memory_order_seq_cst“ für die Stopp-Flag-Einstellung verwenden, während die Überprüfung mit „memory_order_relaxed“ erfolgt?
In seiner Diskussion über atomare Operationen stellt Herb Sutter ein Beispiel für die Verwendung vor von Atomen, einschließlich eines Stop-Flag-Mechanismus:
- Ein Hauptthread initiiert mehrere Worker-Threads.
-
Worker-Threads überprüfen kontinuierlich das Stop-Flag:
while (!stop.load(std::memory_order_relaxed)) { // Do stuff. }
- Der Hauptthread setzt schließlich stop = true mit order=seq_cst und schließt sich dann den Workern an.
Gründe für die Nichtverwendung im Store Operation gelockert
Obwohl Herb vorschlägt, dass die Verwendung von „memory_order_relaxed“ zur Überprüfung des Flags aufgrund minimaler Latenzbedenken akzeptabel ist, gibt es keinen spürbaren Leistungsvorteil durch die Verwendung strengerer Speicherreihenfolgen, selbst wenn die Latenz Priorität hätte.
Die Begründung dahinter: Nein Die Verwendung von Lockerungen im Geschäftsbetrieb bleibt unklar, möglicherweise aufgrund eines Versehens oder einer persönlichen Präferenz.
Überlegungen zur Latenz
ISO-C-Standards schreiben keine spezifischen Zeitrahmen für die Sichtbarkeit des Geschäfts vor oder geben Sie Hinweise, wie Sie darauf Einfluss nehmen können. Diese Bestimmungen gelten für alle Atomoperationen, auch für entspannte. Es wird jedoch empfohlen, dass Implementierungen Speicherwerte innerhalb eines angemessenen Zeitrahmens für atomare Lasten zugänglich machen.
In der Praxis wird die spezifische Latenz durch die Implementierung bestimmt, wobei Hardware-Cache-Kohärenzmechanismen typischerweise eine Sichtbarkeit innerhalb von zehn Nanosekunden im besten Fall ermöglichen. Fallszenarien und Submikrosekunden-Intervalle in Fast-Worst-Case-Szenarien.
Auswirkungen auf die Speicherreihenfolge
Unterschiedliche Speicherreihenfolgen für Speicher- oder Ladevorgänge beschleunigen Speichervorgänge in Wirklichkeit nicht Zeitlich steuern sie lediglich, ob Folgevorgänge global sichtbar werden können, während der Laden noch aussteht.
Im Wesentlichen beschleunigen strengere Anordnungen und Barrieren Ereignisse nicht unbedingt, sondern verschieben andere eher, bis der Laden oder die Ladung abgeschlossen ist. Dies gilt für alle realen CPUs, die bestrebt sind, Speicher sofort für andere Kerne sichtbar zu machen.
Daher stellt eine Erhöhung der Speicherreihenfolge, wie z. B. die Verwendung von seq_cst, sicher, dass Änderungen am Stopp-Flag für den Worker sofort sichtbar sind Threads, was ein schnelles Herunterfahren garantiert. Dies hat jedoch keinen Einfluss auf die tatsächliche Sichtbarkeitslatenz.
Vorteile von Relaxed Check
Die Verwendung von „memory_order_relaxed“ für den Prüfvorgang hat mehrere Vorteile:
- Minimierte Parallelitätsengpässe auf Befehls- und Speicherebene.
- Reduzierter Overhead bei Architekturen mit eingeschränkter Parallelität auf Befehlsebene, insbesondere bei solchen mit hohen Kostenbarrieren.
- Vermeidung von Arbeitsverschwendung aufgrund von Verzweigungen Fehlvorhersagen zu Lastergebnissen.
Zusätzliche Überlegungen
Herb erkennt korrekt, dass die Verwendung von „relaxed“ für das Dirty-Flag aufgrund der von thread.join bereitgestellten Synchronisierung auch akzeptabel ist. Es sollte jedoch beachtet werden, dass Dirty Atomizität erfordert, um gleichzeitige Schreibvorgänge desselben Werts zu verhindern, was nach ISO-C-Standards immer noch als Datenwettlauf gilt.
Zusammenfassend lässt sich sagen, dass die Verwendung von „memory_order_seq_cst“ zum Setzen des Stoppflags eine sofortige Sicherstellung gewährleistet Wenn Sie die Sichtbarkeit für Arbeitsthreads verbessern, ergibt sich kein Leistungsvorteil, wenn Sie dies gegenüber dem Ladevorgang lockerer machen. „memory_order_relaxed“ bietet Vorteile hinsichtlich der Parallelität auf Befehlsebene und der Speicherbandbreitennutzung und ist daher in solchen Szenarien die bevorzugte Wahl.
Das obige ist der detaillierte Inhalt vonWarum „memory_order_seq_cst' zum Setzen des Stopp-Flags verwenden, aber „memory_order_relaxed' zum Überprüfen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

C -Lernende und Entwickler können Ressourcen und Unterstützung von Stackoverflow, Reddits R/CPP -Community, Coursera und EDX -Kursen, Open -Source -Projekten zu Github, professionellen Beratungsdiensten und CPPCON erhalten. 1. Stackoverflow gibt Antworten auf technische Fragen. 2. Die R/CPP -Community von Reddit teilt die neuesten Nachrichten; 3.. Coursera und EDX bieten formelle C -Kurse; 4. Open Source -Projekte auf Github wie LLVM und Boost verbessern die Fähigkeiten; 5. Professionelle Beratungsdienste wie Jetbrains und Perforce bieten technische Unterstützung; 6. CPPCON und andere Konferenzen helfen Karrieren

C# eignet sich für Projekte, die eine hohe Entwicklungseffizienz und plattformübergreifende Unterstützung erfordern, während C für Anwendungen geeignet ist, die eine hohe Leistung und die zugrunde liegende Kontrolle erfordern. 1) C# vereinfacht die Entwicklung, bietet Müllsammlung und reichhaltige Klassenbibliotheken, die für Anwendungen auf Unternehmensebene geeignet sind. 2) C ermöglicht den direkten Speicherbetrieb, der für Spielentwicklung und Hochleistungs-Computing geeignet ist.

C Gründe für die kontinuierliche Verwendung sind seine hohe Leistung, breite Anwendung und sich weiterentwickelnde Eigenschaften. 1) Leistung mit hoher Effizienz. 2) weit verbreitete: Glanz in den Feldern der Spieleentwicklung, eingebettete Systeme usw. 3) Kontinuierliche Entwicklung: Seit seiner Veröffentlichung im Jahr 1983 hat C weiterhin neue Funktionen hinzugefügt, um seine Wettbewerbsfähigkeit aufrechtzuerhalten.

Die zukünftigen Entwicklungstrends von C und XML sind: 1) C werden neue Funktionen wie Module, Konzepte und Coroutinen in den Standards C 20 und C 23 einführen, um die Programmierungseffizienz und -sicherheit zu verbessern. 2) XML nimmt weiterhin eine wichtige Position in den Datenaustausch- und Konfigurationsdateien ein, steht jedoch vor den Herausforderungen von JSON und YAML und entwickelt sich in einer prägnanteren und einfacheren Analyse wie die Verbesserungen von XMLSchema1.1 und XPATH3.1.

Das moderne C -Designmodell verwendet neue Funktionen von C 11 und darüber hinaus, um flexiblere und effizientere Software aufzubauen. 1) Verwenden Sie Lambda -Ausdrücke und STD :: Funktion, um das Beobachtermuster zu vereinfachen. 2) Die Leistung durch mobile Semantik und perfekte Weiterleitung optimieren. 3) Intelligente Zeiger gewährleisten die Sicherheit und das Management von Ressourcen.

C Die Kernkonzepte von Multithreading und gleichzeitiger Programmierung umfassen Thread -Erstellung und -management, Synchronisation und gegenseitige Ausschluss, bedingte Variablen, Thread -Pooling, asynchrones Programmieren, gemeinsame Fehler und Debugging -Techniken sowie Leistungsoptimierung sowie Best Practices. 1) Erstellen Sie Threads mit der STD :: Thread -Klasse. Das Beispiel zeigt, wie der Thread erstellt und wartet. 2) Synchronisieren und gegenseitige Ausschluss, um std :: mutex und std :: lock_guard zu verwenden, um gemeinsam genutzte Ressourcen zu schützen und den Datenwettbewerb zu vermeiden. 3) Zustandsvariablen realisieren Kommunikation und Synchronisation zwischen Threads über std :: Condition_Variable. 4) Das Beispiel des Thread -Pools zeigt, wie die Threadpool -Klasse verwendet wird, um Aufgaben parallel zu verarbeiten, um die Effizienz zu verbessern. 5) Asynchrones Programmieren verwendet std :: als

Die Speicherverwaltung, Hinweise und Vorlagen von C sind Kernfunktionen. 1. Die Speicherverwaltung zuteilt manuell manuell und freisetzt Speicher durch neue und löscht und achten Sie auf den Unterschied zwischen Haufen und Stapel. 2. Zeiger erlauben den direkten Betrieb von Speicheradressen und verwenden Sie sie mit Vorsicht. Intelligente Zeiger können das Management vereinfachen. 3. Template implementiert die generische Programmierung, verbessert die Wiederverwendbarkeit und Flexibilität der Code und muss die Typableitung und Spezialisierung verstehen.

C eignet sich für die Systemprogrammierung und Hardware-Interaktion, da es Steuerfunktionen in der Nähe von Hardware und leistungsstarke Funktionen der objektorientierten Programmierung bietet. 1) C über Merkmale auf niedrigem Niveau wie Zeiger, Speicherverwaltung und Bitbetrieb können effizienter Betrieb auf Systemebene erreicht werden. 2) Die Hardware -Interaktion wird über Geräte -Treiber implementiert, und C kann diese Treiber so schreiben, dass sie mit Hardware -Geräten über die Kommunikation umgehen.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

ZendStudio 13.5.1 Mac
Leistungsstarke integrierte PHP-Entwicklungsumgebung

EditPlus chinesische Crack-Version
Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung