


Deoptimierung eines Programms für die Pipeline in CPUs der Intel Sandybridge-Familie
Ziel: Ein Programm so zu optimieren, dass es langsamer läuft, indem das Wissen darüber ausgenutzt wird der Intel i7 Pipeline.
Problem:
Die Aufgabe bot zwei Optionen: Whetstone- oder Monte-Carlo-Programme. Der Student entschied sich für das Monte-Carlo-Simulationsprogramm, aber seine Pessimisierungsbemühungen verlängerten die Codelaufzeit nur um eine Sekunde.
Frage:
Wie kann der Student weiter pessimieren? Der Code, um eine größere Bedeutung zu erreichen Verlangsamung?
Antwort:
Allgemeine Strategien:
- Führen Sie unvorhersehbare Zweige ein, um die Strafen für Fehlvorhersagen zu erhöhen.
- Verlängern Sie schleifengeführte Abhängigkeitsketten, um die Befehlsebene zu reduzieren Parallelität.
- Verwenden Sie langsamere FP-Operationen und Divs, insbesondere Exp- und Log-Funktionen.
Uarch-spezifische Ideen:
Mit Eigenheiten (
- Verwenden Sie movnti, um Daten aus dem Cache zu entfernen.
- Verwenden Sie Ganzzahl-Shuffles zwischen FP-Matheoperationen, um Umgehungsverzögerungen zu verursachen.
- Vermeiden Sie das Mischen von SSE- und AVX-Anweisungen ohne Verwendung vzeroupper.
Mit (inline) asm:
- Ausrichtungsprobleme erzwingen, um den UOP-Cache zu unterbrechen.
- Verwenden Sie selbst- Code ändern, um Pipeline-Löschvorgänge auszulösen.
Cache-Fehler hervorrufen und Speicherverlangsamung:
- Führen Sie enge Speichervorgänge aus, um Speicherweiterleitungsverzögerungen zu verursachen.
- Ersetzen Sie lokale Variablen durch Mitglieder einer großen Struktur, um das Speicherlayout zu steuern.
- Ordnen Sie das Speicherlayout, um Cache-Fehler und Seitenaufteilungslasten zu erhöhen.
- Verwenden Sie falsch ausgerichtete Variablen zum Überspannen Cache-Zeilen- oder Seitengrenzen.
- Arrays in nicht zusammenhängender Reihenfolge durchlaufen.
- Erwägen Sie die Verwendung verknüpfter Listen anstelle von Arrays.
Andere Techniken :
- Verwenden std::atomic
Schleifenzähler für langsamere atomare Operationen. - Kompilieren Sie mit -m32 oder -march=i386, um eine langsamere Codegenerierung zu erzwingen.
- Erzwingen Sie lange Doppelberechnungen mit geringerer Genauigkeit für zusätzliche Langsamkeit.
- Stellen Sie die CPU-Affinität häufig auf verschiedene CPUs ein.
- Implementieren Sie übermäßige Systemaufrufe für den Kontextwechsel Overhead.
Abschlussbemerkungen:
- Während diese Techniken den Code effektiv verlangsamen, hängt ihr Grad an „teuflischer Inkompetenz“ von der gegebenen Begründung ab .
- Der Aufgabenleiter hatte möglicherweise vor, dass die Schüler etwas über die Gefahren und Abhängigkeiten von Pipelines lernen, anstatt nur diese Techniken anzuwenden blind.
Das obige ist der detaillierte Inhalt vonWie kann eine Monte-Carlo-Simulation weiter deoptimiert werden, um die Ausführung auf einer CPU der Intel Sandybridge-Familie deutlich zu verlangsamen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

C# verwendet den automatischen Müllsammlungsmechanismus, während C die manuelle Speicherverwaltung verwendet. Der Müllkollektor von 1. C#verwaltet automatisch den Speicher, um das Risiko eines Speicherlecks zu verringern, kann jedoch zu einer Leistungsverschlechterung führen. 2.C bietet eine flexible Speicherregelung, die für Anwendungen geeignet ist, die eine feine Verwaltung erfordern, aber mit Vorsicht behandelt werden sollten, um Speicherleckage zu vermeiden.

C hat immer noch wichtige Relevanz für die moderne Programmierung. 1) Hochleistungs- und direkte Hardware-Betriebsfunktionen machen es zur ersten Wahl in den Bereichen Spieleentwicklung, eingebettete Systeme und Hochleistungs-Computing. 2) Reiche Programmierparadigmen und moderne Funktionen wie Smart -Zeiger und Vorlagenprogrammierung verbessern seine Flexibilität und Effizienz. Obwohl die Lernkurve steil ist, machen sie im heutigen Programmierökosystem immer noch wichtig.

C -Lernende und Entwickler können Ressourcen und Unterstützung von Stackoverflow, Reddits R/CPP -Community, Coursera und EDX -Kursen, Open -Source -Projekten zu Github, professionellen Beratungsdiensten und CPPCON erhalten. 1. Stackoverflow gibt Antworten auf technische Fragen. 2. Die R/CPP -Community von Reddit teilt die neuesten Nachrichten; 3.. Coursera und EDX bieten formelle C -Kurse; 4. Open Source -Projekte auf Github wie LLVM und Boost verbessern die Fähigkeiten; 5. Professionelle Beratungsdienste wie Jetbrains und Perforce bieten technische Unterstützung; 6. CPPCON und andere Konferenzen helfen Karrieren

C# eignet sich für Projekte, die eine hohe Entwicklungseffizienz und plattformübergreifende Unterstützung erfordern, während C für Anwendungen geeignet ist, die eine hohe Leistung und die zugrunde liegende Kontrolle erfordern. 1) C# vereinfacht die Entwicklung, bietet Müllsammlung und reichhaltige Klassenbibliotheken, die für Anwendungen auf Unternehmensebene geeignet sind. 2) C ermöglicht den direkten Speicherbetrieb, der für Spielentwicklung und Hochleistungs-Computing geeignet ist.

C Gründe für die kontinuierliche Verwendung sind seine hohe Leistung, breite Anwendung und sich weiterentwickelnde Eigenschaften. 1) Leistung mit hoher Effizienz. 2) weit verbreitete: Glanz in den Feldern der Spieleentwicklung, eingebettete Systeme usw. 3) Kontinuierliche Entwicklung: Seit seiner Veröffentlichung im Jahr 1983 hat C weiterhin neue Funktionen hinzugefügt, um seine Wettbewerbsfähigkeit aufrechtzuerhalten.

Die zukünftigen Entwicklungstrends von C und XML sind: 1) C werden neue Funktionen wie Module, Konzepte und Coroutinen in den Standards C 20 und C 23 einführen, um die Programmierungseffizienz und -sicherheit zu verbessern. 2) XML nimmt weiterhin eine wichtige Position in den Datenaustausch- und Konfigurationsdateien ein, steht jedoch vor den Herausforderungen von JSON und YAML und entwickelt sich in einer prägnanteren und einfacheren Analyse wie die Verbesserungen von XMLSchema1.1 und XPATH3.1.

Das moderne C -Designmodell verwendet neue Funktionen von C 11 und darüber hinaus, um flexiblere und effizientere Software aufzubauen. 1) Verwenden Sie Lambda -Ausdrücke und STD :: Funktion, um das Beobachtermuster zu vereinfachen. 2) Die Leistung durch mobile Semantik und perfekte Weiterleitung optimieren. 3) Intelligente Zeiger gewährleisten die Sicherheit und das Management von Ressourcen.

C Die Kernkonzepte von Multithreading und gleichzeitiger Programmierung umfassen Thread -Erstellung und -management, Synchronisation und gegenseitige Ausschluss, bedingte Variablen, Thread -Pooling, asynchrones Programmieren, gemeinsame Fehler und Debugging -Techniken sowie Leistungsoptimierung sowie Best Practices. 1) Erstellen Sie Threads mit der STD :: Thread -Klasse. Das Beispiel zeigt, wie der Thread erstellt und wartet. 2) Synchronisieren und gegenseitige Ausschluss, um std :: mutex und std :: lock_guard zu verwenden, um gemeinsam genutzte Ressourcen zu schützen und den Datenwettbewerb zu vermeiden. 3) Zustandsvariablen realisieren Kommunikation und Synchronisation zwischen Threads über std :: Condition_Variable. 4) Das Beispiel des Thread -Pools zeigt, wie die Threadpool -Klasse verwendet wird, um Aufgaben parallel zu verarbeiten, um die Effizienz zu verbessern. 5) Asynchrones Programmieren verwendet std :: als


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Dreamweaver CS6
Visuelle Webentwicklungstools

Sicherer Prüfungsbrowser
Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

SublimeText3 Linux neue Version
SublimeText3 Linux neueste Version

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

WebStorm-Mac-Version
Nützliche JavaScript-Entwicklungstools