Intel Sandybridge ファミリ CPU のパイプライン用プログラムの逆最適化
この割り当ての目標は、指定されたプログラムを変更して、それを実現することです。同じアルゴリズムを維持しながら、実行速度が遅くなります。これは、インテル i7 パイプラインがどのように動作するか、また命令パスがどのように並べ替えられて危険が生じるかをより深く理解するためのものです。
プログラムの概要
プログラムは次のとおりです。ヨーロッパの標準的なコールおよびプット オプションの価格を計算するモンテカルロ シミュレーション。 Box-Muller アルゴリズムを使用してガウス乱数を生成し、オプション価格を推定するために多数のシミュレーションを実行します。
悪魔のような無能
目的は、意図的にプログラムの実行を遅くする無能なコードを作成します。このアプローチを「悪魔のような無能さ」で正当化するいくつかのアイデアを次に示します。
フォールス シェアリング
- 複数のスレッドによってアクセスされる共有データ構造を作成します。正しく同期されていません。これにより、キャッシュラインのピンポンやメモリ順序の誤った推測パイプラインのクリアが発生する可能性があります。
ストア転送ストール
- の使用を避ける浮動小数点変数の「-」演算子。代わりに、上位バイトと 0x80 の XOR を行って符号ビットを反転し、ストア転送のストールを引き起こします。
過剰な時間測定
- 各反復の時間を計測するCPUID/RDTSC などの負荷の高い操作を伴うメイン ループ。これにより、命令がシリアル化され、 Pipeline.
好ましくない数学演算
- 定数による乗算をその逆数による除算に置き換えます (「読みやすくするため」)。除算は遅く、完全にパイプライン化されていません。
非効率なベクトル化
- AVX を使用して乗算/sqrt 演算をベクトル化しますが、呼び出す前に vzeroupper を使用できません。スカラー数学ライブラリ関数、AVX
データ構造
- RNG 出力を、リンクされたリストまたは順不同で走査される配列に格納します。各反復の結果に対して同じことを行い、最後に合計します。これにより、ポインタ追跡ロードが発生し、キャッシュの局所性が失われます。
マルチスレッドの誤用
- プログラムをマルチスレッドにするが、両方のスレッドを強制的に共有する同じループ カウンタ (アトミック インクリメントあり) を使用して、偽の共有と競合を作成します。これにより、アトミック操作による不要なオーバーヘッドも発生します。
その他の提案
- 予測ミスやパイプライン フラッシュを引き起こす予測不可能な分岐を導入します。
- 悪魔のような無能な正当化を使用して、ループに含まれる依存関係チェーンの長さを増やします。
- 不連続なメモリ アクセス パターンを導入します。キャッシュ使用率を最小限に抑えるため。
- 追加分Credit: 課題で提供された平方根アルゴリズムを置き換える独自の平方根アルゴリズムを作成します。
変更の影響
これらの変更は大幅な影響を受けることが予想されますパイプラインのストール、キャッシュミス、その他のパフォーマンスのボトルネックを引き起こし、プログラムの実行速度を低下させます。この課題は、創造性と、元のアルゴリズムを維持しながらコードを悲観化するさまざまな方法を探求する意欲を促進します。
以上がモンテカルロ シミュレーションを再最適化してインテル Sandybridge パイプラインのボトルネックを明らかにするにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

C#とCの歴史と進化はユニークであり、将来の見通しも異なります。 1.Cは、1983年にBjarnestrostrupによって発明され、オブジェクト指向のプログラミングをC言語に導入しました。その進化プロセスには、C 11の自動キーワードとラムダ式の導入など、複数の標準化が含まれます。C20概念とコルーチンの導入、将来のパフォーマンスとシステムレベルのプログラミングに焦点を当てます。 2.C#は2000年にMicrosoftによってリリースされました。CとJavaの利点を組み合わせて、その進化はシンプルさと生産性に焦点を当てています。たとえば、C#2.0はジェネリックを導入し、C#5.0は非同期プログラミングを導入しました。これは、将来の開発者の生産性とクラウドコンピューティングに焦点を当てます。

C#とCおよび開発者の経験の学習曲線には大きな違いがあります。 1)C#の学習曲線は比較的フラットであり、迅速な開発およびエンタープライズレベルのアプリケーションに適しています。 2)Cの学習曲線は急勾配であり、高性能および低レベルの制御シナリオに適しています。

オブジェクト指向プログラミング(OOP)のC#とCの実装と機能には大きな違いがあります。 1)C#のクラス定義と構文はより簡潔であり、LINQなどの高度な機能をサポートします。 2)Cは、システムプログラミングと高性能のニーズに適した、より細かい粒状制御を提供します。どちらにも独自の利点があり、選択は特定のアプリケーションシナリオに基づいている必要があります。

XMLからCへの変換とデータ操作の実行は、次の手順で達成できます。1)TinyXML2ライブラリを使用してXMLファイルを解析する、2)データのデータ構造にデータをマッピングし、3)データ操作のためのSTD :: VectorなどのC標準ライブラリを使用します。これらの手順を通じて、XMLから変換されたデータを処理および効率的に操作できます。

C#は自動ガベージコレクションメカニズムを使用し、Cは手動メモリ管理を使用します。 1。C#のゴミコレクターは、メモリを自動的に管理してメモリの漏れのリスクを減らしますが、パフォーマンスの劣化につながる可能性があります。 2.Cは、微細な管理を必要とするアプリケーションに適した柔軟なメモリ制御を提供しますが、メモリの漏れを避けるためには注意して処理する必要があります。

Cは、現代のプログラミングにおいて依然として重要な関連性を持っています。 1)高性能および直接的なハードウェア操作機能により、ゲーム開発、組み込みシステム、高性能コンピューティングの分野で最初の選択肢になります。 2)豊富なプログラミングパラダイムとスマートポインターやテンプレートプログラミングなどの最新の機能は、その柔軟性と効率を向上させます。学習曲線は急ですが、その強力な機能により、今日のプログラミングエコシステムでは依然として重要です。

C学習者と開発者は、Stackoverflow、RedditのR/CPPコミュニティ、CourseraおよびEDXコース、Github、Professional Consulting Services、およびCPPCONのオープンソースプロジェクトからリソースとサポートを得ることができます。 1. StackOverFlowは、技術的な質問への回答を提供します。 2。RedditのR/CPPコミュニティが最新ニュースを共有しています。 3。CourseraとEDXは、正式なCコースを提供します。 4. LLVMなどのGitHubでのオープンソースプロジェクトやスキルの向上。 5。JetBrainやPerforceなどの専門的なコンサルティングサービスは、技術サポートを提供します。 6。CPPCONとその他の会議はキャリアを助けます

C#は、開発効率とクロスプラットフォームのサポートを必要とするプロジェクトに適していますが、Cは高性能で基礎となるコントロールを必要とするアプリケーションに適しています。 1)C#は、開発を簡素化し、ガベージコレクションとリッチクラスライブラリを提供します。これは、エンタープライズレベルのアプリケーションに適しています。 2)Cは、ゲーム開発と高性能コンピューティングに適した直接メモリ操作を許可します。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 中国語版
中国語版、とても使いやすい

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ドリームウィーバー CS6
ビジュアル Web 開発ツール

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境
