C のあいまいな「restrict」キーワード-C++-php.cn

ホームページ

バックエンド開発

C++

C のあいまいな「restrict」キーワード

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 11, 2024 am 06:36 AM

The Obscure “restrict” Keyword in C

導入

C99 では、プログラマがポインタがスコープ内の特定のオブジェクトへの唯一のポインタであることを指定し、その結果コンパイラに「ヒント」を与える方法として、restrict キーワードを追加しました。 ” そのポインタを介してオブジェクトにアクセスするときに追加の最適化を実行する可能性があります。

問題

制限が解決しようとしていた問題を説明するために、次のような関数を考えてみましょう。

void update_ptrs( int *p, int *q, int const *v ) {
  *p += *v;
  *q += *v;
}

コンパイラは次のような x86-64 コードを生成します。

mov eax, [rdx]  ; tmp = *v   // 1
add [rdi], eax  ; *p += tmp
mov eax, [rdx]  ; tmp = *v   // 3
add [rsi], eax  ; *q += tmp

行 1 と重複しているように見えるのに、なぜ行 3 が生成されるのか疑問に思われるかもしれません。問題は、コンパイラーは次のようなことを行っていないことを認識できないことです。

int x = 1, v = 2;
update_ptrs( &v, &x, &v );   // x = 5, v = 4

update_ptrs() では、p と v は同じ int に別名を付けるため、コンパイラーは安全策を講じて、*v の値が読み取り間で変更される可能性があると想定する必要があります。したがって、追加の mov 命令です。

一般に、C のポインターは最適化を混乱させます。これは、コンパイラーが 2 つのポインターが互いにエイリアスであるかどうかを認識できないためです。パフォーマンスが重要なコードでは、コンパイラがメモリ読み取りを安全に実行できれば、メモリ読み取りを省略することが可能性があります。場合。

解決策

前述の問題を解決するために、指定されたポインタがそのポインタのスコープ内のオブジェクトへの唯一のポインタであること、つまり、同じスコープのエイリアス内に他のポインタがないことを指定できるように、Cにrestrictが追加されました。それ。

restrict を使用するには、宣言内の * とポインターの名前の間にを挿入します。制限を使用するように書き換えられた update_ptrs() は次のようになります:

void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p += *v;
  *q += *v;
}

(右から左に読みます。たとえば、v は定数 int への制限付きポインタです。または、cdecl を使用します。)

制限を追加することで、コンパイラは次のようなコードを生成できるようになります。

mov eax, [rdx]  ; tmp = *v
add [rdi], eax  ; *p += tmp
add [rsi], eax  ; *q += tmp

これで、コンパイラは追加の mov 命令の前の行 3 を省略できました。

おそらく、restrict が使用される最もよく知られた例は、標準ライブラリ関数 memcpy() です。これは、ソースアドレスと宛先アドレスが重複しない場合、メモリのチャンクをコピーする最速の方法です。アドレスが 重複している場合に使用するために、少し遅い memmove() 関数が存在します。

落とし穴

restrict を誤用すると、たとえば、相互にエイリアスを作成するポインタを update_ptrs_v2() や memcpy() に渡すなど、未定義の動作が発生します。

一部の場合には、コンパイラーは警告を発しますが、すべての場合ではないため、誤用を検出するためにコンパイラーに依存しないでください。 制限は特定のスコープに対するものであることに注意してください。 1 つの制限されたポインタを 同じスコープ

内の別の制限されたポインタに割り当てると、未定義の動作が発生します:

ただし、制限付きポインターを制限なしポインターに割り当てることは問題なくできます。

void f( int *restrict d, int *restrict s ) {
  int *restrict p = s;    // undefined behavior

p に制限がない場合でも、コンパイラーは同じ最適化を実行できます。

void f( int *restrict d, int *restrict s ) {
  int *p = s;             // OK

内部スコープの制限されたポインターを外部スコープの別のポインターに割り当てることもできます (ただし、その逆はできません)。

制限を使用する場合 (および使用しない場合)

void f( int *restrict d, int *restrict s ) {
  {                       // inner scope
    int *restrict p = s;  // OK
    // ...
    s = p;                // undefined behavior
  }
}

まず、必ずコードのプロファイリングを行って (おそらく生成されたアセンブリコードも確認して)、潜在的な落とし穴の危険を冒して正当化できるほど、restrict を使用することで実際に

大幅な

パフォーマンス向上がもたらされるかどうかを確認する必要があります。制限の誤用によって引き起こされたバグを診断することは

非常に困難です。 2 番目に、制限の使用が、制限されたポインターを介してアクセスされるメモリが あなた

によって割り当てられた関数の実装に限定されている場合は、より安全です。たとえば、次のようになります。

配列の前半と後半は重複していないため、コードは安全に操作できます (half_1st[n/2] 以降にアクセスしないと仮定します)。

void safer( unsigned n ) {
  n += n % 2 != 0;  // make even by rounding up
  int *const array = malloc( n * sizeof(unsigned) );
  unsigned *restrict half_1st = array;
  unsigned *restrict half_2nd = array + n/2;
  // ...
  free( array );
}

第三に、関数のパラメーターで制限が使用されている場合、安全性が

低く

なる可能性があります。たとえば、safer() と、

呼び出し元 がポインタを制御する update_ptrs_v2() を対比します。 あなたもご存知のとおり、呼び出し元は間違ってい、エイリアスというポインタを渡しました。 その他

オブジェクト (または void) へのポインタ

のみを、restrict:

で修飾できます。
構造体メンバーには制限を使用できます。例:

restrict int x;       // error: can't restrict object
int restrict *p;      // error: pointer to restrict object
int (*restrict f)();  // error: pointer-to-function

は、データがそのデータへの唯一のポインタであり、左右が同じノードを指すことは決してないと言っています。ただし、構造体のメンバーに制限を使用することは非常に一般的ではありません。

struct node {
   void *restrict data;
   struct node *restrict left;
   struct node *restrict right;
};

最後に、C++ には制限が

ありません

。なぜだめですか？長い答えがありますが、TL;DR バージョンは次のとおりです:

これは、C++ 委員会が C からインポートすることを望まなかった、見つけにくいバグの原因となる可能性があります。
C++ ではポインターの使用が増えており、たとえばこれにより、restrict を安全に使用することがさらに難しくなります。

ただし、多くのコンパイラには拡張子として __restrict__ があります。

結論

限られたケースでは、restrict を使用するとパフォーマンスが向上する可能性がありますが、いくつかの重大な落とし穴があります。制限の使用を検討している場合は、まずコードをプロファイリングしてください。

賢く使用してください。

以上がC のあいまいな「restrict」キーワードの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

C＃対C：各言語が優れている場所Apr 12, 2025 am 12:08 AM

C＃は、開発効率とクロスプラットフォームのサポートを必要とするプロジェクトに適していますが、Cは高性能で基礎となるコントロールを必要とするアプリケーションに適しています。 1）C＃は、開発を簡素化し、ガベージコレクションとリッチクラスライブラリを提供します。これは、エンタープライズレベルのアプリケーションに適しています。 2）Cは、ゲーム開発と高性能コンピューティングに適した直接メモリ操作を許可します。

Cの継続的な使用：その持久力の理由Apr 11, 2025 am 12:02 AM

C継続的な使用の理由には、その高性能、幅広いアプリケーション、および進化する特性が含まれます。 1）高効率パフォーマンス：Cは、メモリとハードウェアを直接操作することにより、システムプログラミングと高性能コンピューティングで優れたパフォーマンスを発揮します。 2）広く使用されている：ゲーム開発、組み込みシステムなどの分野での輝き。3）連続進化：1983年のリリース以来、Cは競争力を維持するために新しい機能を追加し続けています。

CとXMLの未来：新たなトレンドとテクノロジーApr 10, 2025 am 09:28 AM

CとXMLの将来の開発動向は次のとおりです。1）Cは、プログラミングの効率とセキュリティを改善するためのC 20およびC 23の標準を通じて、モジュール、概念、CORoutinesなどの新しい機能を導入します。 2）XMLは、データ交換および構成ファイルの重要なポジションを引き続き占有しますが、JSONとYAMLの課題に直面し、XMLSchema1.1やXpath3.1の改善など、より簡潔で簡単な方向に発展します。

最新のCデザインモデルは、C 11以降の新機能を使用して、より柔軟で効率的なソフトウェアを構築するのに役立ちます。 1）ラムダ式とstd :: functionを使用して、オブザーバーパターンを簡素化します。 2）モバイルセマンティクスと完全な転送を通じてパフォーマンスを最適化します。 3）インテリジェントなポインターは、タイプの安全性とリソース管理を保証します。

Cマルチスレッドと並行性：並列プログラミングのマスタリングApr 08, 2025 am 12:10 AM

cマルチスレッドと同時プログラミングのコア概念には、スレッドの作成と管理、同期と相互排除、条件付き変数、スレッドプーリング、非同期プログラミング、一般的なエラーとデバッグ技術、パフォーマンスの最適化とベストプラクティスが含まれます。 1）STD ::スレッドクラスを使用してスレッドを作成します。この例は、スレッドが完了する方法を作成し、待つ方法を示しています。 2）共有リソースを保護し、データ競争を回避するために、STD :: MutexおよびSTD :: LOCK_GUARDを使用するための同期と相互除外。 3）条件変数は、std :: condition_variableを介したスレッド間の通信と同期を実現します。 4）スレッドプールの例は、スレッドプールクラスを使用してタスクを並行して処理して効率を向上させる方法を示しています。 5）非同期プログラミングはSTD :: ASを使用します

Cディープダイブ：メモリ管理、ポインター、およびテンプレートの習得Apr 07, 2025 am 12:11 AM

Cのメモリ管理、ポインター、テンプレートはコア機能です。 1。メモリ管理は、新規および削除を通じてメモリを手動で割り当ててリリースし、ヒープとスタックの違いに注意を払います。 2。ポインターにより、メモリアドレスを直接操作し、注意して使用します。スマートポインターは管理を簡素化できます。 3.テンプレートは、一般的なプログラミングを実装し、コードの再利用性と柔軟性を向上させ、タイプの派生と専門化を理解する必要があります。

Cおよびシステムプログラミング：低レベルのコントロールとハードウェアの相互作用Apr 06, 2025 am 12:06 AM

Cは、ハードウェアに近い制御機能とオブジェクト指向プログラミングの強力な機能を提供するため、システムプログラミングとハードウェアの相互作用に適しています。 1）cポインター、メモリ管理、ビット操作などの低レベルの機能、効率的なシステムレベル操作を実現できます。 2）ハードウェアの相互作用はデバイスドライバーを介して実装され、Cはこれらのドライバーを書き込み、ハードウェアデバイスとの通信を処理できます。

Cによるゲーム開発：高性能ゲームとシミュレーションの構築Apr 05, 2025 am 12:11 AM

Cは、ハードウェア制御と効率的なパフォーマンスに近いため、高性能のゲームおよびシミュレーションシステムの構築に適しています。 1）メモリ管理：手動制御により、断片化が減少し、パフォーマンスが向上します。 2）コンパイル時間の最適化：インライン関数とループ拡張は、ランニング速度を改善します。 3）低レベルの操作：ハードウェアへの直接アクセス、グラフィックスおよび物理コンピューティングの最適化。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、