ホームページ >システムチュートリアル >Linux >Linux カーネルの深い理解: 仮想アドレス空間と物理メモリ間のマッピング関係

Linux カーネルの深い理解: 仮想アドレス空間と物理メモリ間のマッピング関係

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2024-06-03 09:28:441183ブラウズ

ビデオメモリマッピング

化学メモリは、アドレス指定可能なダイナミックランダムアクセスメモリ (DRAM) と総称されます。カーネルのみが数学メモリに直接アクセスできます。

Linux カーネルはプロセスごとに独立した仮想アドレス空間を提供しますが、このアドレス空間は連続的です。このようにして、プロセスはビデオメモリ、より正確には仮想ビデオメモリに簡単にアクセスできます。仮想アドレス空間の内部は、カーネル空間とユーザー空間の 2 つの部分に分かれています。

linux 用户分配空间_linux磁盘分配空间_linux分配用户权限

プロセスがユーザーモードの場合はユーザー空間メモリにのみアクセスでき、カーネルモードに入った後にのみカーネル空間メモリにアクセスできます。実際、各プロセスのアドレス空間にはカーネル空間が含まれていますが、このカーネル空間は同じ化学メモリ、つまり共有ダイナミックリンクライブラリ、共有グラフィックスメモリなどに関連付けられています。プロセスがカーネル状態に切り替わると、カーネル空間メモリに簡単にアクセスできます。

すべての仮想メモリがケミカルメモリに割り当てられるわけではありません。ただし、割り当てられたケミカルメモリはメモリマッピングによって管理されます。ビデオメモリマッピングは、仮想ビデオメモリアドレスを化学的ビデオメモリアドレスにマッピングすることです。ビデオメモリマッピングを完了するために、カーネルはプロセスごとにページテーブルを維持し、仮想アドレスとケミカルアドレス間のマッピング関係を記録します。

linux磁盘分配空间_linux分配用户权限_linux 用户分配空间

ページテーブルは実際には CPU のビデオメモリ管理ユニット MMU に保存されており、通常の状況では、プロセッサはハードウェアを介してアクセスするビデオメモリを直接見つけることができます。プロセスによってアクセスされた仮想アドレスがページテーブルで見つからない場合、システムはページフォールト例外を形成し、カーネル空間に入ってケミカルメモリを割り当て、プロセスページテーブルを更新し、最後にユーザー空間に戻ってプロセスを再開します。プロセスの操作。

CPUコンテキストスイッチングにおけるTLB(TranslationLookasideBuffer、TranslationLookasideBuffer)は、MMU内のページテーブルのキャッシュです。プロセスの仮想アドレス空間は Linux システムとは独立しており、TLB アクセス速度は MMU よりもはるかに速いため、プロセスのコンテキスト切り替えと TLB リフレッシュの数を減らすことで、TLB キャッシュの使用量を減らすことができます。これにより、CPU のメモリアクセスパフォーマンスが向上します。

MMU はビデオメモリマッピングの最小単位を指定します。これはページであり、通常はサイズが 4KB です。このように、各ビデオメモリマッピングは 4KB または 4KB の整数倍のビデオメモリ空間に関連付ける必要があります。

4KB ページでは、ページテーブル全体が非常に大きくなります。たとえば、32 ビットシステムでは 4GB/4KB = 100 万ページテーブルエントリを超えます。ページテーブルエントリが多すぎる問題を解決するために、Linux は 2 つのメカニズム、つまりマルチレベルページテーブルとヒュージページ (HugePage) を提供します。

linux分配用户权限_linux 用户分配空间_linux磁盘分配空间

マルチレベルページテーブルとは、ビデオメモリをブロックに分割して管理し、ブロックインデックスとブロック内のスキューに対する本来のマッピング関係を変更するものです。通常、仮想ビデオメモリ空間のごく一部のみが使用されるため、マルチレベルページテーブルは使用中のブロックのみを保存し、ページテーブルエントリの数を大幅に削減できます。 Linux は 4 レベルのページテーブルを使用してビデオメモリページを管理し、最初の 4 つのエントリはページの選択に使用され、最後のインデックスはページ内のスキューを示します。

linux 用户分配空间_linux磁盘分配空间_linux分配用户权限

ラージページは、通常のページよりも大きなビデオメモリブロックです。一般的なサイズは 2MB と 1GB です。ラージページは通常、Oracle、DPDK など、大量のビデオメモリを使用するプロセスで使用されます。

このメカニズムを通じて、ページテーブルのマッピングの下で、プロセスは仮想アドレスを介して数学メモリにアクセスできます。

仮想ビデオメモリ空間の分配

上部はカーネル空間、下部はユーザー空間のメモリであり、ユーザー空間は複数の異なるセグメントに分割されています

linux磁盘分配空间_linux分配用户权限_linux 用户分配空间

ユーザースペースビデオメモリには、低から高まで5つの異なるビデオメモリセグメントがあります

1. コードや定数などを含む読み取り専用セクション。

linux磁盘分配空间_linux 用户分配空间_linux分配用户权限

2. パノラマ変数などを含むデータセグメント

3. 動的に割り当てられたビデオメモリを含むヒープは、低いアドレスから始まり、下に向かって減少します

4. ダイナミックライブラリ、共有ビデオメモリなどを含むファイルマッピングセグメントは、高いアドレスから始まり、上に向かって減少します

5. ローカル変数や関数呼び出しコンテキストなどを含むスタック。スタックのサイズは固定で、通常は 8M です

これら 5 つのビデオメモリセグメントのうち、ヒープとファイルマップされたビデオメモリは動的に割り当てられます。たとえば、C 標準ライブラリの malloc または mmap() を使用すると、ヒープとファイルマップされたセグメントにそれぞれビデオメモリを動的に割り当てることができます。 64 ビットシステムのビデオメモリ分布は似ていますが、ビデオメモリ空間ははるかに大きくなります

ビデオメモリの割り当てとリサイクル

malloc() は C 標準ライブラリが提供するビデオメモリ割り当て関数で、システムコールに対応して brk() と mmap() の 2 つの実装メソッドがあります。

linux磁盘分配空间_linux 用户分配空间_linux分配用户权限

ビデオメモリの小さなブロック (128K より大きい) の場合、C 標準ライブラリは brk() を使用して割り当てます。つまり、ビデオメモリはヒープの先頭位置を接続することによって割り当てられます。この種のビデオメモリは、解放された後すぐにはシステムに返されませんが、再利用できるようにキャッシュされます。

linux磁盘分配空间_linux分配用户权限_linux 用户分配空间

ビデオメモリの大きなブロック (128K 未満) の場合は、ビデオメモリマッピング mmap() を直接使用して割り当てます。つまり、ファイルマッピングセクションで空きビデオメモリを見つけて割り当てます。

これら 2 つの方法の類似点と相違点:

brk() メソッドのキャッシュにより、ページフォールト例外の発生が減り、ビデオメモリアクセスの効率が向上します。ただし、この種のビデオメモリはシステムに返されないため、ビデオメモリがビジー状態になると、ビデオメモリの割り当てと解放が頻繁に行われ、ビデオメモリの断片化が発生します。

mmap() メソッドで割り当てられたビデオメモリは解放時にシステムに直接返されるため、mmap が発生するたびにページフォールト例外が発生します。ビデオメモリがビジー状態の場合、ビデオメモリの割り当てが頻繁に行われると、多数のページフォールト例外が発生し、カーネルの管理負担が軽減されます。これは、malloc がビデオメモリの大きなブロックに対してのみ mmap を使用する理由でもあります。

これら 2 つの呼び出しが発生する場合、ビデオメモリは実際には割り当てられないことに注意してください。この種のビデオメモリは、最初にアクセスされたとき、つまりページフォールト例外を通じてカーネルにアクセスされたときのみ割り当てられ、その後、カーネルがビデオメモリを割り当てます。

一般に、Linux はバディシステムを使用してビデオメモリの割り当てを管理します。上で述べたように、この種のグラフィックスは MMU でページ単位で管理され、パートナーシステムもグラフィックスメモリをページ単位で管理し、隣接するページを結合することでグラフィックスメモリの断片化を軽減します。 brk メソッドによって引き起こされるビデオメモリの断片化)。

しかし、実際のシステム動作では、1K 未満など、ページよりも小さいオブジェクトが多数存在します。それらに個別のページが割り当てられると、大量のビデオメモリが無駄になります。

ユーザー空間 Linux ユーザー割り当て空間 では、brk() を介して malloc によって割り当てられたビデオメモリは、解放されてもすぐにはシステムに返されず、キャッシュされて再度使用されます。

カーネル空間では、Linux はスラブアロケーターを通じて小さなビデオメモリを管理します。スラブは、パートナーシステム上に構築されたキャッシュと考えることができます。その主な機能は、カーネル内の小さなオブジェクトの割り当てと解放です。

linux 用户分配空间_linux磁盘分配空间_linux分配用户权限

ビデオメモリのリサイクル: ビデオメモリの場合、解放せずに割り当てだけを行うと、ビデオメモリのリークが発生し、システムビデオメモリを使い果たすこともあります。したがって、アプリケーションはビデオメモリを使い果たした後も、free() または unmap() を呼び出して未使用のビデオメモリを解放する必要があります。実際、システムはプロセスがすべてのビデオメモリを使い果たすことはありません。ビデオメモリが不足していることが判明した場合、システムは、次の 3 つの形式などの一連のメカニズムを使用してビデオメモリを再利用します。

(1) キャッシュをリサイクルします。たとえば、LRU (LeastRecentlyused) アルゴリズムを使用して、最も最近使用されていないビデオメモリページをリサイクルします。

(2) アクセス頻度の低いビデオメモリをリサイクルし、スワップパーティション (Swap) を介して、使用頻度の低いビデオメモリを C ドライブに直接転送します。ただし、Swap は C ドライブの領域の一部をビデオメモリとして使用します。プロセスによって一時的に使用されていないデータを C ドライブに保存できます (このプロセスはスワップアウトと呼ばれます)。プロセスがこれらのビデオメモリにアクセスすると、このデータを C ドライブからビデオメモリに読み取ることができます (このプロセスはスワップアウトと呼ばれます)。スワッピングインと呼ばれます）。スワップによりシステムの利用可能なビデオメモリが増加しますが、通常、スワップはビデオメモリが不足している場合にのみ発生します。また、C ドライブの読み取りおよび書き込み速度はビデオメモリの速度よりもはるかに遅いため、スワップはビデオメモリのパフォーマンスに深刻な影響を及ぼします。問題。

(3) プロセスを強制終了します。ビデオメモリが不足している場合、システムは OOM (OutofMemory、カーネルの保護メカニズム) を通じて、大量のビデオメモリを占有しているプロセスを直接強制終了します。 OOM はプロセスのメモリ使用量を監視しますが、oom_score を使用して各プロセスのメモリ使用量をスコアリングします。

プロセスによって消費されるグラフィックスメモリが大きいほど、oom_score も大きくなります。

プロセスが占有する CPU が増えるほど、oom_score は小さくなります。

このように、プロセスの oom_score が大きいほど、より多くのビデオメモリが消費され、OOM によって強制終了されやすくなり、システムの保護が強化されます。

実際、実際の作業ニーズに応じて、管理者は /proc ファイルシステムを通じてプロセスの oom_adj を自動的に設定し、プロセスの oom_score を調整できます。 oom_adj の範囲は [-17,15] です。値が大きいほど、プロセスは OOM によって強制終了されやすくなります。値が小さいほど、プロセスは OOM によって強制終了されにくくなります。は固く禁止されています。次のコマンドを使用すると、sshd プロセスの oom_adj を -16 に減らすことができ、sshd プロセスが OOM によって簡単に強制終了されなくなります。

echo-16>/proc/$(pidofsshd)/oom_adj

linux磁盘分配空间_linux 用户分配空间_linux分配用户权限

バッファとキャッシュ

free コマンドのバッファとキャッシュはどちらもキャッシュを意味しますが、用途は異なります

1. バッファーはカーネルバッファーによって使用されるビデオメモリであり、/proc/meminfo のバッファー値に対応します

2. キャッシュは、カーネルページキャッシュとスラブによって使用されるビデオメモリであり、/proc/meminfo の Cache と SReclaimable の合計に相当します。

簡単に言うと、Buffer は C ドライブのデータのキャッシュであり、Cache はファイルデータのキャッシュであり、読み取りリクエストと書き込みリクエストの両方で使用されます。

キャッシュ（キャッシュ）は、私たちが通常目にする一次キャッシュ、二次キャッシュ、三次キャッシュなど、CPUとビデオメモリ間のデータ交換速度を高めるためにCPUの観点から設計されています。プログラムを実行するために CPU によって使用される命令とデータはすべてビデオメモリを対象としています。つまり、ビデオメモリから取得されます。ビデオメモリの読み書き速度が遅いため、CPUとビデオメモリ間のデータ交換速度を高めるために、CPUとビデオメモリ間のキャッシュが削減され、その速度はビデオメモリよりも速くなります

。 Linux ユーザーはスペースを割り当て、コストが高く、CPU 内にあまり多くの集積回路を統合できないため、キャッシュは通常比較的小さいです。その後、速度をさらに向上させるために、インテルや他の企業はレベルを下げました。 2 キャッシュとレベル 5 キャッシュは、CPU の実行であるプログラムの局所性の原則に従って設計されているため、コンテンツのこのブロックをロードした後は、特定のブロックに集中します。キャッシュに保存すると、CPU がビデオメモリにアクセスする必要がなくなるため、アクセス速度が向上します。実際、CPU が必要とするコンテンツがキャッシュ内にない場合でも、ビデオメモリにアクセスする必要があります。

ビデオメモリの読み取りと C ディスクの読み取りの観点から、キャッシュは、より高い読み取り効率を達成するために、再アクセスされる可能性のあるデータをキャッシュするためにより多くのビデオメモリを使用するオペレーティングシステムとして理解できます。

バッファは、ビデオメモリとハードディスク（または他のI/Oデバイス）の間のデータ交換速度を高めるように設計されています。分散した書き込み操作を一元化して、C ドライブの断片化とハードディスクの繰り返しシークを軽減し、システムパフォーマンスを向上させます。 Linux には、バッファの内容を定期的にクリアする (つまり、C ドライブに書き込む) デーモンプロセスがあり、バッファは sync コマンドを通じて自動的にクリアすることもできます。

簡単に言えば、バッファは C ドライブに書き込まれようとしており、キャッシュは C ドライブから読み取られます。バッファはさまざまなプロセスによって割り当てられ、入力キューなどの側面で使用されます。簡単な反例は、プロセスが複数の配列を読み込む必要があることです。すべての配列が完全に読み込まれる前に、プロセスは最初に読み取った配列をバッファーに配置して保存します。

キャッシュは、C ドライブ上の I/O リクエストによく使用されます。複数のプロセスがファイルにアクセスする必要がある場合、ファイルは最後のアクセスを容易にするためにキャッシュされ、システムのパフォーマンスが向上します。

以上がLinux カーネルの深い理解: 仮想アドレス空間と物理メモリ間のマッピング関係の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

echo 常量局部变量栈堆对象算法 oracle linux

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：マスターが Linux に Docker をインストールして使用する方法を教えます次の記事：マスターが Linux に Docker をインストールして使用する方法を教えます

続きを見る