ホームページ >システムチュートリアル >Linux >Linux カーネルプルーニングフレームワークに関する予備調査

Linux カーネルプルーニングフレームワークに関する予備調査

王林転載: 2024-02-10 17:30:421363ブラウズ

オペレーティングシステムカーネルの不安定性、適時性の低さ、整合性の問題、および手動介入の必要性のため、Linux カーネルプルーニングテクノロジは広く使用されていません。既存のテクノロジーの限界を理解した後、これらの問題を解決できる可能性のある Linux カーネル調整フレームワークの提案を試みます。

2000 年頃、このプログラマーはまだ若く、携帯電話のオペレーティングシステムとして Linux を使用したいと考えていたため、カーネルテーラリングのアイデアを思いつき、その実践を支援しました。効果は非常に良好で、すでに PDA 上で実行できました。携帯電話の機能はなくなりました。 20年以上が経過し、Linuxは大きく変化し、カーネルプルーニングの技術や手法も大きく異なりました。
Linux カーネルプルーニングは、ターゲットアプリケーション内の不要なカーネルコードを削減することです。これにより、セキュリティとパフォーマンスの点で大きな利点が得られます (起動時間の短縮とメモリフットプリントの削減)。しかし、既存のカーネルプルーニングテクノロジーには限界があります。カーネルプルーニングのためのフレームワーク手法はあるのでしょうか?

1. カーネルクリッピングについて

近年、Linux オペレーティングシステムは複雑さと規模が増大しています。ただし、アプリケーションは通常、OS 機能の一部のみを必要とし、多数のアプリケーション要件が Linux カーネルの肥大化につながります。オペレーティングシステムのカーネルの肥大化は、セキュリティリスク、起動時間の延長、メモリ使用量の増加にもつながります。
サービス化とマイクロサービスの人気により、カーネルの調整の必要性がさらに高まっています。これらのシナリオでは、仮想マシンは小規模なアプリケーションを実行します。各アプリケーションは多くの場合「マイクロ」であり、カーネルフットプリントが小さいです。一部の仮想化テクノロジは、ターゲットアプリケーションに最も単純な Linux カーネルを提供します。
オペレーティングシステムの複雑さを考慮すると、カーネル機能を手動で選択してカーネルを調整することは、ある程度現実的ではありません。たとえば、Linux には 14,000 を超える構成オプション (v4.14 時点) があり、毎年数百の新しいオプションが導入されています。カーネルコンフィギュレータ (KConfig など) は、構成オプションを選択するためのユーザーインターフェイスのみを提供します。使いやすさが悪く、ドキュメントが不完全であるため、ユーザーが最小限で実用的なカーネル構成を選択するのは困難です。
既存のカーネルプルーニングテクノロジは通常、次の 3 つのステップに従います。

を特定します。

構成主導型は、カーネルプルーニングへの一般的なアプローチです。安定したカーネルを生成できる数少ないテクノロジの 1 つであるため、ほとんどの既存のツールは構成主導型の手法を使用しています。構成主導のカーネルのリロードにより、機能特性に基づいてカーネルコードが削減されます。構成オプションはカーネルの機能に対応します。プルーニングされたカーネルには、ターゲットアプリケーションのワークロードをサポートするために必要な機能のみが含まれます。

ただし、カーネルプルーニング手法はセキュリティとパフォーマンスの点で非常に魅力的ですが、実際には広く採用されていません。これは需要がないためではありません。実際、多くのクラウドプロバイダーはコードを減らすために Linux カーネルを手作業でコーディングしていますが、一般にカーネルプルーニング技術ほど効果的ではありません。

2. 既存のカーネルプルーニングテクノロジの制限

既存のカーネルプルーニングテクノロジーには、主に 5 つの制限があります。

ブートフェーズ中は表示されません。既存の手法は、ftrace に依存してカーネルのブート後にのみ開始できるため、ブートフェーズ中にどのようなカーネルコードがロードされるかを観察する方法がありません。重要なモジュールがカーネルから欠落している場合、カーネルはブートに失敗することが多く、カーネルの多くの機能特徴はブートフェーズを観察することによってのみ取得できます。さらに、パフォーマンスとセキュリティの問題も起動時にのみロードされるため (たとえば、マルチコアサポートの CONFIGSCHEDMC と CONFIGSECURITYNETWORK)、パフォーマンスとセキュリティが低下します。

アプリケーション展開の迅速なサポートが不足している。既存のツールを使用して、カーネルに合わせて調整された新しいアプリケーションをデプロイするには、トレース、分析、アセンブルの 3 つのステップを完了する必要があります。このプロセスには時間がかかり、数時間、場合によっては数日かかる場合があり、アプリケーション展開の機敏性が妨げられます。
粒径は粗めです。 ftrace を使用すると、カーネルコードを関数レベルでしかトレースできず、関数内のコードに影響を与える構成オプションをトレースするには粒度が粗すぎます。
不完全な報道。動的トレースが使用されるため、カバレッジを最大化するためにカーネルのコード実行を駆動するにはアプリケーションのワークロードが必要です。ただし、ベンチマークカバレッジは難しく、トレース中に検出されないカーネルコードがアプリケーションにある場合、トリミングされたカーネルが実行時にクラッシュする可能性があります。
実行の依存関係には区別がなく、冗長性が存在する可能性があります。実際には実行する必要がないコードでも、カーネル機能に含まれる場合があります。たとえば、2 番目のファイルシステムを初期化する場合があります。
最初の 3 つの制限は克服可能であり、設計とツールを改善することで対処できますが、最後の 2 つの制限は避けられず、特定のテクノロジを超えた努力が必要です。

3. Linux カーネル構成

3.1 構成オプション

カーネル構成は、一連の構成オプションで構成されます。カーネルモジュールには複数のオプションを指定でき、それぞれが最終的なカーネルバイナリにどのコードを含めるかを制御します。
構成オプションは、C プリプロセッサによって実装されるステートメントや関数、Makefile に基づいて実装されるオブジェクトファイルなど、カーネルコードのさまざまな粒度を制御します。 C プリプロセッサは #ifdef/#ifndef に基づいてコードブロックを選択し、構成オプションはマクロ定義として使用され、そのような条件付きコードブロックがコンパイルされたカーネルに含まれるかどうかをステートメント粒度または関数粒度で決定します。 Makefile は、コンパイルされたカーネルに特定のオブジェクトファイルが含まれるかどうかを判断するために使用されます。たとえば、CONFIG_CACHEFILES は Makefile の構成オプションです。
ステートメントレベルの構成オプションは、既存のカーネル調整ツールで使用される関数レベルのトレースでは識別できません。実際、Linux 4.14 の C プリプロセッサの約 30% はステートメントレベルのオプションです。
カーネルコードと機能機能の急速な成長に伴い、カーネル内の構成オプションの数も急速に増加しており、Linux カーネル 3.0 以降には 10,000 を超える構成オプションがあります。

3.2. 設定言語

Linux カーネルは、KConfig 構成言語を使用して、コンパイルされたカーネルにどのコードを含めるかをコンパイラーに指示し、構成オプションとそれらの間の依存関係を定義できるようにします。
KConfig の構成オプションの値は、bool、tristate、または constant です。 bool は、コードが静的にカーネルバイナリにコンパイルされるか、除外されることを意味します。一方、 tristate は、コードをロード可能なコアモジュール、つまり実行時にロードできるスタンドアロンオブジェクトにコンパイルできるようにします。 constant は、カーネルコード変数の文字列または数値を提供できます。 1 つのオプションが別のオプションに依存する可能性があり、KConfig は依存関係を再帰的に選択およびキャンセルする再帰的なプロセスを使用します。最終的なカーネル構成には有効な依存関係がありますが、ユーザー入力とは異なる場合があります。

3.3. 設定テンプレート

Linux カーネルには、多数の手作りの構成テンプレートが付属しています。ただし、構成テンプレートはハードコーディングされており、手動による介入が必要なため、さまざまなハードウェアプラットフォームに適応できず、アプリケーションのニーズを理解できません。たとえば、tinyconfig で構築されたカーネルは、標準のハードウェアで起動することができず、ましてや他のアプリケーションをサポートすることもできません。一部のツールは localmodconfig を最小構成として扱いますが、localmodconfig には静的構成テンプレートと同じ制限があり、制御ステートメントレベルまたは関数レベルの C プリプロセッサ構成オプションが有効にならず、ロード可能なカーネルも処理されません。
kvmconfig および xenconfig テンプレートは、KVM および Xen 上で実行されるカーネル用にカスタマイズされています。これらは、基盤となる仮想化やハードウェア環境などのドメイン知識を提供します。

3.4. クラウドでの Linux カーネル設定

Linux はクラウドサービスにおける主要なオペレーティングシステムカーネルであり、クラウドプロバイダーは通常の Linux カーネルをある程度放棄しています。クラウドベンダーによるカスタマイズは、ロード可能なカーネルモジュールを直接削除することで実現されることがよくありますが、カーネルモジュールのバイナリを手動で削除する場合の問題は、依存関係に違反する可能性があることです。重要なのは、アプリケーションの要件に基づいてコアをさらにカスタマイズできることです。たとえば、Amazon FireCracker カーネルは、HTTPD をターゲットアプリケーションとして使用する、サービスとしての機能向けに設計された小さな仮想マシンであり、機能とパフォーマンスの向上を確保しながら、カーネルの調整を大幅に最小限に抑えることができます。

4. カーネルプルーニングに関する考え

制限 1 に関して、QEMU からの命令レベルのトレースを使用してブートフェーズの可視性を実現することは可能ですか?このようにして、カーネルコードを追跡し、カーネル構成オプションにマッピングすることができます。起動フェーズは起動可能なカーネルを生成するために重要であるため、ハイパーバイザーが提供するトレース機能を使用して、エンドツーエンドの可観測性を獲得し、安定したカーネルを生成します。

制限 2 については、NLP 深層学習の経験に基づいて、オフラインとオンラインの方法を組み合わせて使用できます。ターゲットアプリケーションのセットが与えられると、アプリ構成をオフラインで直接生成し、ベースライン構成と組み合わせて、完全なカーネル構成を形成し、トリミングされたカーネルが得られます。このコンポーザビリティにより、アプリケーション構成や以前に構築されたファイル (カーネルモジュールなど) を再利用して、新しいカーネルを段階的に構築できます。ターゲットアプリケーションの構成がわかっている場合、カーネルプルーニングは数十秒で完了できます。

制限 3 については、命令レベルのトレースを使用すると、関数の内部機能特性を制御するカーネル構成オプションを解決できます。命令レベルのトレースのオーバーヘッドは、テストスイートおよびパフォーマンスベンチマークの実行には許容されます。

制限 4 については、ダイナミックトレーシングを使用する場合の基本的な制限は、テストスイートとベンチマークが不完全であることです。オープンソースアプリケーションのテストスイートの多くは、コードカバレッジが低いです。さまざまなワークロードを組み合わせてアプリケーションを駆動すると、この制限をある程度緩和できます。

制限 5 については、ドメイン固有の情報を使用して、ベースラインカーネルで実行されるが、実際のデプロイメントの実行時には不要なカーネルモジュールを削除することで、カーネルをさらに読み込むことができます。 Xen と KVM を例に挙げると、xenconfig および kvmconfig 構成テンプレートに基づいてカーネルサイズをさらに縮小できます。アプリケーション指向のカーネルプルーニングでは、カーネルサイズをさらに縮小し、カーネルコードを広範囲にカスタマイズすることもできます。

5 カーネル調整フレームワークに関する予備調査

カーネル調整フレームワークの原則は変わっていません。ターゲットアプリケーションのワークロードのカーネル使用状況を追跡して、必要なカーネルオプションを決定することは変わりません。

5.1 カーネルクリッピングフレームワークのコア機能

カーネルクリッピングフレームワークには、おそらく次のような特徴があります:
エンドツーエンドの可視性。ハイパーバイザーの可視性を活用してエンドツーエンドの観察を実現し、カーネルのブートフェーズとアプリケーションのワークロードを追跡し、QEMU に基づいた Linux カーネルの調整フレームワークの構築を試みることができます。
構成可能性。中心的なアイデアは、特定のデプロイメント環境でカーネルを起動するためと、ターゲットアプリケーションに必要な構成オプションの両方のために、カーネル構成をいくつかの構成セットに分割することで結合できるようにすることです。構成セットは、ベースライン構成とアプリケーション構成の 2 つのタイプに分類されます。ベースライン構成は、特定のハードウェアで起動するために必要な最小構成セットである必要はなく、ブートフェーズ中に追跡される構成オプションのセットです。ベースライン構成を 1 つ以上のアプリケーション構成と組み合わせて、最終的なカーネル構成を作成できます。
再利用性。ベースライン構成とアプリケーション構成は両方ともデータベースに保存でき、展開環境とアプリケーションバイナリが変更されない限り再利用できます。この再利用性により、トレースワークロードの繰り返し実行が回避され、構成セットの作成が 1 回限りのジョブになります。
迅速なアプリケーション展開をサポートします。デプロイメント環境とターゲットアプリケーションが与えられると、カーネル調整フレームワークはベースライン構成とアプリケーション構成を効率的に取得し、それらを組み合わせて必要なカーネル構成を作成し、その結果の構成を使用して古いカーネルを構築できます。
低レベルのコードパターンに基づいて構成オプションを識別するための、きめ細かい構成トレース、プログラムカウンターベースのトレース。

5.2 カーネルクリッピングフレームワークのアーキテクチャ

カーネル調整フレームワークにはオフラインシステムとオンラインシステムの両方が必要であり、そのアーキテクチャは次の図に示すとおりです。構成トラッカーは、オフラインシステムを通じて、展開環境とアプリケーションに必要な構成オプションを追跡および記録するために使用されます。構成ジェネレーターは、これらのオプションをベースライン構成オプションとアプリケーション構成オプションに処理し、構成データベースに保管します。
オンラインシステムを通じて、構成コンビネーターはベースライン構成とアプリケーション構成を使用してターゲットカーネル構成を生成し、カーネルビルダーはカスタマイズされた Linux カーネルを生成します。 Linux 内核裁剪框架初探

5.3 カーネル調整フレームワーク実装の実現可能性

構成の追跡
カーネル調整フレームワークの構成トラッカーは、PC レジスタを使用して実行中の命令のアドレスをキャプチャし、ターゲットアプリケーションによって駆動されるカーネル実行中の構成オプションを追跡します。追跡された PC が他のプロセス (バックグラウンドサービスなど) ではなく、ターゲットアプリケーションに属していることを確認するために、カスタマイズされた init スクリプトを使用できます。このスクリプトは、他のアプリケーションを起動せず、ファイルシステム /tmp、/ のみをマウントします。 proc と /sys を実行し、ネットワークインターフェイス (lo と eth0) を有効にし、最後にカーネルの起動直後にアプリケーションを起動します。
同時に、アドレスがソースコードに正しくマップされ、トリミングされたカーネルでも引き続き使用できるように、カーネルアドレス空間構成のランダムロードを無効にすることが必要になる場合があります。次に、PC をソースコードステートメントにマッピングします。ロード可能なカーネルモジュールには追加の処理が必要です。/proc/module を使用して、ロードされた各カーネルモジュールの開始アドレスを取得し、これらの PC をカーネルモジュールバイナリ内のステートメントにマップできます。代替手段は、localmodconfig を利用することです。ただし、localmodconfig は、モジュール粒度レベルでの情報のみを提供します。
最後に、ステートメントを構成に帰属させます。 C プリプロセッサベースモードの場合、C ソースファイルが解析されてプリプロセッサディレクティブが抽出され、それらのディレクティブ内のステートメントが実行されるかどうかがチェックされます。 Makefile ベースモードの場合、オブジェクトファイルの粒度で構成オプションを選択する必要があるかどうかを決定します。たとえば、対応するファイル (bind.o、achefiles.o、または daemon.o) のいずれかを使用する場合は、CONFIG_CACHEFILES を選択する必要があります。
構成の生成
ベースライン構成とアプリケーション構成はオフラインシステムで生成されます。スタートアップフェーズの終了をどのように判断するか?空のスタブ関数は、mmap を使用して事前定義されたアドレスセグメントにマッピングできます。上記の init スクリプトは、ターゲットアプリケーションを実行する前にスタブ関数を呼び出すため、PC 内の事前定義されたアドレスに基づいてブートフェーズの終了を識別することができます。痕跡。
カーネル調整フレームワークはアプリケーションから構成オプションを取得し、ブートフェーズ中に観察されたハードウェア関連のオプションをフィルターで除外します。これらのハードウェア機能は、カーネルソースコード内の位置に基づいて定義されます。ハードウェア関連のオプションは、必要に応じて新しいデバイスドライバーをロードするなど、アプリケーションの実行中にのみ観察される可能性を排除できません。
構成アセンブリ
ベースライン構成を 1 つ以上のアプリケーション構成と組み合わせると、カーネルの構築に使用される最終構成が生成されます。まず、すべての構成オプションが初期構成にマージされ、次に SAT ソルバーを使用してそれらの間の依存関係が解決されます。構成の依存関係をブール充足可能性問題としてモデル化してみてください。有効な構成とは、構成オプション間で指定されたすべての依存関係を満たすものです。 KConfig は、選択されたすべてのオプションが含まれていることを保証するのではなく、満たされていない依存関係の選択を解除するため、カーネル構成のモデル化は SAT ソルバーに基づいています。
カーネルビルド
KBuild for Linux は、アセンブルされた構成オプションに基づいてカスタマイズされたカーネルを構築します。最新の make を使用した増分ビルドは、ビルド時間を最適化し、冗長なコンパイルを避けるために以前のビルド結果 (オブジェクトファイルやカーネルモジュールなど) をキャッシュすることもできます。構成変更が発生すると、構成オプションに変更を加えたモジュールのみが再構築され、他のファイルは再利用できます。

6.概要

以上がLinux カーネルプルーニングフレームワークに関する予備調査の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

字符串预处理器递归 bool 接口对象数据库 nlp linux 虚拟化

声明：

この記事はlxlinux.netで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：VMware への Deepin Linux のインストール: 詳細ガイドと Linux 知識の共有次の記事：VMware への Deepin Linux のインストール: 詳細ガイドと Linux 知識の共有

続きを見る