initcall_debug 🎜ご存知のとおり、カーネル
は、さまざまなレベルの initcall
とそれぞれの initcall
の消費時間もカウントできます。 🎜在kernel
的cmdline
中加入参数initcall_debug=1
:
initcall_debug=1
setargs_nand=setenv bootargs console=${console} earlyprintk=${earlyprintk} root=${nand_root} initcall_debug=${initcall_debug} init=${init} 开启后,就能打印每个initcall
函数调用及耗时。
bootgraph
内核自带了一个工具用于统计启动时间:scripts/bootgraph.pl
使用该工具需要打开内核配置CONFIG_PRINTK_TIME=y
,并且在cmdline
中加上"initcall_debug=1
"
系统启动之后,执行命令:
dmesg|perl $(kernel_dir)/script/bootgraph.pl > out.svg 用浏览器查看out.svg
文件,可以看到内核启动过程中各个阶段的耗时。
这个工具有点类似于perf
的火焰图,可以统计启动各阶段的耗时。
bootchart
除了内核自带的工具,也有开源的工具可用:bootchart
。
Bootchart は、Linux 起動プロセスのパフォーマンス分析に使用されるオープンソース ソフトウェア ツールで、システム起動プロセス中に CPU 使用率、プロセス、その他の情報を自動的に収集し、分析結果をグラフィカルに表示します。これは、システムのガイドと最適化に使用できます。システムの起動プロセス。
カーネル コマンドライン
。 init
が " に変更されますstyle="font-size: 14px;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;background-color: rgba(27, 31, 35, 0.05);font-family : "Operator Mono"、Consolas、Monaco、Menlo、monospace;word-break: Break-all;color: rgb(239, 112, 96);">init=/sbin/bootchartd
"。 kernel cmdline
。将其中的init
修改为“init=/sbin/bootchartd
”。
收集信息。bootchartd
会从/proc/stat
,/proc/diskstat
,/proc/[pid]/stat
中采集信息,经过处理后保存为bootchart.tgz
文件
转换图片。在pc
上通过pybootchartgui.py
工具将bootchart.tgz
转换为bootchart.png
情報を収集します。 bootchartd
は /proc/stat
,/proc/diskstat
,/proc/[pid]/stat
は情報を収集し、その後 bootchart.tgz
ファイル
🎜🎜画像を変換します。 PC
(pybootchartgui.py
このツールは、bootchart.tgz
bootchart.png
、分析に便利です🎜🎜🎜🎜最後に、画像にもなります。分析、例:🎜bootchar
が主に使用されますファイル システムをメイン アプリケーションの起動プロセスにマウントするのにかかる時間を測定しますbootchar
主要用来测量挂载文件系统到主应用程序启动过程中的耗时
gpio+示波器
可以找一个在系统启动过程中空闲的GPIO
,在适当位置设置GPIO
电平。
通过示波器抓取波形可以得到各阶段耗时。
通常该方法被用来测量整个启动的耗时,或者各阶段的耗时 ,该方法也是用的比较多的。
二、内核优化方法
kernel压缩方式
kernel
有不同的压缩格式,常见的如gz
、xz
、lzma
gpio+オシロスコープ
1 つ見つかりますシステム内では起動中にアイドル状態になりますGPIO
、ここで適切な位置設定GPIO
レベル。
🎜オシロスコープで波形をキャプチャすると、各ステージの消費時間を取得できます。 🎜🎜通常、この方法は、🎜起動全体にかかる時間、または各段階の時間を測定するために使用されます🎜。 🎜
2. カーネルの最適化方法
カーネル圧縮方式
🎜カーネル
にはさまざまな圧縮形式があり、一般的なものは gz
、xz、<code style="font-size: 14px;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;background-color: rgba(27, 31 , 35, 0.05);font-family: " operator mono break-all rgb>lzma
etc. 。 🎜🎜🎜圧縮形式が異なれば解凍速度も異なります🎜。異なる圧縮方式の起動時間やフラッシュ使用量を比較して、実際の状況に合ったものを選択し、最適化します。 🎜
読み込み場所
カーネルイメージは次のように決定できます: rgba(27, 31, 35, 0.05);font-family: "Operator Mono", Consolas, Monaco, Menlo, monospace;word-break: Break -all;color: rgb(239, 112, 96);"> カーネル
自己解凍型。uboot
で解凍します。 kernel
自解压,也可以由uboot
进行解压。对于kernel
自解压的情况,如果压缩过的kernel
与解压后的kernel
地址冲突,则会先把自己复制到安全的地方,然后再解压,防止自我覆盖。这就需要耗费复制的时间。
即把加载地址 和运行地址 设置为不同地址,可以减少耗时。
内核裁剪
裁剪内核是必要的,如果内核镜像太大,那么解压内核就需要很长时间,所以内核要尽量裁剪。
裁剪内核,可以减少解压耗时。初始化内容少了,也会减少耗时。
因此裁剪内核时,要考虑将不需要的功能都去掉。
预设置lpj数值
LPJ
也就是loops_per_jiffy
カーネル
自己解凍状況、圧縮された 0.05);font-family: "Operator Mono"、Consolas、Monaco、Menlo、monospace;word-break: Break-all;color: rgb(239, 112, 96);">kernel の場合、解凍された カーネル
アドレスの競合。最初にそれ自体を安全な場所にコピーしてから、自己上書きを防ぐために解凍します。これには時間のかかるコピーが必要になります。 🎜🎜読み込みアドレス と実行アドレス を別のアドレスに設定すると、時間を短縮できます。 🎜🎜🎜🎜カーネルのトリミング🎜🎜🎜🎜カーネルイメージが大きすぎると、解凍に時間がかかるため、カーネルを可能な限りトリミングする必要があります。 🎜🎜解凍時間を短縮するためにカーネルをカットします。初期化内容が少なくなると、消費時間も削減されます。 🎜🎜そのため、カーネルをトリミングするときは、不要な機能をすべて削除することを検討してください。 🎜🎜🎜🎜プリセットlpj値🎜🎜🎜🎜LPJ つまり、<code style="font-size: 14px;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;background-color: rgba(27, 31, 35, 0.05);font-family: " operator mono break-all rgb>loops_per_jiffy
、毎起動するたびに計算されますが、変更を加えなければ、値を直接指定して計算をスキップすることもできます。 🎜如下log
所示,有skipped
,lpj
由timer
计算得来,不需要再校准calibrate
了。
[ 0.019918] Calibrating delay loop (skipped), value calculated using timer frequency.. 48.00 BogoMIPS (lpj=240000) 如果没有skipped
,则可以在cmdline
中添加lpj=xxx
进行预设
initcall优化
如前面提到,initcall
耗时是可以打印出来的,在cmdline
中设置initcall_debug=1
,即可打印跟踪所有内核初始化过程中调用的顺序以及耗时。
[ 0.021772] initcall sunxi_pinctrl_init+0x0/0x44 returned 0 after 9765 usecs
[ 0.067694] initcall param_sysfs_init+0x0/0x198 returned 0 after 29296 usecs
[ 0.070240] initcall genhd_device_init+0x0/0x88 returned 0 after 9765 usecs
[ 0.080405] initcall init_scsi+0x0/0x90 returned 0 after 9765 usecs
[ 0.090384] initcall mmc_init+0x0/0x84 returned 0 after 9765 usecs 根据打印信息,可以对耗时较多的initcall
进行优化。
内核initcall_module并行
initcall
有很多等级,但比较耗时的是module
。
如果是多核,可以考虑将module_initcall
并行执行 来节省时间。
目前内核do_initcalls
是一个一个按照顺序来执行,可以修改成新建内核线程来执行
减少pty/tty个数
加入initcall
打印之后,发现pty/tty init
耗时很多,可减少个数来缩短init
时间。
initcall pty_init+0x0/0x3c4 returned 0 after 239627 usecs
initcall chr_dev_init+0x0/0xdc returned 0 after 36581 usecs
内核module
只把必须要加进内核的才编译进内核,其他的编译成模块。
例如将必要的clock
、tty
、pinctrl
等编译进内核
三、その他优化
uboot
如果是RISC-V
架台、可考慮虑去掉uboot
。RISC-V
架构,可以考虑去掉uboot
。
XIP
xip
:eXecute In Place
。即芯片内执行,是指CPU
直接从存储器中读取程序代码执行,而不用再读到内存中。
一般我们的程序都是放到flash
中,系统启动时,把程序从flash
拷贝到ddr
中执行,而xip
技术则不需要拷贝程序到ddr
🎜🎜XIP🎜🎜🎜🎜xip
:その場で実行
。つまり、コア片内実行とは、CPU
は、内部メモリに再実行するのではなく、プログラム コードをメモリから直接実行します。 : 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;background-color: rgba(27, 31, 35, 0.05);font-family: "Operator Mono"、コンソラス、モナコ、 Menlo, 等幅;ワードブレイク: ブレークオール;カラー: rgb(239, 112, 96);">フラッシュ中,系统启动時,把程序从フラッシュ
コピーtoddr
中実行,而xip
技术则不必要贝程序到ddr
、したがって、非常に速い速度で会います。このテクノロジーはチップでサポートされている必要があります。SPI
的描述是否支持XIP
機能はチップのマニュアルで確認できます。
4. まとめ
上記のシステム起動速度の最適化は、最終的にはいくつかのアイデアと方法を提供することです。
起動速度を最適化するには、一般的にシステム全体の起動についてより深く理解する必要があります。
最適化には終わりがありません、起動速度と効果を考慮して、目的に応じて最適化する必要があります。