搜尋
首頁web前端js教程Shell腳本實作Linux系統與行程資源監控_基礎知識

在伺服器運維過程中,經常需要對伺服器的各種資源進行監控,例如:CPU的負載監控,磁碟的使用率監控,進程數目監控等等,以在系統出現異常時及時報警,通知系統管理員。本文介紹在Linux系統下幾種常見的監控需求及其shell腳本的編寫。

文章目錄:

1.Linux使用 Shell 檢查進程是否存在
2.Linux使用 Shell偵測進程 CPU 使用率
3.Linux使用 Shell偵測進程記憶體使用量
4.Linux使用 Shell偵測進程句柄使用量
5.Linux使用 Shell查看某個 TCP 或 UDP 連接埠是否在監聽
6.Linux使用 Shell查看某個進程名稱正在運作的個數
7.Linux使用 Shell偵測系統 CPU 負載
8.Linux使用 Shell偵測系統磁碟空間
9.總結

檢查進程是否存在

在對進程進行監控時,我們一般需要得到該進程的ID,進程ID 是進程的唯一標識,但是有時可能在伺服器上不同用戶下運行著多個相同進程名的進程,下面的函數GetPID給出了獲取指定用戶下指定進程名的進程ID 功能(目前只考慮這個用戶下啟動一個此進程名的進程),它有兩個參數為用戶名和進程名,它首先使用ps 查找進程信息,同時透過grep 過濾出所需的進程,最後透過sed 和awk 找出需要進程的ID 值(此函數可依實際情況修改,例如需要過濾其它資訊等)。

清單 1. 監控進程

複製程式碼 程式碼如下:

 function GetPID #User #Name
 {
    PsUser=$1
    PsName=$2
    pid=`ps -u $PsUser|grep $PsName|grep -v grep|grep -v vi|grep -v dbxn
    |grep -v tail|grep -v start|grep -v stop |sed -n 1p |awk '{print $1}'`
    echo $pid
 }
 

範例示範:

1)原始程式(例如尋找使用者為 root,進程名為 CFTestApp 的進程 ID)

複製程式碼 程式碼如下:

    PID=`GetPID root CFTestApp`
 
    echo $PID

2)結果輸出

複製程式碼 程式碼如下:

    11426
    [dyu@xilinuxbldsrv shell]$

3)結果分析

從上面的輸出可見:11426 為 root 使用者下的 CFTestApp 程式的進程 ID。

4)指令介紹

1. ps: 查看系統中瞬間進程資訊。 參數:-u 列出屬於該使用者的程式的狀況,也可使用使用者名稱來指定。 -p 指定行程識別碼,並列出該行程的狀況。 -o 指定輸出格式 2. grep: 用於尋找檔案中符合字串的目前行。 參數:-v 反向選擇,亦即顯示沒有 ‘搜尋字串' 內容的那一行。 3. sed: 一個非互動性文字編輯器,它編輯文件或標準輸入匯出的文件,一次只能處理一行內容。 參數:-n 讀取下一個輸入行,用下一個指令處理新的行而不是用第一個指令。 p 標誌 列印匹配行 4. awk:一種程式語言,用於在 linux/unix 下處理文字和資料。資料可以來自標準輸入、一個或多個文件,或其它命令的輸出。它支援用戶自訂函數和動態正規表示式等先進功能,是 linux/unix 下的強大程式設計工具。它在命令列中使用,但更多是作為腳本來使用。 awk 的處理文字和資料的方式:它逐行掃描文件,從第一行到最後一行,尋找匹配的特定模式的行,並在這些行上進行你想要的操作。如果沒有指定處理動作,則將符合的行顯示到標準輸出 ( 螢幕 ),如果沒有指定模式,則所有被操作所指定的行都被處理。 參數:-F fs or –field-separator fs :指定輸入檔案摺分隔符,fs 是一個字串或是一個正規表示式,如 -F:。
有時有可能進程沒有啟動,下面的功能是檢查進程 ID 是否存在,如果此進程沒有運行輸出:

複製程式碼 程式碼如下:

    The process does not exist.
    # 檢查進程是否存在
    if [ "-$PID" == "-" ]
    then
    {
        echo "The process does not exist."
    }
    fi

偵測進程 CPU 使用率

在維護應用服務時,我們經常遇到由於 CPU 過高而導致業務阻塞,造成業務中斷的情況。 CPU 過高可能由於業務量過負荷或出現死循環等異常情況,透過腳本對業務進程CPU 進行時時監控,可以在CPU 使用率異常時及時通知維護人員,以便於維護人員及時分析,定位,以及避免業務中斷等。下面的函數可取得指定進程 ID 的進程 CPU 使用率。它有一個參數為進程ID,它首先使用ps 查找進程信息,同時通過grep -v 過濾掉%CPU 行,最後通過awk 查找CPU 利用百分比的整數部分(如果系統中有多個CPU,CPU 利用率可以超過100%)。

清單 2. 對業務進程 CPU 進行即時監控

複製程式碼 程式碼如下:

function GetCpu
  {
   CpuValue=`ps -p $1 -o pcpu |grep -v CPU | awk '{print $1}' | awk -  F. '{print $1}'`
        echo $CpuValue
    }

以下的功能是透過上面的函數GetCpu 獲得此進程的CPU 使用率,然後透過條件語句判斷CPU 使用率是否超過限制,如果超過80%(可以根據實際情況進行調整),則輸出告警,否則輸出正常訊息。

清單 3. 判斷 CPU 使用率是否超過限制

複製程式碼 程式碼如下:

 function CheckCpu
 {
    PID=$1
    cpu=`GetCpu $PID`
    if [ $cpu -gt 80 ]
    then
    {
 echo “The usage of cpu is larger than 80%”
    }
    else
    {
 echo “The usage of cpu is normal”
    }
    fi
 }
 

 範例示範:

1)原始程式(假設上面已經查詢出 CFTestApp 的進程 ID 為 11426)

複製程式碼 程式碼如下:

 CheckCpu 11426

2)結果輸出
複製程式碼 程式碼如下:

    The usage of cpu is 75
    The usage of cpu is normal
    [dyu@xilinuxbldsrv shell]$

3)結果分析

從上面的輸出可見:CFTestApp 程式目前的 CPU 使用為 75%,是正常的,沒有超過 80% 的警告限制。

偵測進程記憶體使用量

在對應用程式服務進行維護時,也經常遇到由於記憶體使用過大導致進程崩潰,造成業務中斷的情況(例如32 位元程式可尋址的最大記憶體空間為4G,如果超出將申請記憶體失敗,同時物理記憶體也是有限的)。記憶體使用過高可能由於記憶體洩露,訊息堆積等情況,透過腳本對業務進程記憶體使用量進行時時監控,可以在記憶體使用量異常時及時發送警告(例如透過簡訊),便於維護人員及時處理。下面的函數可獲得指定進程 ID 的進程記憶體使用量。它有一個參數為進程 ID,它首先使用 ps 查找進程信息,同時通過 grep -v 過濾掉 VSZ 行 , 然後通過除 1000 取以兆為單位的內存使用量。

清單 4. 對業務進程記憶體使用量進行監控

複製程式碼 程式碼如下:

    function GetMem
    {
        MEMUsage=`ps -o vsz -p $1|grep -v VSZ`
        (( MEMUsage /= 1000))
        echo $MEMUsage
    }

以下的功能是透過上面的函數 GetMem獲得此進程的記憶體使用,然後透過條件語句判斷記憶體使用是否超過限制,如果超過 1.6G(可以根據實際情況進行調整),則輸出告警,否則輸出正常資訊。

清單 5. 判斷記憶體使用量是否超過限制

複製程式碼 程式碼如下:

mem=`GetMem $PID`               
 if [ $mem -gt 1600 ]
 then
 {
     echo “The usage of memory is larger than 1.6G”
 }
 else
 {
    echo “The usage of memory is normal”
 }
 fi

範例示範:

1)原始程式(假設上面已經查詢出 CFTestApp 的進程 ID 為 11426)

複製程式碼 程式碼如下:

mem=`GetMem 11426`
 
    echo "The usage of memory is $mem M"
 
    if [ $mem -gt 1600 ]
    then
    {
         echo "The usage of memory is larger than 1.6G"
    }
    else
    {
        echo "The usage of memory is normal"
    }
    fi

2)結果輸出

複製程式碼 程式碼如下:

    The usage of memory is 248 M
    The usage of memory is normal
    [dyu@xilinuxbldsrv shell]$

3)結果分析

從上面的輸出可見:CFTestApp 程式目前的記憶體使用為 248M,是正常的,沒有超過 1.6G 的警告限制。

偵測進程句柄使用量

在對應用程式服務進行維護時,也經常遇到由於句柄使用 過量導致業務中斷的情況。每個平台對進程的句柄使用都是有限的,例如在Linux 平台,我們可以使用ulimit – n 命令(open files (-n) 1024)或者對/etc/security/limits.conf 的內容進行查看,得到進程句柄限制。句柄使用過高可能由於負載過高,句柄洩漏等情況,透過腳本對業務進程句柄使用量進行時時監控,可以在異常時及時發送告警(例如透過簡訊),以便於維護人員及時處理。下面的函數可取得指定進程 ID 的進程句柄使用情況。它有一個參數為進程 ID,它首先使用 ls 輸出進程句柄訊息,然後透過 wc -l 統計輸出句柄個數。

複製程式碼 程式碼如下:

    function GetDes
    {
        DES=`ls /proc/$1/fd | wc -l`
        echo $DES
    }

下面功能是透過上面的函數GetDes獲得此程序的句柄使用量,然後透過條件語句判斷句柄使用是否超過限制,如果超過900(可以根據實際情況進行調整)個,則輸出告警,否則輸出正常資訊.

複製程式碼 程式碼如下:

 des=` GetDes $PID`
 if [ $des -gt 900 ]
 then
 {
     echo “The number of des is larger than 900”
 }
 else
 {
    echo “The number of des is normal”
 }
 fi

範例示範:

1)原始程式(假設上面查詢出 CFTestApp 的進程 ID 為 11426)

複製程式碼 程式碼如下:

des=`GetDes 11426`
 
    echo "The number of des is $des"
 
    if [ $des -gt 900 ]
    then
    {
         echo "The number of des is larger than 900"
    }
    else
    {
        echo "The number of des is normal"
    }
    fi

2)結果輸出

複製程式碼 程式碼如下:

    The number of des is 528
    The number of des is normal
    [dyu@xilinuxbldsrv shell]$

3)結果分析

從上面的輸出可見:CFTestApp 程式目前的句柄使用為 528 個,是正常的,沒有超過 900 個的警告限制。

4)指令介紹

wc: 統計指定檔案中的位元組數、字數、行數 , 並將統計結果顯示輸出。 參數:-l 統計行數。 -c 統計位元組數。 -w 統計字數。

查看某個 TCP 或 UDP 連接埠是否在監聽

連接埠偵測是系統資源偵測經常遇到的,特別是在網路通訊情況下,連接埠狀態的偵測往往是很重要的。有時可能進程,CPU,記憶體等處於正常狀態,但是連接埠處於異常狀態,業務也是沒有正常運作。下列函數可判斷指定連接埠是否在監聽。它有一個參數為待檢測端口,它首先使用netstat 輸出端口佔用信息,然後通過grep, awk,wc 過濾輸出監聽TCP 端口的個數,第二條語句為輸出UDP 端口的監聽個數,如果TCP 與UDP 連接埠監聽皆為0,回傳0,否則回傳1.

清單 6. 連接埠偵測

複製程式碼 程式碼如下:

 function Listening
 {
    TCPListeningnum=`netstat -an | grep ":$1 " | n
    awk '$1 == "tcp" && $NF == "LISTEN" {print $0}' | wc -l`
    UDPListeningnum=`netstat -an|grep ":$1 " n
    |awk '$1 == "udp" && $NF == "0.0.0.0:*" {print $0}' | wc -l`
    (( Listeningnum = TCPListeningnum UDPListeningnum ))
    if [ $Listeningnum == 0 ]
    then
    {
        echo "0"
    }
    else
    {
       echo "1"
    }
    fi
 }

範例示範:

1)原始程式(例如查詢 8080 連接埠的狀態是否在監聽)


複製程式碼 程式碼如下:

    isListen=`Listening 8080`
    if [ $isListen -eq 1 ]
    then
    {
        echo "The port is listening"
    }
    else
    {
        echo "The port is not listening"
    }
    fi
 

2)結果輸出

複製程式碼 程式碼如下:

    The port is listening
    [dyu@xilinuxbldsrv shell]$

3)結果分析

從上面的輸出可見:這個 Linux 伺服器的 8080 連接埠處在監聽狀態。

4)指令介紹

netstat: 用於顯示與 IP、​​TCP、UDP 和 ICMP 協定相關的統計數據,一般用於檢驗本機各連接埠的網路連線情況。 參數:-a 顯示所有連線中的 Socket。 -n 直接使用 IP 位址,而不透過網域名稱伺服器。
下面的功能也是偵測某個 TCP 或 UDP 連接埠是否處於正常狀態。

複製程式碼 程式碼如下:

 tcp: netstat -an|egrep $1 |awk '$6 == "LISTEN" && $1 == "tcp" {print $0}'
 udp: netstat -an|egrep $1 |awk '$1 == "udp" && $5 == "0.0.0.0:*" {print $0}'
 

指令介紹

egrep: 在檔案內尋找指定的字串。 egrep 執行效果如grep -E,所使用的語法及參數可參考grep 指令,與grep 不同點在於解讀字串的方法,egrep 是用擴展的正規表示式語法來解讀,而grep 則用基本的正規表示式語法,擴展的正規表示式比基本的正規表示式有更完整的表達式規範。

查看某個行程名稱正在運作的個數

有時我們可能需要得到伺服器上某個行程的啟動個數,下面的功能是偵測某個行程正在執行的個數,例如行程名稱為 CFTestApp。

複製程式碼 程式碼如下:

 Runnum=`ps -ef | grep -v vi | grep -v tail | grep "[ /]CFTestApp" | grep -v grep | wc -l
 

偵測系統 CPU 負載

在對伺服器進行維護時,有時也遇到由於系統 CPU(利用率)負載 過量導致業務中斷的情況。伺服器上可能運行多個進程,查看單一進程的 CPU 都是正常的,但是整個系統的 CPU 負載可能是異常的。透過腳本對系統 CPU 負載進行時時監控,可以在異常時及時發送告警,以便於維護人員及時處理,預防事故發生。下面的函數可以偵測系統 CPU 使用情況 . 使用 vmstat 取 5 次系統 CPU 的 idle 值,取平均值,然後透過與 100 取差得到目前 CPU 的實際佔用值。

複製程式碼 程式碼如下:

 function GetSysCPU
 {
   CpuIdle=`vmstat 1 5 |sed -n '3,$p' n
   |awk '{x = x $15} END {print x/5}' |awk -F. '{print $1}'
   CpuNum=`echo "100-$CpuIdle" | bc`
   echo $CpuNum
 }

範例示範:

1)原始程式

複製程式碼 程式碼如下:

 cpu=`GetSysCPU`
 
 echo "The system CPU is $cpu"
 
 if [ $cpu -gt 90 ]
 then
 {
    echo "The usage of system cpu is larger than 90%"
 }
 else
 {
    echo "The usage of system cpu is normal"
 }
 fi

2)結果輸出

複製程式碼 程式碼如下:

 The system CPU is 87
 The usage of system cpu is normal
 [dyu@xilinuxbldsrv shell]$

3) 結果分析

上記の出力からわかるように、Linux サーバー システムの現在の CPU 使用率は 87% であり、これは正常であり、アラーム制限の 90% を超えません。

4) コマンドの紹介

vmstat: Virtual Meomory Statistics (仮想メモリ統計) の略称。オペレーティング システムの仮想メモリ、プロセス、CPU アクティビティを監視できます。
パラメータ: -n は、出力ヘッダー情報が周期的なループ出力中に 1 回だけ表示されることを示します。

システムのディスク容量を確認します

システムのディスク領域の検出は、システム リソースの検出の重要な部分であり、多くの場合、サーバーのディスク領域の使用状況を確認する必要があります。ビジネスによっては、通話メモ、ログ、または一時ファイルを時々書き込む必要があるため、ディスク容量が使い果たされると、業務が中断される可能性があります。次の機能は、現在のシステム内のディレクトリのディスク容量使用量を検出できます。入力パラメータ 検出する必要があるディレクトリ名については、df を使用してシステムのディスク領域使用量情報を出力し、grep と awk でフィルタリングして、特定のディレクトリのディスク領域使用率を取得します。

コードをコピーします コードは次のとおりです:

関数 GetDiskSpc
{
If [ $# -ne 1 ]
それでは
1 を返す
フィ

フォルダー="$1$"
DiskSpace=`df -k |grep $Folder |awk '{print $5}' |awk -F% '{print $1}'
echo $DiskSpace
}

サンプルデモ:

1) ソースプログラム(検出ディレクトリは/boot)


コードをコピー コードは次のとおりです:

フォルダー="/ブート"

DiskSpace=`GetDiskSpc $Folder`

echo "システムの $Folder ディスク容量は $DiskSpace% です"

if [ $DiskSpace -gt 90 ]
それから
{
echo "システムディスク($Folder)の使用量が90%を超えています"
}
それ以外
{
echo "システムディスク($Folder)の使用状況は正常です"
}
ふぃ

2) 結果出力

コードをコピーします コードは次のとおりです:

システム/ブートディスク容量は 14% です
システムディスク(/boot)の使用状況は正常です
[dyu@xilinuxbldsrv シェル]$

3) 結果分析

上記の出力から、この Linux サーバー システムの /boot ディレクトリ内のディスク領域の 14% が使用されていることがわかります。これは正常であり、使用量アラーム制限の 90% を超えていません。

4) コマンドの紹介

df: ファイル システムのディスク領域の使用状況を確認します。このコマンドを使用すると、ハードディスク上で占有されているスペースの量や現在残っているスペースの量などの情報を取得できます。 パラメータ: -k k バイト単位で表示します。

概要

Linux プラットフォームでは、シェル スクリプト監視はサーバーとプロセスを監視するための非常にシンプルで便利で効果的な方法であり、システム開発者やプロセス保守者にとって非常に役立ちます。上記の情報を監視してアラームを送信するだけでなく、プロセスログやその他の情報も監視できます。この記事が皆様のお役に立てれば幸いです。

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
JavaScript的角色:使網絡交互和動態JavaScript的角色:使網絡交互和動態Apr 24, 2025 am 12:12 AM

JavaScript是現代網站的核心,因為它增強了網頁的交互性和動態性。 1)它允許在不刷新頁面的情況下改變內容,2)通過DOMAPI操作網頁,3)支持複雜的交互效果如動畫和拖放,4)優化性能和最佳實踐提高用戶體驗。

C和JavaScript:連接解釋C和JavaScript:連接解釋Apr 23, 2025 am 12:07 AM

C 和JavaScript通過WebAssembly實現互操作性。 1)C 代碼編譯成WebAssembly模塊,引入到JavaScript環境中,增強計算能力。 2)在遊戲開發中,C 處理物理引擎和圖形渲染,JavaScript負責遊戲邏輯和用戶界面。

從網站到應用程序:JavaScript的不同應用從網站到應用程序:JavaScript的不同應用Apr 22, 2025 am 12:02 AM

JavaScript在網站、移動應用、桌面應用和服務器端編程中均有廣泛應用。 1)在網站開發中,JavaScript與HTML、CSS一起操作DOM,實現動態效果,並支持如jQuery、React等框架。 2)通過ReactNative和Ionic,JavaScript用於開發跨平台移動應用。 3)Electron框架使JavaScript能構建桌面應用。 4)Node.js讓JavaScript在服務器端運行,支持高並發請求。

Python vs. JavaScript:比較用例和應用程序Python vs. JavaScript:比較用例和應用程序Apr 21, 2025 am 12:01 AM

Python更適合數據科學和自動化,JavaScript更適合前端和全棧開發。 1.Python在數據科學和機器學習中表現出色,使用NumPy、Pandas等庫進行數據處理和建模。 2.Python在自動化和腳本編寫方面簡潔高效。 3.JavaScript在前端開發中不可或缺,用於構建動態網頁和單頁面應用。 4.JavaScript通過Node.js在後端開發中發揮作用,支持全棧開發。

C/C在JavaScript口譯員和編譯器中的作用C/C在JavaScript口譯員和編譯器中的作用Apr 20, 2025 am 12:01 AM

C和C 在JavaScript引擎中扮演了至关重要的角色,主要用于实现解释器和JIT编译器。1)C 用于解析JavaScript源码并生成抽象语法树。2)C 负责生成和执行字节码。3)C 实现JIT编译器,在运行时优化和编译热点代码,显著提高JavaScript的执行效率。

JavaScript在行動中:現實世界中的示例和項目JavaScript在行動中:現實世界中的示例和項目Apr 19, 2025 am 12:13 AM

JavaScript在現實世界中的應用包括前端和後端開發。 1)通過構建TODO列表應用展示前端應用,涉及DOM操作和事件處理。 2)通過Node.js和Express構建RESTfulAPI展示後端應用。

JavaScript和Web:核心功能和用例JavaScript和Web:核心功能和用例Apr 18, 2025 am 12:19 AM

JavaScript在Web開發中的主要用途包括客戶端交互、表單驗證和異步通信。 1)通過DOM操作實現動態內容更新和用戶交互;2)在用戶提交數據前進行客戶端驗證,提高用戶體驗;3)通過AJAX技術實現與服務器的無刷新通信。

了解JavaScript引擎:實施詳細信息了解JavaScript引擎:實施詳細信息Apr 17, 2025 am 12:05 AM

理解JavaScript引擎內部工作原理對開發者重要,因為它能幫助編寫更高效的代碼並理解性能瓶頸和優化策略。 1)引擎的工作流程包括解析、編譯和執行三個階段;2)執行過程中,引擎會進行動態優化,如內聯緩存和隱藏類;3)最佳實踐包括避免全局變量、優化循環、使用const和let,以及避免過度使用閉包。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能