一起聊聊linux上numa架構（圖文詳解）-linux運維-PHP中文網

首頁

運維

linux運維

一起聊聊linux上numa架構（圖文詳解）

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 03, 2022 am 06:00 AM

linux

這篇文章帶給大家啦linux中numa架構介紹的相關知識，希望對大家有幫助。

一起聊聊linux上numa架構（圖文詳解）

以下案例是基於 Ubuntu 16.04，同樣適用於其他的 Linux 系統。我使用的案例環境如下：

機器配置：32 CPU，64GB 記憶體

在NUMA中儲存層次的概念：

一起聊聊linux上numa架構（圖文詳解）

1）處理器層:單一物理核，稱為處理器層。 2）本地節點層:對於某個節點中的所有處理器，此節點稱為本地節點。 3）home節點層:與本機節點相鄰的節點稱為home節點。 4）遠端節點層:非本地節點或鄰居節點的節點，稱為遠端節點。 CPU存取不同類型節點記憶體的速度是不相同的，訪問本地節點的速度最快，訪問遠端節點的速度最慢，即訪問速度與節點的距離有關，距離越遠訪問速度越慢，此距離稱作Node Distance。應用程式要盡量的減少不同CPU模組之間的交互，如果應用程式能有方法固定在一個CPU模組裡，那麼應用的效能將會有很大的提升。

**以鯕鵬920處理器講一下cpu晶片的構成：**鯤鵬920處理器片上系統的每個超級核心集群包含6個核心集群、2個I/O集群和4個DDR控制器。每個超級核心集群封裝成一個CPU晶片。每個晶片上整合了4個72位元（64位元資料加8位元ECC）、資料傳輸率最高為3200MT/s的高速DDR4通道，單一晶片可支援最多512GB×4的DDR儲存空間。 L3 Cache在物理上被分成兩個部分：L3 Cache TAG和L3 Cache DATA。 L3 Cache TAG整合在每個核心叢集中，以降低監聽延遲。 L3 Cache DATA則直接連接片上匯流排。 Hydra根代理（Hydra Home Agent，HHA）是處理多晶片系統Cache一致性協定的模組。 POE_ICL是系統配置的硬體加速器，一般可以用作分組順序整理器、訊息佇列、訊息分發或實現某個處理器核心的特定任務等。此外，每個超級核心叢集在實體上也配置了通用中斷控制器分發器（GICD）模組，相容於ARM的GICv4規格。當單晶片或多晶片系統中有多個超級核心集群時，只有一個GICD對系統軟體可見。

numactl的使用

Linux提供了一個手工調優的命令numactl（預設不安裝），在Ubuntu上的安裝命令如下：

sudo apt install numactl -y

###首先你可以透過man numactl或numactl --h來了解參數的功能與輸出的內容。檢視系統的numa狀態：###

numactl --hardware

###運行得到如下的結果：###

available: 4 nodes (0-3)
node 0 cpus: 0 1 2 3 4 5 6 7
node 0 size: 16047 MB
node 0 free: 3937 MB
node 1 cpus: 8 9 10 11 12 13 14 15
node 1 size: 16126 MB
node 1 free: 4554 MB
node 2 cpus: 16 17 18 19 20 21 22 23
node 2 size: 16126 MB
node 2 free: 8403 MB
node 3 cpus: 24 25 26 27 28 29 30 31
node 3 size: 16126 MB
node 3 free: 7774 MB
node distances:
node   0   1   2   3
  0:  10  20  20  20
  1:  20  10  20  20
  2:  20  20  10  20
  3:  20  20  20  10

############根據這個圖與指令得到的結果，可以看到，此系統共有4個node，各領取8個CPU和16G記憶體。這裡還要注意的就是CPU共享的L3 cache也是會自己領取對應的空間。透過numastat指令可以查看numa狀態,回傳值內容：######numa_hit：是打算在該節點上分配內存，最後從這個節點分配的次數;######numa_miss：是打算在該節點分配內存，最後卻從其他節點分配的次數;######numa_foreign：是打算在其他節點分配內存，最後卻從這個節點分配的次數;######interleave_hit ：採用interleave策略最後從本節點分配的次數######local_node：該節點上的程序在該節點上分配的次數######other_node：是其他節點程序在該節點上分配的次數#######注意：如果發現 numa_miss 數值比較高時，表示需要調整分配策略。例如將指定進程關聯綁定到指定的CPU上，從而提高記憶體命中率。 ###

root@ubuntu:~# numastat
                           node0           node1           node2           node3
numa_hit             19480355292     11164752760     12401311900     12980472384
numa_miss                5122680       122652623        88449951            7058
numa_foreign           122652643        88449935            7055         5122679
interleave_hit             12619           13942           14010           13924
local_node           19480308881     11164721296     12401264089     12980411641
other_node               5169091       122684087        88497762           67801

###NUMA的記憶體分配策略######--localalloc或-l：規定進程從本地節點上請求分配記憶體。 --membind=nodes或-m nodes：規定進程只能從指定的nodes上請求分配記憶體。 --preferred=node：指定一個建議的node來取得內存，如果取得失敗，則嘗試別的node。 --interleave=nodes或-i nodes：規定進程從指定的nodes上，以round robin演算法交織地請求記憶體分配。 ###

 numactl --interleave=all mongod -f /etc/mongod.conf

因为NUMA默认的内存分配策略是优先在进程所在CPU的本地内存中分配，会导致CPU节点之间内存分配不均衡，当开启了swap，某个CPU节点的内存不足时，会导致swap产生，而不是从远程节点分配内存。这就是所谓的swap insanity 现象。或导致性能急剧下降。所以在运维层面，我们也需要关注NUMA架构下的内存使用情况（多个内存节点使用可能不均衡），并合理配置系统参数（内存回收策略/Swap使用倾向），尽量去避免使用到Swap。

Node->Socket->Core->Processor

随着多核技术的发展，将多个CPU封装在一起，这个封装被称为插槽Socket；Core是socket上独立的硬件单元；通过intel的超线程HT技术进一步提升CPU的处理能力，OS看到的逻辑上的核Processor数量。

Socket = Node

Socket是物理概念，指的是主板上CPU插槽；Node是逻辑概念，对应于Socket。

Core = 物理CPU

Core是物理概念，一个独立的硬件执行单元，对应于物理CPU；

Thread = 逻辑CPU = Processor

Thread是逻辑CPU，也就是Processo

lscpu的使用

显示格式：

Architecture：架构
CPU(s)：逻辑cpu颗数
Thread(s) per core：每个核心线程，也就是指超线程
Core(s) per socket：每个cpu插槽核数/每颗物理cpu核数
CPU socket(s)：cpu插槽数
L1d cache：级缓存（google了下，这具体表示表示cpu的L1数据缓存）
L1i cache：一级缓存（具体为L1指令缓存）
L2 cache：二级缓存
L3 cache：三级缓存
NUMA node0 CPU(s) ：CPU上的逻辑核，也就是超线程

执行lscpu，结果部分如下：

root@ubuntu:~# lscpu
Architecture:          x86_64
CPU(s):                32
Thread(s) per core:    1
Core(s) per socket:    8
Socket(s):             4
L1d cache:             32K
L1i cache:             32K
L2 cache:              256K
L3 cache:              20480K
NUMA node0 CPU(s):     0-7
NUMA node1 CPU(s):     8-15
NUMA node2 CPU(s):     16-23
NUMA node3 CPU(s):     24-31

相关推荐：《Linux视频教程》

以上是一起聊聊linux上numa架構（圖文詳解）的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：掘金。如有侵權，請聯絡admin@php.cn刪除

了解Linux的維護模式：必需品Apr 14, 2025 am 12:04 AM

Linux維護模式通過在啟動時添加init=/bin/bash或single參數進入。 1.進入維護模式：編輯GRUB菜單，添加啟動參數。 2.重新掛載文件系統為讀寫模式：mount-oremount,rw/。 3.修復文件系統：使用fsck命令，如fsck/dev/sda1。4.備份數據並謹慎操作，避免數據丟失。

Debian如何提升Hadoop數據處理速度Apr 13, 2025 am 11:54 AM

本文探討如何在Debian系統上提升Hadoop數據處理效率。優化策略涵蓋硬件升級、操作系統參數調整、Hadoop配置修改以及高效算法和工具的運用。一、硬件資源強化確保所有節點硬件配置一致，尤其關注CPU、內存和網絡設備性能。選擇高性能硬件組件對於提升整體處理速度至關重要。二、操作系統調優文件描述符和網絡連接數:修改/etc/security/limits.conf文件，增加系統允許同時打開的文件描述符和網絡連接數上限。 JVM參數調整:在hadoop-env.sh文件中調整

Debian syslog如何學習Apr 13, 2025 am 11:51 AM

本指南將指導您學習如何在Debian系統中使用Syslog。 Syslog是Linux系統中用於記錄系統和應用程序日誌消息的關鍵服務，它幫助管理員監控和分析系統活動，從而快速識別並解決問題。一、Syslog基礎知識Syslog的核心功能包括：集中收集和管理日誌消息；支持多種日誌輸出格式和目標位置（例如文件或網絡）；提供實時日誌查看和過濾功能。二、安裝和配置Syslog(使用Rsyslog)Debian系統默認使用Rsyslog。您可以通過以下命令安裝：sudoaptupdatesud

Debian中Hadoop版本怎麼選Apr 13, 2025 am 11:48 AM

選擇適合Debian系統的Hadoop版本，需要綜合考慮以下幾個關鍵因素：一、穩定性與長期支持：對於追求穩定性和安全性的用戶，建議選擇Debian穩定版，例如Debian11(Bullseye)。該版本經過充分測試，擁有長達五年的支持週期，能夠確保系統穩定運行。二、軟件包更新速度：如果您需要使用最新的Hadoop功能和特性，則可以考慮Debian的不穩定版(Sid)。但需注意，不穩定版可能存在兼容性問題和穩定性風險。三、社區支持與資源：Debian擁有龐大的社區支持，可以提供豐富的文檔和

Debian上TigerVNC共享文件方法Apr 13, 2025 am 11:45 AM

本文介紹如何在Debian系統上使用TigerVNC共享文件。你需要先安裝TigerVNC服務器，然後進行配置。一、安裝TigerVNC服務器打開終端。更新軟件包列表：sudoaptupdate安裝TigerVNC服務器：sudoaptinstalltigervnc-standalone-servertigervnc-common二、配置TigerVNC服務器設置VNC服務器密碼：vncpasswd啟動VNC服務器：vncserver:1-localhostno

Debian郵件服務器防火牆配置技巧Apr 13, 2025 am 11:42 AM

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法，包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables（如果尚未安裝）：sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則：sudoiptables-L配置

Debian郵件服務器SSL證書安裝方法Apr 13, 2025 am 11:39 AM

在Debian郵件服務器上安裝SSL證書的步驟如下：1.安裝OpenSSL工具包首先，確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝，可以使用以下命令進行安裝：sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來，使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求（CSR）：openss

Debian郵件服務器虛擬主機配置方法Apr 13, 2025 am 11:36 AM

在Debian系統上配置郵件服務器的虛擬主機通常涉及安裝和配置郵件服務器軟件（如Postfix、Exim等），而不是ApacheHTTPServer，因為Apache主要用於Web服務器功能。以下是配置郵件服務器虛擬主機的基本步驟：安裝Postfix郵件服務器更新系統軟件包：sudoaptupdatesudoaptupgrade安裝Postfix：sudoapt

See all articles