Heim >Betrieb und Instandhaltung >Betrieb und Wartung von Linux >Ideen zur Fehlerbehebung bei Linux-Betrieb und -Wartung, dieser Artikel reicht aus ~

Ideen zur Fehlerbehebung bei Linux-Betrieb und -Wartung, dieser Artikel reicht aus ~

Linux中文社区nach vorne: 2023-08-02 15:29:061240Durchsuche

1. Hintergrund

Manchmal stoßen Sie auf einige schwierige und komplizierte Krankheiten, und das Überwachungs-Plug-in kann die Grundursache des Problems nicht sofort auf einen Blick finden. Zu diesem Zeitpunkt müssen Sie sich beim Server anmelden, um die Grundursache des Problems weiter zu analysieren. Dann erfordert die Analyse von Problemen ein gewisses Maß an technischer Erfahrung, und einige Probleme umfassen sehr große Bereiche, um das Problem zu lokalisieren. Daher ist das Analysieren von Problemen und das Betreten von Fallstricken eine großartige Übung für das eigene Wachstum und die Selbstverbesserung. Wenn wir über gute Analysetools verfügen, erzielen wir mit halbem Aufwand das Doppelte des Ergebnisses. Das hilft allen, Probleme schnell zu lokalisieren, und spart allen viel Zeit für tiefergehende Arbeit.

2. Beschreibung

In diesem Artikel werden hauptsächlich verschiedene Tools zur Problemlokalisierung vorgestellt und Probleme anhand von Fällen analysiert.

3. Methodik zur Problemanalyse

Mit der 5W2H-Methode können Sie verschiedene Fragen zur Leistungsanalyse stellen

Was ist das Phänomen?
Warum – warum ist es passiert? – Wo – wo das Problem aufgetreten ist? Wie viel – wie viele Ressourcen verbraucht wurden? zu tun – wie zu lösen das Problem
4. CPU
4.1 Beschreibung
Bei Anwendungen konzentrieren wir uns normalerweise auf die Kernel-CPU-Schedulerfunktion und -leistung.
Die Thread-Statusanalyse analysiert hauptsächlich, wo Thread-Zeit verwendet wird, und die Klassifizierung des Thread-Status ist im Allgemeinen unterteilt in:
1. on-CPU: Ausführung, und die Zeit während der Ausführung wird normalerweise in Benutzermoduszeit und Benutzermodus unterteilt Systemstatus Zeitsystem.
2. Off-CPU: Warten auf die nächste CPU-Runde oder Warten auf E/A, Sperre, Seitenwechsel usw. Der Status kann in ausführbar, anonymer Seitenwechsel, Ruhezustand, Sperre, Leerlauf usw. unterteilt werden. usw. .
Wenn viel Zeit mit der CPU verbracht wird, kann die Profilierung der CPU schnell die Ursache erklären; wenn das System viel Zeit im Off-CPU-Zustand verbringt, wird die Lokalisierung des Problems viel Zeit in Anspruch nehmen. Aber es gibt noch einige Konzepte, die klar sein müssen:
- Prozessor
- Kern
- Hardware-Threads
- Cache
- Uhr Häufigkeit
- CPI und Anweisungen pro Zyklus IPC
- CPU-Anweisungen
- Nutzung
- Benutzerzeit/Kernel
- Planer
- Run Queue
- Preemption
- Multi-Prozess
- Multi-Threading
- Wortlänge
4.2 Analysetools

Hinweis:
- uptime, vmstat, mpstat, top, pidstat können nur die CPU-Nutzung und Last abfragen.
- perf kann den zeitaufwändigen Status bestimmter Funktionen innerhalb des Prozesses verfolgen, Kernelfunktionen für Statistiken angeben und diese entsprechend ausrichten.
  ... , es wirkt sich auf Dienste aus oder verursacht andere Probleme.同样对于内存有些概念需要清楚：
```
牛逼啊！接私活必备的 N 个开源项目！赶快收藏
```
  - 主存
  - 虚拟内存
  - 常驻内存
  - 地址空间
  - OOM
  - 页缓存
  - 缺页
  - 换页
  - 交换空间
  - 交换
  - 用户分配器libc、glibc、libmalloc和mtmalloc
  - LINUX内核级SLUB分配器
  5.2 分析工具
  
  说明：
  - free，vmstat，top，pidstat，pmap只能统计内存信息以及进程的内存使用情况。
  - valgrind 可以分析内存泄漏问题。
  - dtrace 动态跟踪。需要对内核函数有很深入的了解，通过D语言编写脚本完成跟踪。
  5.3 使用方式
```
//查看系统内存使用情况free -m//虚拟内存统计信息vmstat 1//查看系统内存情况top//1s采集周期，获取内存的统计信息pidstat -p pid -r 1//查看进程的内存映像信息pmap -d pid//检测程序内存问题valgrind --tool=memcheck --leak-check=full --log-file=./log.txt  ./程序名
```
  6. 磁盘IO
  
  6.1 说明
  
  磁盘通常是计算机最慢的子系统，也是最容易出现性能瓶颈的地方，因为磁盘离 CPU 距离最远而且 CPU 访问磁盘要涉及到机械操作，比如转轴、寻轨等。访问硬盘和访问内存之间的速度差别是以数量级来计算的，就像1天和1分钟的差别一样。要监测 IO 性能，有必要了解一下基本原理和 Linux 是如何处理硬盘和内存之间的 IO 的。
  在理解磁盘IO之前，同样我们需要理解一些概念，例如：
  - Dateisystem
  - VFS
  - Dateisystem-Cache
  - Seiten-Cache-Seite. Cache
  - Puffer-Cache-Puffer-Cache
  - Verzeichnis-Cache ??

Das obige ist der detaillierte Inhalt vonIdeen zur Fehlerbehebung bei Linux-Betrieb und -Wartung, dieser Artikel reicht aus ~. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

nginx json 接口栈 .net 线程多线程 github 算法 http linux openresty

Stellungnahme：

Dieser Artikel ist reproduziert unter:Linux中文社区. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：109 praktische Beispiele für Shell-Skripte, der Code ist klar und einfach zu verwenden!Nächster Artikel：109 praktische Beispiele für Shell-Skripte, der Code ist klar und einfach zu verwenden!

In Verbindung stehende Artikel

Mehr sehen

Ideen zur Fehlerbehebung bei Linux-Betrieb und -Wartung, dieser Artikel reicht aus ~

1. Hintergrund

2. Beschreibung

3. Methodik zur Problemanalyse

4.2 Analysetools

5.2 分析工具

5.3 使用方式

6. 磁盘IO

6.1 说明

6.3 使用方式

7. 网络

7.1 说明

7.2 分析工具

7.3 使用方式

8. 系统负载

8.1 说明

8.2 分析工具

8.3 使用方式

9. 火焰图

9.1 说明

9.2 安装依赖库

9.3 安装

9.4 CPU级别火焰图

9.4.1 on-CPU

9.4.2 off-CPU

9.5 内存级别火焰图

9.6 性能回退-红蓝差分火焰图

10. Fallanalyse

10.1 Anomalien im Nginx-Cluster auf der Zugriffsebene

10.2 Analysieren Sie Nginx-bezogene Indikatoren plötzlich ansteigen, aber stattdessen verringert, folgen Es spielt keine Rolle, ob der Anforderungsverkehr plötzlich zunimmt.

10.5 案例总结

10.5.1 Eingehende Analyse

10.5.2 Lösung

11.参考资料

In Verbindung stehende Artikel