Analyse de performance Linux en 60 secondes

Source : Netflix Tech Blog – Linux Performance Analysis in 60,000 ms (2015)

Introduction

L’équipe Performance Engineering de Netflix a publié une méthode rapide d’analyse de performance sous Linux permettant d’obtenir une vision claire de l’état d’un serveur en seulement 60 secondes. L’objectif est d’exécuter une série de commandes simples pour identifier rapidement les goulots d’étranglement et orienter l’enquête vers les causes les plus probables.


1. Vérification de la charge système

Commande :

uptime

Affiche le temps depuis le dernier démarrage, le nombre d’utilisateurs connectés et la charge moyenne (1, 5 et 15 minutes). Une charge supérieure au nombre de cœurs CPU peut indiquer une saturation.


2. Erreurs système récentes

Commande :

dmesg | tail

Permet d’afficher les derniers messages du noyau pour identifier des erreurs matérielles, disques ou autres anomalies. Sur certains systèmes, l’équivalent journalctl -k -n 10 est recommandé.


3. Vue d’ensemble du système

Commande :

vmstat 1 5

Donne des informations sur la mémoire, le swap, le nombre de processus et l’activité CPU. La colonne %wa (I/O wait) élevée peut indiquer un problème d’accès disque.


4. Utilisation CPU par cœur

Commande :

mpstat -P ALL 1 5

Affiche la répartition de l’utilisation CPU par cœur. Cela permet de détecter un déséquilibre ou un CPU saturé.


5. Processus consommateurs de ressources

Commande :

pidstat 1 5

Montre quels processus utilisent le plus de CPU et de mémoire. Permet d’identifier rapidement les services problématiques.


6. Activité disque

Commande :

iostat -xz 1 3

Indique le débit lecture/écriture, le temps d’attente (await) et l’utilisation du disque (%util). Une valeur proche de 100 % signale une saturation.


7. Utilisation réseau par interface

Commande :

sar -n DEV 1 3

Permet de mesurer les débits entrant et sortant par interface réseau.


8. État des connexions TCP

Commande :

sar -n TCP,ETCP 1 3

Affiche le nombre de connexions actives, passives et le taux de retransmissions. Un taux élevé de retransmissions indique des pertes de paquets ou un problème réseau.


9. Profilage CPU (optionnel)

Si la charge CPU est anormale, il est possible d’utiliser perf pour analyser les fonctions consommatrices de ressources.

perf top

Ou pour un profil complet :

perf record -a -- sleep 30
perf report


Conclusion

En moins d’une minute, cette série de commandes fournit une vision globale de la santé du système. Elle permet d’orienter rapidement l’analyse vers le CPU, la mémoire, les disques ou le réseau, et de prendre les premières actions correctives.


Références

cedetrick

👤 Présentation personnelle Né en 1970, je suis un passionné d'informatique depuis mon tout premier ZX81. Curieux de nature, j'ai toujours aimé explorer, démonter, comprendre - et parfois même réparer - tout ce qui touche au numérique. Officiellement vintage, j'ai traversé les époques technologiques : du TI99/4A, CPC6128, aux calculatrices HP 48G / GX / 40G et TI92, sans oublier l'arrivée des PCs, que j'ai suivie de près, du i386 jusqu'aux configurations modernes. 💻 Je reste un utilisateur convaincu de Windows, même si je m'essaie régulièrement à Linux pour sortir de ma zone de confort. Le monde Mac ? Disons qu'on ne s'est jamais vraiment croisés. 🎮 Côté consoles, c'est toute une vie de gaming (ou presque) : de l'Atari (avant même qu'il s'appelle 2600) à la SNES, puis les PS1 et PS2 de mon petit frère - que je formais au passage à Doom, Wolfenstein, et aux assemblages Lego sur PC. Aujourd'hui, même si j'ai une PS3, PS4 et Switch, le temps me manque pour vraiment en profiter... mais elles sont là, fidèles, comme un musée interactif prêt à s'allumer ! 🎥📚 Passionné de cinéma, de séries, et de lecture, j'aime aussi simplement découvrir, apprendre et m'émerveiller. Car au fond, ce qui m'anime depuis toujours, c'est cette curiosité insatiable, ce plaisir de creuser un sujet jusqu'à en comprendre les rouages.

Laisser un commentaire