===== Surveillance et monitoring continu des applicatifs ===== Base : Nagios, Sondes NRPE, NagiosGraph La plate-forme de monitoring permet une surveillance continue et une mémorisation des situations de faute ou incidents. Elle surveille les processus et ressources standard de l'infrastructure, et disposera de sondes spécifiques pour certains processus critiques de fonctionnement (crons, alimentations de comptes, etc.) ==== Indicateurs suivis ==== === Indicateurs standard === * Suivi Swap * Suivi charge CPU moyenne * Suivi burst CPU > 10 minutes * Suivi RAM (70% warn - 90% critique) * Suivi disque OS (espace libre) * Suivi disque Data (espace libre général) Indicateurs spécifiques à certaines fonctions * Fonction proxy LB * Echec de check d'un cluster * Nombre de processus de proxy simultanés * Fonction Web * Nombre de processus php actifs simultanés * Fonction BDD * Nombre de connexions simultanées === Indicateurs Moodle === * Exécution Cron * Exécution Alimentation comptes * Suivi taille MoodleData (quota paramétrique) * Nombre de connexions actives (seuils paramétriques) * Nombre d'utilisateurs actifs (dépassement de seuil sur la période de référence) === Fonctions de la plate-forme === * Ajout d'un tenant au monitoring (côté administration) * Retrait d'un tenant du monitoring * Modification des paramètres (seuils d'exploitation) [[IndustryLevel|Outillages et méthodes]]