Hello,
Actuellement on tourne dans ma société sur du Nagios 4.x sur un serveur très musclé avec 2000+ hosts et 20000+ checks. Il y a un paquet de choses qui sont désagréables actuellement avec cette solution mais d'un autre côté on aimerait rester dans cette voix (communauté importante pour les plugins/checks, opensource, non payant).
Les choses chiantes :
- Scalabilité
- Lenteur
- Lenteur de l'interface et CGI ancestral
- Configuration d'un contact d'escalade au bout de X min de non retour du service
- Configuration des checks (templates par type de host, etc)
- Distribution des tâches
- fichier plat pour le statut des checks
Du coup je jette un oeil sur différentes choses qui tournent autour de Nagios actuellement :
- Icinga
- Shinken
- mod_gearman pour distribuer les checks (semble mieux que DMX)
- Thruk
Je me rends compte que beaucoup de forks ont été fait, qu'il y a une espèce de guerre sans fin entre plein de gens autour de l'évolution de Nagios, que gearman semble prévu pour Nagios 3 mais que Nagios 4 est plus performant, etc, etc.
Mes priorités :
- Distribuer les checks sur plusieurs machines sans devoir maintenir X confs différentes
- Rendre l'interface plus rapide et efficace
- Gérer la notion d'escalade (bon à la limite s'il est simple de récupérer les états des alertes on peut le générer par un script maison)
- Pouvoir rapidement déployer la conf d'un host sur un modèle/template par type de host (ça aussi éventuellement je pourrais le scripter)
- Pouvoir facilement avoir des vues en fonction de groupes (hardware, sites, etc)
Je me doute qu'un truc tout fait n'existe pas forcément, mais si vous avez de l'expérience sur ça, je suis preneur d'orientations et conseils pour pas trop perdre de temps sur des options qui n'iront pas et pour me concentrer sur le plus adapté/proche de mon besoin
Merci de votre aide
Message édité par Sly Angel le 07-01-2015 à 15:39:02
---------------
Fan et séquestrateur de Deprem De Prel Photographie, célèbre photographe de tuning automobile :o