Table des matières de l'article :
Nous savons mieux que quiconque à quel point il peut être difficile de suivre la tendance, l'état de santé, la disponibilité des services et des serveurs lorsqu'ils croissent hors de toute proportion.
Vous commencez toujours avec une poignée de serveurs, vous finissez par en gérer des milliers, dans plusieurs centres de données, dans plusieurs endroits et régions du monde, sur différents fournisseurs et technologies.
Souvent, le cauchemar et le défi de tout administrateur système, devops, sysadmin qui se respecte est d'avoir tout sous contrôle, de gérer et d'apprivoiser les services et de ne pas être submergé par eux.
Au fil du temps, diverses métriques et systèmes de suivi et de collecte de données ont été imaginés, parmi lesquels nous citons à des fins professionnelles et informatives ZABBIX et NAGIOS, les deux solutions les plus populaires du marché.
Cependant, les deux solutions présentent de nombreux problèmes si vous recherchez des solutions groupées tout en un qui vous permettent de faire leur travail très bien rapidement, rapidement et dans lesquelles la mise en service, l'installation et la configuration sur chaque système prennent 30 secondes / 1 minute au plus .
Si vous recherchez une solution hautement professionnelle capable de collecter les données de toute la flotte sur un seul écran, la solution que nous vous recommandons est sans aucun doute Netdata.
Qu'est-ce que Netdata ?
données nettes est un utilitaire Linux hautement optimisé qui fournit surveillance des performances en temps réel (par seconde) pour les systèmes Linux , FreeBSD, applications, périphériques SNMP, etc. et montre des graphiques interactifs complets qui restituent absolument toutes les valeurs collectées sur le navigateur Web pour les analyser.
Netdata aide les administrateurs système, les SRE, les ingénieurs DevOps et les professionnels de l'informatique à collecter toutes les métriques possibles des systèmes et des applications, à visualiser ces métriques en temps réel et à résoudre des problèmes de performances complexes.
La solution de Netdata utilise deux composants, Agent de données réseau e Nuage de données nettes, pour fournir une surveillance en temps réel des performances et de l'intégrité des nœuds individuels et de l'ensemble de l'infrastructure.
Il a été développé pour être installé sur n'importe quel système Linux, sans interrompre les applications en cours d'exécution dessus. Vous pouvez utiliser cet outil pour surveiller et obtenir un aperçu de ce qui se passe en temps réel et de ce qui vient de se passer sur vos systèmes et applications Linux.
Voici ce qu'il surveille :
- Utilisation totale et par cœur du processeur, interruptions, softirq et fréquence.
- Utilisation totale de la mémoire, de la RAM, du swap et du noyau.
- E/S disque (par disque : bande passante, opérations, backlog, usage, etc.).
- Surveiller les interfaces réseau, y compris : la bande passante, les paquets, les erreurs, les abandons, etc.).
- Surveiller les connexions, les événements, les erreurs, etc. Pare-feu Linux Netfilter / iptables.
- Processus (en cours d'exécution, gelés, bifurqués, actifs, etc.).
- Traiter les applications système arborescentes (CPU, mémoire, swap, lectures/écritures disque, threads, etc.).
- Surveillance du statut Apache et Nginx avec mod_status.
- Surveillance de la base de données MySQL : requêtes, mises à jour, blocages, problèmes, threads, etc.
- File d'attente de messages du serveur de messagerie Postfix.
- Surveillance de la bande passante et des demandes du serveur proxy Squid.
- Capteurs matériels (température, tension, ventilateurs, puissance, humidité, etc.).
- Périphériques SNMP.
netdata
L'agent de surveillance distribué de Netdata collecte des milliers de métriques à partir des systèmes, du matériel et des applications sans aucune configuration. Il fonctionne en permanence sur tous vos serveurs physiques/virtuels, conteneurs, déploiements cloud et appareils edge/IoT.
Vous pouvez installer Netdata sur la plupart des distributions Linux (Ubuntu, Debian, CentOS et autres), des plateformes de conteneurs/microservices (cluster Kubernetes, Docker) et de nombreux autres systèmes d'exploitation (FreeBSD, macOS).
Nuage de données nettes
Netdata Cloud est une application Web qui vous donne une visibilité en temps réel sur l'ensemble de l'infrastructure. Avec Netdata Cloud, vous pouvez afficher les métriques clés, les graphiques détaillés et les alarmes actives de tous vos nœuds dans une seule interface Web. Lorsqu'une anomalie se produit, connectez-vous de manière transparente à n'importe quel nœud pour dépanner et trouver la cause première avec le tableau de bord familier de Netdata.
Netdata Cloud est gratuit ! Vous pouvez ajouter une infrastructure complète de nœuds, inviter tous vos collègues et afficher un nombre illimité de métriques, de graphiques et d'alertes, le tout gratuitement.
Bien que Netdata Cloud offre une méthode centralisée pour surveiller vos agents, les données de métriques ne sont en aucun cas stockées ou centralisées. Les données métriques restent avec vos nœuds et sont transmises à votre navigateur, via le Cloud, uniquement lorsque vous affichez l'interface Netdata Cloud.
Que pouvez-vous faire avec Netdata Cloud ?
Netdata est conçu pour être simple à utiliser et flexible pour chaque cas d'utilisation de surveillance, de visualisation et de dépannage :
- Collecter : Netdata collecte toutes les métriques disponibles de votre système et de vos applications avec plus de 300 collecteurs, la détection de service Kubernetes et la surveillance approfondie des conteneurs, le tout en utilisant seulement 1 % de CPU et quelques Mo de RAM. Il collecte également les métriques des machines Windows.
- Voir - Le tableau de bord comporte des graphiques significatifs pour vous aider à comprendre les relations entre le matériel, le système d'exploitation, les applications/services en cours d'exécution et le reste de votre infrastructure. Ajoutez des nœuds à Netdata Cloud pour une vue complète de votre infrastructure à partir d'un seul écran.
- Surveiller des : Le chien de garde de la santé de Netdata utilise des centaines d'alarmes préconfigurées pour vous alerter via Slack, e-mail, PagerDuty et plus encore lorsqu'une anomalie se produit. Personnalisez avec des seuils dynamiques, une hystérésis, des modèles d'alarme et des notifications basées sur les rôles.
- Dépannage - La granularité 1s vous permet de détecter et d'analyser des anomalies que d'autres plateformes de surveillance n'auraient peut-être pas détectées. Les visualisations interactives réduisent votre dépendance vis-à-vis de la console et les métriques historiques vous aident à retracer la cause première des problèmes.
- Boutique : Le moteur de base de données efficace de Netdata stocke efficacement les métriques par seconde pendant des jours, des semaines ou même des mois. Chaque nœud distribué stocke les métriques localement, ce qui simplifie la mise en œuvre, réduit les coûts et enrichit les tableaux de bord interactifs de Netdata.
- exportation - Intégrez des métriques par seconde à d'autres bases de données de séries chronologiques comme Graphite, Prometheus, InfluxDB, TimescaleDB et autres avec le noyau interopérable et extensible de Netdata.
- Discussions - Regroupe les métriques de n'importe quel nombre de nœuds distribués en un seul emplacement pour une analyse approfondie, y compris les nœuds temporaires dans un cluster Kubernetes.
Pourquoi utiliser Netdata ?
Netdata adopte une approche différente pour aider les gens à construire une infrastructure extraordinaire. Il a été créé par frustration avec les outils de surveillance existants qui sont trop complexes, trop chers et ils n'aident pas leurs utilisateurs à résoudre des problèmes complexes de performance et de santé.
Netdata c'est :
Simple à déployer
- Répartition sur une ligne pour les distributions Linux, ainsi que le support des infrastructures Kubernetes / Docker.
- Pas de configuration et de maintenance demande de collecter des milliers de paramètres, chaque seconde, à partir du système d'exploitation sous-jacent et des applications en cours d'exécution.
- Graphiques et alarmes prédéfinis signaler les anomalies courantes et les problèmes de performances sans configuration manuelle.
- Stockage distribué pour simplifier le coût et la complexité de l'archivage des données métriques à partir d'un nombre quelconque de nœuds.
Puissant et évolutif
- 1 % d'utilisation du processeur, quelques Mo de RAM et un minimum d'E/S de disque pour exécuter l'agent de surveillance sur du métal nu, des machines virtuelles, des conteneurs et même des appareils IoT.
- Granularité par seconde pour un nombre illimité de mesures basées sur le matériel et les applications exécutés sur les nœuds.
- Les exportateurs interopérables vous permettent de lier les métriques de Netdata par seconde avec une pile de surveillance existante et d'autres bases de données de séries chronologiques.
Optimisé pour le dépannage
- Détection des anomalies visuelles avec UI / UX mettant l'accent sur les relations entre les graphiques.
- Tableaux de bord personnalisables pour identifier les métriques associées, répondre aux incidents et vous aider à rationaliser les flux de travail.
- Des métriques distribuées dans une interface centralisée pour aider les utilisateurs ou les équipes à tracer des problèmes complexes sur des nœuds distribués.
Comparaison avec d'autres solutions
Netdata offre de nombreux avantages par rapport au paysage de surveillance existant, qu'il s'agisse de produits SaaS coûteux ou d'autres outils open source.
netdata | Autres (open source et commerciaux) |
---|---|
Métriques haute résolution (granularité 1s) | Métriques basse résolution (max 10 secondes de granularité) |
Recueille des milliers de métriques par nœud | Il ne collecte que quelques métriques |
Interface utilisateur rapide optimisée pour Détection d'une anomalie | L'interface utilisateur n'est bonne que pour une vue abstraite |
Stockage à long terme et autonome avec une seconde de granularité | Métriques centralisées dans un lac de données coûteux avec une granularité de 10 secondes |
Présentation significative , pour vous aider à comprendre les métriques | Vous devez connaître les métriques avant de commencer |
Installez et obtenez des résultats immédiatement | Long processus de vente et processus d'installation complexe |
Utilisez-le pour résoudre les problèmes de performance | Il ne fait que collecter statistiques de performances passées |
Tue la console pour le suivi des problèmes de performances | La console est toujours nécessaire pour le dépannage |
Ne nécessite pas ressources dédiées | Cela nécessite de grandes ressources dédiées |
Prix et versions
À partir du 13 mars 2024, NetData adopte une nouvelle stratégie commerciale pour les entreprises qui nécessitent la connexion de nombreux nœuds. Avec l'introduction de trois plans tarifaires distincts, NetData vise à répondre de manière globale aux besoins des différents segments d'utilisateurs.
La surveillance et le dépannage avec Netdata restent gratuits, pour toujours, pour tous. En analysant attentivement la liste des fonctionnalités, vous pouvez constater que chaque fonctionnalité de suivi est disponible gratuitement pour tous les utilisateurs. Cela est possible grâce à la conception de la solution Netdata, où toutes les capacités de surveillance, y compris l'intelligence artificielle (ML), sont implémentées au sein de l'agent Netdata, qui est open source et installé sur site.
La politique de Netdata est de ne pas facturer la surveillance elle-même, mais plutôt de mieux intégrer sa solution de surveillance aux processus métier des utilisateurs. Le développement de cette intégration va de pair avec celui de la solution de supervision elle-même. Netdata est convaincu que les utilisateurs trouveront leur méthode de surveillance non seulement plus simple et plus rapide, mais aussi plus efficace, moderne et attrayante. Ils s'attendent donc à ce qu'à mesure que l'équipe d'utilisateurs s'agrandisse, il y ait une volonté d'intégrer plus étroitement la solution Netdata aux processus métiers existants.
À cet égard, NetData a développé trois plans différents dans l'espoir de satisfaire tous les types d'utilisateurs.
Laboratoire à domicile
- Prix:
- 90 $ si facturé annuellement
- 10 $ si facturé mensuellement
- Caractéristiques:
- Utilisation par les utilisateurs de laboratoire à domicile ou les étudiants à des fins non commerciales.
- Nombre illimité de nœuds connectés ou de tableaux de bord personnalisés.
- Toutes les fonctionnalités d’un niveau professionnel complet.
- Prix fixe et régi par une politique d’utilisation équitable.
Business (Recommandé)
- Prix:
- 3 $ par nœud et par mois, lorsque facturé annuellement.
- 4 $ par nœud et par mois, lorsque facturé mensuellement.
- Caractéristiques:
- Inclusion de toutes les fonctionnalités de la communauté.
- Nœuds connectés sans limites.
- Tableaux de bord personnalisés illimités.
- Historique des événements et de la topologie jusqu'à 90 jours.
- Notifications d'événements critiques lors des opérations de dépannage.
- Possibilité de débloquer tous les rôles d'utilisateur pour maximiser l'efficacité de l'équipe.
- Intégration avec des systèmes de notification avancés comme Slack, PagerDuty, Opsgenie et autres.
Entreprise sur site
- Prix:
- 3 $ par nœud et par mois, lorsque facturé annuellement.
- Coût supplémentaire de 900$ par mois pour chaque installation.
- Caractéristiques:
- Netdata Cloud et tous ses composants hébergés entièrement sur ses propres infrastructures.
- Solution idéale pour surveiller les infrastructures critiques et les systèmes isolés.
- Personnalisation complète pour répondre aux besoins spécifiques de votre organisation.
Pour les options Business et Enterprise On-Premise, vous pouvez contacter pour obtenir des remises sur volume ou une assistance premium spécifique.
Bien que le prix HomeLab soit tout à fait adéquat et conforme aux limites de dépenses d'un amateur, les forfaits Business et On-Premise peuvent être très coûteux, en particulier avec les politiques de tarification par nœud unique. Pour un hébergeur comme le nôtre par exemple, 4 euros de dépenses mensuelles pour la surveillance d'un seul nœud entraîneraient environ 10 % des coûts sur un serveur dédié et environ 20 % des coûts sur un VPS Cloud de taille moyenne. Bref, sur une flotte de 1000 voitures, on aurait un coût de 4000 dollars + TVA, un coût non négligeable si l'on considère les coûts italiens et les politiques tarifaires extrêmement différentes de celles des États-Unis ou en tout cas hors d'Europe.
À cet égard, nous avons déjà examiné d'ici 2 mois le passage complet à Prometheus et Grafana afin d'obtenir un environnement entièrement auto-hébergé à des coûts extrêmement inférieurs avec une économie supposée d'environ 95% par rapport à une solution commerciale comme NetData qui reste encore certainement une solution valable.
Conclusions
Nous venons d'introduire et d'examiner un système très rapide et puissant permettant d'obtenir de nombreuses métriques et de les afficher sur un tableau de bord rapide, performant et captivant. La validité de l'outil qui est absolument adéquat pour presque tous les besoins de ceux qui travaillent dans le secteur des serveurs et surtout des serveurs Web qui offrent des services Web est immédiatement comprise.
En tant que société d'hébergement et d'ingénierie système, nous l'avons trouvé plus rapide, plus précis et plus facile à installer que le précédent Zabbix qui est aujourd'hui probablement le système le plus complet si vous souhaitez investir du temps (perte de temps) pour l'installer et le configurer.
Pour donner une idée de la mise en service d'un système Zabbix, disons que seule l'installation du nœud maître nécessite une heure par un ingénieur système expert et chaque machine supplémentaire au moins 15 minutes si vous allez très vite et que vous maîtrisez comme ainsi qu'un certain degré d'automatisation manuelle.
La mise en place de Netdata et de la visualisation Netdata Cloud nécessite en moyenne 1 heure de travail pour 50 machines installées. Évidemment, si vous travaillez avec plusieurs terminaux, dans un environnement hétérogène le temps peut être drastiquement réduit.