[Verse 1] Dans nos clusters Kafka il faut surveiller Prometheus nous aide à tout contrôler Cinq alertes critiques à configurer Pour que nos données puissent circuler [Chorus] Cinq alertes, cinq alertes pour Kafka Courtier down, partitions en détresse Disque plein, consommateurs qui traînent Cinq alertes, nos gardiens de la chaîne [Verse 2] Première alerte quand le courtier tombe KafkaBrokerDown dans notre sonde Plus de connexions, plus de réponses Le cluster entier qui s'effondre [Chorus] Cinq alertes, cinq alertes pour Kafka Courtier down, partitions en détresse Disque plein, consommateurs qui traînent Cinq alertes, nos gardiens de la chaîne [Verse 3] Partitions sous-répliquées attention UnderReplicatedPartitions en action Facteur de réplication insuffisant Perte de données imminente [Verse 4] Utilisation disque à surveiller KafkaDiskUsageHigh va déclencher Quatre-vingts pour cent c'est le seuil Au-delà c'est le chaos qui accueille [Chorus] Cinq alertes, cinq alertes pour Kafka Courtier down, partitions en détresse Disque plein, consommateurs qui traînent Cinq alertes, nos gardiens de la chaîne [Bridge] PagerDuty réveille l'équipe de nuit Slack notifie dans nos canaux suivis OpsGenie route selon les priorités L'intégration nous aide à réagir [Verse 5] Consumer Lag la cinquième menace Quand les consommateurs perdent la trace Messages en attente qui s'accumulent Performance système qui dégringole [Chorus] Cinq alertes, cinq alertes pour Kafka Courtier down, partitions en détresse Disque plein, consommateurs qui traînent Cinq alertes, nos gardiens de la chaîne [Outro] Strimzi et Prometheus unis Pour surveiller nos flux jour et nuit Cinq alertes pour la fiabilité De nos clusters Kafka sécurisés
← 4 Journalisation | 6 Atelier pratique : Pile d'observabilité complète →