Monitoring mit OpenTelemetry
Observability als gesamtheitlicher Blick auf Systeme und Anwendungen
OpenTelemetry als herstellerneutrales Observability-Framework ermöglicht es, Metriken, Logs und Traces in verteilten Systemen zu erfassen und auszuwerten. In einer Zeit, in der Microservices, Cloud-native Anwendungen und komplexe IT-Architekturen dominieren, ist Observability unverzichtbar geworden, um Fehler schnell zu identifizieren, Systeme zu optimieren und einen stabilen Betrieb sicherzustellen.
Einführung
- Was ist Observability? (Logs, Metrics, Traces)
- OpenTelemetry: Rolle, Vision und Kernfunktionen
- Komponentenüberblick zu APIs, SDKs, Collector und Exporter
Distributed Tracing
- Trace-Konzepte
- Spans
- Context-Propagation
- Parent-Child-Beziehungen
- Cross-Service-Traces
- Strategie für Sampling und Datenfilterung
- Speicherung und Visualisierung mit Jaeger
Metriken
- Metrikarten
- Counter
- Gauges
- Histograms
- Tags/Labels für granulare Analysen
- Unterscheidung Systemmetriken / Business-Metriken
- Sampling-Strategien und Export-Intervalle
- Aggregation und Verarbeitung
- Nutzungen von Prometheus und Grafana Tempo
Logs und Log-Korrelation
- Konzept und Unterschiede zu traditionellen Ansätzen
- Verknüpfung mit Traces und Metriken
- Speicherung in Grafana Loki / S3
Bereitstellung
- Collector
- On-Premise
- Container-Umgebungen mit Docker / Kubernetes
- Cloudumfeld
- Lastausgleich durch Multi-Collector
- Anbindung der Observability-Tools
- Third-Party u. a. Azure Monitor und AWS X-Ray
- Absicherung mit TLS und Authentifizierung
Abfrage, Auswertung und Visualisierung mit Grafana
- Datenquellen
- Selektion per Labels
- Abfragesprache PromQL
- Erstellung und Verwendung von Dashboard
OpenTelemetry in der Softwareentwicklung
- Client-Bibliotheken u. a. für C# / .NET
- Instrumentierung von Anwendungen
- Entwicklung eigener Exporter
Prometheus Deep Dive
- Langzeitspeicherung mit Thanos
- Datenreduktion und Bereinigung
- Edge- und IoT mit Agent-Mode
- Alarmierung per Alertmanger
- Benachrichtigungsziele per E-Mail, Webhooks u. a.
- Mehrstufiges Regelwerk
- Gruppierung und Deduplikation
Praxistipps und -tricks
- Strategien für eine erfolgreiche Einführung
- Migration bestehender Monitoring-Lösungen
- Performanceoptimierung und Reduzierung von Overhead
- Datenanreichungen und Filterung durch Prozessoren und Plugins