관찰 가능성 개요
Lumie 인프라는 메트릭, 로그, 트레이스를 통한 완전한 관찰 가능성을 제공하는 현대적인 모니터링 스택을 운영합니다.
아키텍처
데이터 수집 계층
- OpenTelemetry Collector: 모든 텔레메트리 데이터의 중앙 수집점
- Node Exporter: 노드 레벨 시스템 메트릭
- Kube State Metrics: Kubernetes 리소스 상태 메트릭
- Blackbox Exporter: 외부 서비스 상태 확인
저장 계층
- Prometheus: 메트릭 시계열 데이터베이스
- Loki: 로그 집계 및 저장
- Tempo: 분산 트레이싱 데이터
- Thanos: 통합 메트릭 쿼리 레이어 (현재 로컬 저장소 전용, MinIO 업로드 비활성화)
시각화 및 알림 계층
- Grafana: 대시보드 및 시각화
- Alertmanager: 알림 라우팅 및 관리
- Karma: Alertmanager UI