핵심 요약
OpenTelemetry 1.0 GA로 vendor lock-in 해소. 동일 OTel collector에서 Datadog·Honeycomb·Tempo·Elastic 4개 backend 동시 전송 운영. 비용·기능·운영 부담 비교.
1. OTel Collector 구성
receivers:
otlp: { protocols: { grpc: {}, http: {} } }
exporters:
datadog: { api: { key: ${DD_KEY} } }
otlp/honeycomb: { endpoint: api.honeycomb.io:443 }
otlp/tempo: { endpoint: tempo:4317 }
processors:
batch: {}
tail_sampling: { ... }
service:
pipelines:
traces:
receivers: [otlp]
processors: [batch, tail_sampling]
exporters: [datadog, otlp/honeycomb, otlp/tempo]
2. 비용 비교 — 월 1억 span 기준
| Backend | 월 비용 | query 속도 |
|---|---|---|
| Datadog APM | $8,400 | 매우 빠름 |
| Honeycomb | $3,200 | 매우 빠름 |
| Grafana Tempo(자체호스팅) | $1,100 | 중간 |
| Elastic APM | $2,800 | 빠름 |
3. 운영 부담
- Datadog — 0(SaaS)
- Honeycomb — 0, 쿼리 DX 압승(BubbleUp)
- Tempo — 자체 호스팅, S3 백엔드, 운영 인원 0.3 FTE
- Elastic — Kibana 능숙도 필요
4. 우리 팀 선택
Honeycomb 메인 + Tempo 백업(장기 보관). Datadog은 metric·log 위주로 좁힘.
5. 함정
- auto-instrumentation 버전차 — language별 SDK 호환성, 분기별 점검
- sampling 일관성 — backend별 다르게 받으면 다른 결론 도출
- collector 메모리 — batch processor 큰 트래픽에서 OOM, queue 별도

댓글 0