SLA, SLO, SLI의 차이와 고려해야 할 점

Description: 서비스를 하면서 고려해야하는 SLA, SLO, SLI에 대한 개념과 설정시 주의해야할 점에 대해 알아봅니다. 가장중요한 것은 법적책임이 생기는 SLA이지만 이를 설계하기 위해서는 간단 하고 명확한 SLO설정과 실제 SLI측정이 선행돼야합니다.

현재 노트: KR-420.00 a SLA, SLO, SLI의 차이와 고려해야 할 점
상위 분류: KR-420.00 - 운영 지표와 성능 관리

#성장경험 #시스템설계와운영개선 #운영지표와성능관리
#SLA #SLO #SLI

SLA, SLO, SLI의 차이와 고려해야 할 점

TL;DR

  1. SLA는 책임, SLO는 이론적 지표, SLI는 실제 지표로 이해할 수 있습니다.
  2. SLA는 법적 책임과 관련되어 가장 민감하며, 각 상황에 따라 설정하기 어렵습니다. SLO는 지나치게 복잡하지 않은 적절한 지표가 필요하고, SLI는 이를 충족하기 위한 간단한 방법과 측정이 요구됩니다.
  3. 따라서 기술 팀은 먼저 SLO를 설정하고, 이를 기반으로 SLI를 측정한 뒤, 회사의 법무팀(또는 유사한 기능)과 협의하여 SLA를 설정하는 것이 좋습니다.

Service Level Agreement (서비스 수준 협약)

서비스 시간 등의 책임에 대한 약속

SLA는 측정하거나 보고하기 매우 어렵습니다. 상황에 따라 항상 뉘앙스가 다릅니다.
예를 들어, 대응 시간이 4시간이라고 할 경우, 문제의 맥락, 대응의 난이도, 4시간을 초과한 대응 시간과 관련된 법적 처리 방식 등에 따라 달라질 수 있습니다.
그리고 보통 99.99%시간동안 안정 보장같은 형식과 함께 문제가 발생시 대응반환 예시(서비스가 안된 시간에 비례한 크레딧 반환)가 있습니다.


Service Level Objectives (서비스 수준 목표)

시스템 가용성에 대한 기대 목표


Service Level Indicators (서비스 수준 지표)

서비스 수준 성공률을 백분율로 표현한 정량적 지표


개념을 종합하여 설명


참고 자료