Lunski's Clutter

This is a place to put my clutters, no matter you like it or not, welcome here.

0%

Site Reliability Engineering

服務等級協議(Service Level Agreement)

img
img

透過設定合理的SLI和SLO,並與客戶簽訂SLA,可以有效提升服務品質,並維護良好的客戶關係。

  • SLA:Service Level Agreement (協議),服務範圍、服務水準、責任分配、賠償方式,與客戶需求一致。
    • SLO:Service Level Objective (目標),99.9%的可用性、平均響應時間小於300ms,要合理且具挑戰性。
      • SLI:Service Level Indicator (指標),響應時間、錯誤率、可用性等,要清晰且可測量。

User Story: 使用服務的情境

例:點餐API設計

SLI (Service Level Indicator, 服務指標)

  • 定義:用來量化服務表現的具體指標。
  • 範例:響應時間、錯誤率、可用性等。
  • 重點:SLI是SLO的基礎,透過SLI才能衡量是否達到SLO。

例:300ms 請求延遲

SLO (Service Level Objective, 服務層級目標)

  • 定義:對SLI設定的目標值,代表期望達到的服務水準。
  • 範例:99.9%的可用性、平均響應時間小於300ms。
  • 重點:SLO是內部團隊的目標,用來確保服務品質。

三種元素組成:SLI、一段時間區間、目標,可以用ERLA(Error Rate Budget)方法 制定

例:在一個月之中,99.9% 的請求延遲有在 300ms 內

SLA (Service Level Agreement, 服務層級協議)

  • 定義:服務供應商與客戶之間的契約,明確服務水準、責任與賠償。
  • 範例:服務範圍、服務水準、責任分配、賠償方式等。
  • 重點:SLA通常包含多個SLO,並具有法律效力。

結論

SLIs需定義清晰, 從小範圍持續添加,不一定每個SLO都需要對應一個SLA,SLO和SLA應定期檢討與更新。

ref


如果你覺得這篇文章很棒,請你不吝點讚 (゚∀゚)

Welcome to my other publishing channels