안녕하세요! 아틀라시안 플래티넘 파트너, 오픈소스컨설팅입니다.

오늘은 DevOps팀이 Opsgenie를 선택하는 10가지 이유에 대해서 이야기 해보려고 합니다.


Opsgenie는 알림을 중앙에서 관리하여 적시에, 적절한 담당자에게 알림을 제공하는 인시던트 관리 솔루션으로

상시 가동 서비스를 처음 접하는 팀 뿐만 아니라 기존 솔루션에 만족하지 못했던 팀에게 좋은 대안이 될 수 있습니다.


지난 6개월 동안 Opsgenie의 고객 기반은 크게 확장되었습니다.

Whole Foods Market, Zillow, Kindred Systems 같은 선도적인 기업들이 PagerDuty 대신 Opsgenie를 선택하고 있는데요,

이번 포스팅에서는 개발팀과 운영팀이 왜 Opsgenie를 선택하는지, 그 이유에 대해 알아보겠습니다.



1. Flexibility to fit any workflow

인시턴스에 대응할 때 다른 두 팀이 똑같이 일하지 않습니다. 노련한 IT팀과 개발팀은 소스, 페이로드 및 문제 발생 시간에 따라 경보를 다르게 처리하는 경향이 있습니다. Opsgenie는 유연한 규칙 엔진을 통해 팀이 원하는 방식으로 작업할 수 있도록 합니다. 예를 들어 근무시간 이후에 인시던트가 발생했을 때, Opsgenie는 긴급한 경우 즉시 모든 팀 구성원에게 이를 알리고, 우선 순위가 낮은 경우라면 다음 날 근무 시간까지 알람을 연기할 수 있습니다. 이러한 유연성 덕분에 모든 경보가 확실히 전달되고, 적시에 인시던트를 처리하는데 도움을 줄 수 있습니다.

2. Seamless integration across Atlassian tools for end-to-end management

Opsgenie는 다른 Atlassian 제품들과 긴밀한 양방향 연결을 통해 end-to-end 인시던트 관리 솔루션을 제공합니다.


  • Opsgenie 내에서 Jira Software 또는 Jira Service Desk 이슈를 생성하여 필요한 작업을 문서화하고 추적할 수 있습니다.
  • Jira Software 또는 Jira Service Desk에서 이슈가 생성될 때 Opsgenie 경보를 트리거하고 조치를 확대하여 응답 시간을 향상시킬 수 있습니다.
  • Statuspage로 모니터링 되는 3rd party 서비스의 상태는 Opsgenie에 표시되어 사용자가 사용하는 시스템의 상태를 한눈에 볼 수 있습니다. 또한 Opsgenie는 이러한 3rd party 서비스에 문제가 있을 때 통화 중인 사람에게 알릴 수 있습니다.
  • 인시던트가 발생하면 Opsgenie는 Statuspage에 변경 사항을 게시하여 고객과 이해 관계자가 문제 및 상태 업데이트를 알 수 있도록 합니다.


3. More meaningful alerts to take faster action

Opsgenie의 긴밀한 통합을 통해 사용자는 알림 메시지를 다시 정리하여 소스에 관계없이 쉽게 이해하고 표준화 할 수 있습니다.

예를 들어, AWS Cloudwatch Alert의 경고 내용을 읽기 쉽게 재구성할 수 있습니다.

Maximum ApproximateNumberOfMessagesVisibleGreaterThanOrEqualtoThreshold 4.0 for QueueName Production

→ The Production Message Queue has more than three messages in it.


이 맞춤 메시지는 모든 알림(음성, SMS, 이메일 및 모바일 푸시)에 사용할 수 있습니다. 또한, 경고에 태그 및 선택적 필드를 추가하고 차트, 로그, Runbook 등을 첨부하여 수신자가 최상의 조치를 결정할 수 있도록 할 수 있습니다.


4. Role-based access to scale easily across teams

Opsgenie는 팀이 자체적으로 일정, 규칙 및 정책을 작성하고 편집할 수 있도록 합니다. 사용자는 특정 계정 관리자에 의존하지 않고 세분화 된 권한으로 사용자 지정 역할을 만들 수 있습니다. 팀 규모에 따라 효율성이 높아져 조직 전체의 시간이 절약됩니다.

5. End-to-end monitoring with Heartbeats

Opsgenie는 팀이 자체적으로 일정, 규칙 및 정책을 작성하고 편집할 수 있도록 합니다. 사용자는 특정 계정 관리자에 의존하지 않고 세분화 된 권한으로 사용자 지정 역할을 만들 수 있습니다. 팀 규모에 따라 효율성이 높아져 조직 전체의 시간이 절약됩니다.



6. Secure connection with on-prem applications

팀이 On-premise와 클라우드 기반 모니터링 및 ITSM 도구를 혼합하여 사용하는 것은 드문 일이 아닙니다. 이러한 시스템을 통합하는 것은 종종 방화벽 연결을 열고 호스트 서버를 퍼블릭하게 노출시키는 것을 의미합니다. 이것은 대부분의 조직이 오히려 피해야할 위험을 초래합니다. 결과적으로, On-premise 솔루션은 사일로 상태를 유지하며 사용자는 시스템간에 수동적으로 업데이트 및 복사/붙여넣기를 수행해야 합니다.

Opsgenie는 Jira Server, Nagios, Solarwinds 등을 포함한 On-premise 시스템을 통해 안전하고 원활한 연결을 허용하는 OEC(Opsgenie Edge Connector)로 이 문제를 해결합니다. 모든 연결은 아웃바운드이므로 위험한 인바운드 포트 및 프로토콜을 인터넷에 열 필요가 없습니다. 또한 경고 응답자가 경고 강화, 문제 해결 및 자동 치료 조치를 지원하는 실행 파일을 신속하게 실행할 수 있도록 OEC를 통해 사용자 지정 스크립트를 트리거 할 수 있습니다.


7. Insightful reporting to learn from every incident

인시던트는 혼란스럽고 스트레스를 줄 수 있지만 항상 개선할 수 있는 기회를 제공합니다. Opsgenie는 경보 및 사건의 전체 수명주기를 추적하여 강력한 보고서로 집계합니다. 보고서를 통해 대부분의 경고 소스를 추적하고 팀 실적을 평가하고 앱을 나가지 않고도 통화 중 작업 부하가 얼마나 잘 분산되어 있는지 측정할 수 있습니다.
아래와 같은 내용에 대해 분석이 가능합니다.

  • 운영 효율성
  • 사용자 및 팀 생산성
  • 전화 작업 분배
  • 서비스 및 인프라 건강
  • 사고 후 분석
  • 회의 출석 및 효율성 측정 항목

Looker®로 구동되는 Opsgenie 보고서는 특정 관심 영역에 집중하도록 필터링 할 수 있으며 사용자는 마우스 클릭 한 번으로 기본 데이터로 드릴다운 할 수 있습니다.


8. Opsgenie Actions to accelerate remediation

상시 가동 서비스를 운영하는 팀은 문제에 신속하게 대응하여 작은 문제가 고객에게 영향을 미치는 중대한 중단이 일어나지 않도록 해야 합니다. 복원에는 영향을 받는 시스템 또는 인프라에 대해 알려진 일련의 작업이 포함되지만, 지금까지는 수동적이고 반복적인 개입이 필요했습니다. Opsgenie Actions는 Opsgenie 콘솔이나 모바일 앱에서 직접 이러한 수동 작업을 자동화하는 쉬운 방법을 제공합니다.

예를 들어, Opsgenie Actions는 AWS Systems Manager (SSM) 자동화 문서를 실행하여 EC2 인스턴스 시작과 같은 AWS 리소스를 조정할 수 있습니다. 매개 변수가 필요한 경우 Opsgenie 작업은 선택 목록, 체크박스 및 텍스트를 통해 사용자에게 메시지를 표시할 수 있습니다. 다른 자동화 도구를 사용하는 경우에도 문제는 없습니다. Opsgenie 작업은 REST endpoint를 트리거하여 다양한 타사 소프트웨어와 통합할 수도 있습니다.


9. Edge Encryption to ensure data security

Opsgenie Edge 암호화를 통해 데이터를 보호하세요. 이를 통해 Opsgenie의 클라우드 서비스를 오가는 경보 및 사건 정보의 통신을 보호합니다. Edge 암호화를 사용하면 Opsgenie에서 중요한 정보를 암호화하고 해독하는 키를 제어할 수 있습니다.


10. Better pricing. Period.

타사 제품보다 Opsgenie를 선택할 때 3~5배의 비용을 절약할 수 있습니다. 사용자 수를 늘리면 비용 절감 효과가 커집니다. (아래 차트 참조)

예를 들어, PagerDuty Enterprise의 정가를 지불하는 100명의 팀은 한 달에 $9,900를 지불하는 반면 같은 규모에서  Opsgenie를 도입할 경우 한 달에 $2,350의 비용을 지불합니다. 또한 PagerDuty와 달리 Opsgenie는 엔터프라이즈 계획에 포함된 무제한의 이해 관계자 라이센스를 제공하므로 조직의 모든 사람이 인시던트 상태에 대한 루프를 유지할 수 있습니다. Opsgenie는 최대 5 명의 사용자에게 무료 플랜을 제공합니다.




효율적인 인시던트 관리를 위한 가장 강력한 도구 - Opsgenie에 대한 보다 자세한 정보는 아래 링크에서 확인하실 수 있습니다.

[자료 다운로드] Modern Incident Management with Atlassian by Open Source Consulting


Opsgenie에 대한 궁금한 사항이 있으시면 언제든지 오픈소스컨설팅에 연락해 주세요!



감사합니다.




출처: Atlassian
( https://www.atlassian.com/blog/it-teams/the-top-10-reasons-companies-are-choosing-opsgenie )






hjkim's profile image

hjkim

2019-08-07

Read more posts by this author