24시간, 7일, 365일 아무 문제 없이 돌아가는 시스템은 없습니다. 유지보수를 위한 계획된 다운 타임도 잡아야 하고, 예상치 못한 장애가 일어나기도 하죠. 클라우드도 유지보수나 서비스 이슈가 생길 수 있습니다. 크고 작은 이슈를 시스템 관리자와 서비스 운영자가 제때 알 수 있게 하려고 마이크로소프트가 애저 서비스 헬스(Azure Service Health) 프리뷰를 공개했습니다.
애저 서비스 헬스는 서비스 이슈, 계획된 유지보수 등에 대한 경보(Alert)를 알려줍니다. 이들 경보는 이메일, 문자로 받아 볼수 있는데, 필요에 따라 현재 사용하는 ServiceNow, PagerDuty, OpenGenie 등의 관리 시스템에 직접 연계할 경보가 바로 전달될 수 있게 설정할 수도 있습니다.
클라우드 서비스 이슈! 이런 것은 바로바로 알아야 ~
이 지도를 보면 미국 동부 지역에 올린 애저 컨테이너 서비스에 문제가 있네요. 해당 지역을 누르면 해당 지역의 애저 서비스에 어떤 이슈가 생겼는지 상세히 볼 수 있습니다. 시스템 관리자나 서비스 운영자는 이 정보를 참고해 해당 지역에 올린 시스템에 어떤 영향이 가는지 파악하고 대응 계획을 세울 수 있습니다. 서비스 이슈 관련 내용은 PDF 문서로 다운 받을 수 있습니다. 따라서 영향이 가는 시스템이나 서비스 관계자에게 문서를 보내 해당 문제를 바로 공유할 수 있습니다.
문제 대응 및 관리를 위해 ServiceNow, PagerDuty, OpsGenie 등을 이미 쓰고 있다면? 이들 서비스 환경에서 애저의 이슈를 당겨 볼 수도 있습니다. 마이크로소프트는 서비스 헬스를 다른 도구에 간편히 연계할 수 있도록 웹훅(Webhook) 노티피케이션을 제공합니다.
참고로 본 포스팅은 애저 블로그를 참조해 작성한 내용입니다.
'클라우드 운영 팁' 카테고리의 다른 글
[락플레이스] 배정한 예산을 넘어설 때 자동으로 알림을 받을 수 있다는 사실 - 리소스를 막 쓰다 요금 폭탄 고지서를 받을 일이 없어진다! (0) | 2017.12.20 |
---|---|
[락플레이스] 애저 애플리케이션 아키텍처 가이드 - MSA, N-tier, Big Data... 애플리케이션 유형별 구현법 안내 (0) | 2017.12.11 |
DevOps 비용 절감 포인트는? 빌드와 테스트! 초 단위로 사용료를 내는 서비스를 쓰면 됩니다. (0) | 2017.11.23 |
웹 앱의 성능 문제를 콕콕 짚어 낸다! APM 부럽지 않은 Azure App Service Diagnostics (0) | 2017.11.22 |
[클라우드 운영]Azure Advisor 하나 썼을 뿐인데, 클라우드 비용이 내려간다 ~ (0) | 2017.11.21 |