본문 바로가기

클라우드 운영 팁

(35)
장애 발생! 뭐가 문제지? Azure Service Health로 장애 나기 전에 미리미리 사태 파악하자 ~ 최근 페이스북, 인스타그램, 지메일 등 굵직한 서비스들 장애가 일어났죠. 다들 무슨 일이냐 싶었을 것입니다. 대형 업체도 장애는 피할 수 없습니다. 클라우드에서 서비스나 시스템을 운영 중 장애가 나면? 누구의 문제인지가 궁금해지죠? 내가 뭘 잘못 설정했나? 아니면 클라우드 사업자 문제인가? 성능 저하나 시스템 다운 같은 장애가 일어나기 전에 미리미리 알 수 있는 간편한 방법은 없을까? ​세상에 찾으면 없는 게 어디 있겠습니까? 네, 있습니다. 마이크로소프트 애저(Microsoft Azure)를 이용하는 관리자라면 보통 서비스가 정상적으로 돌아가는지를 애저 상태 웹 페이지(Azure Status Page)에서 확인할 것입니다. 이 페이지에 가면 마이크로소프트 애저의 주요 리전의 서비스 상태를 볼 수 있습니..
Azure Stack으로 클라우드 첫 발을 띄기 전에 따져 봐야 할 (4 + 1) 체크 포인트 클라우드 전환, 따져봐야 할 게 참 많은 작업입니다. 조직마다 환경이 다르고, 운영 인력의 역량이 천차만별이죠. 거기에 IT 거버넌스, 규제 등 제약을 두어야 할 사항도 많습니다. 이와 함께 살펴야 할 것은 클라우드로 갔을 때 과연 무엇을 얻을 수 있나? 이 질문은 왜 지금 우리가 클라우드로 가야 하는가에 대한 답이기도 합니다. 이를 명확하게 알아야 명분도 생기고 조직 내 공감도 얻을 수 있습니다. ​운영 효율을 높이기 위해, 비용을 아끼기 위해... 등 클라우드 전환의 이유가 분명하고 마음이 곧바로 섰다면 다음에 할 일은 실행 계획을 세우는 것입니다. 천릿길도 한걸음부터라고 했습니다. 너무 욕심을 부려 옛것을 다 버리고 클라우드 네이티브로 간다? 이런 시나리오를 상상하는 곳은 아마 없을 것입니다. 대부..
재해복구(DR) 비용 계산기 ~ 일단 비용부터 뽑아 보자 클라우드 환경은 온프레미스보다 안정성이 높습니다. 하지만 어떤 일이건 100% 장담은 못 하죠. 만에 하나 있을 지도 모르는 장애 발생 시 시스템과 서비스는 중단되고, 이는 곧 비즈니스 피해로 이어집니다. 이런 일을 방지하기 위해 기업이 할 수 있는 '최선'은 재해복구(DR) 체계를 기반으로 복원성을 확보하는 것입니다. Azure 환경에서 운영하는 시스템 관련 DR 설정은 매우 간편합니다. 그렇다면 비용은 얼마나 들까요? 사실 이게 중요하죠. 관련해 Azure 환경에서 DR 구성을 했을 때 드는 비용 계산기를 소개합니다. Azure 환경에 올려 운영하는 가상 머신의 경우 Azure Site Recovery(ASR)을 이용해 물리적으로 떨어진 리전에 해당 가상 머신을 지속해 복제하는 방식으로 DR을 구성할..
Azure가 제공하는 든든한 재해복구 옵션 최근 IT와 통신 업계를 깜짝 놀라게 한 대형 장애가 일어났죠. 관련해 부랴부랴 재해복구 전략과 계획을 되짚어 보는 곳이 요즘 많습니다. 장애나 재해는 남의 일로 봐서는 안되죠. 관련해 Azure를 쓰는 조직을 위해 애저 가상 머신을 물리적으로 떨어진 다른 리전에 복제하는 간단한 재해복구 방식을 소개합니다. Azure 가용성 영역(Azure Availability Zone)을 들어봤을 것입니다. 애저 리전 내에는 물리적으로 네트워크, 공조, 전력 등이 독립적으로 운영되는 가용성 영역이 있습니다. 데이터센터 장애에서 중요 애플리케이션과 서비스를 보호하기 위해 하나 이상의 데이터센터로 가용성 영역이 구성되어 있습니다. 이를 잘 활용하면 여러 리전에 걸쳐 중요 가상 머신에 대한 재해복구 및 서비스 연속성 보장..
매니지드 디스크, 이 편한 것으로 마이그레이션 하는 방법, Azure Portal에서 마우스 클릭 몇 번이면 됨! 애저 매니지드 디스크(Azure Managed Disk), 들어 보셨나요? 이 서비스는 애저에서 생성한 가상 머신(VM)에 연결된 디스크에 대한 스토리지 계정을 관리해주는 서비스입니다. 애저 VM을 생성하려면 VHD 파일을 담아 둘 스토리지 계정을 생성해야 합니다. VM이 몇 개 안된다면 불편할 것 없지만, VM 수가 많거나, VM 관련 성능이 모자라면? 참고로 언매니지드 디스크의 경우 계정당 2만 IOPS 제약이 있습니다. 이런 불편을 없애려고 나온 것이 매니지드 디스크입니다. 매니지드 디스크를 이용하면 하나의 스토리지 구독 계정으로 5만 개의 VM을 생성할 수 있습니다. VM 만들 때마다, 성능 제한이 걸릴 때마다 계정을 만드는 불편이 없습니다. 관리자 눈에 비치는 가장 큰 효과는 애저에서 사용하는 ..
VM 비용 80% 낮추기 ~ 어렵지 않아요! 가상 머신(VM) 비용, 클라우드를 좀 크게(?) 쓰면 월 비용이 만만치 않죠. 마른 걸레도 짜서 쓰는 정신으로 VM 비용을 낮추는 요령 하나 공유합니다. 애저 어드바이저(Azure Advisor)라고 들어 보셨나요? 무료 서비스인데요, 무료라고 무시할 수 없는 막강한 기능을 제공합니다. 서비스 이름에 나와 있듯이 클라우드 쓰는 것과 관련해 이것저것 조언이 필요할 때! 이메일이나 전화 문의하기는 좀 뭐 한 문제를 풀어야 할 때! 부담 없이 쓰기 좋은 도우미 서비스입니다. 애저 어드바이저는 애저 리소스를 최적화하여 비용을 줄이고, 성능을 높이고, 보안을 강화하고, 안정성을 높이는 데 필요한 조언을 해주는 서비스입니다. 주제로 돌아와 VM 비용을 80% 줄이고 싶을 때 애저 어드바이저가 어떤 도움을 줄 수 ..
클라우드 운영 ~ 역할과 책임(R&R) 어떻게 구분할 것인가? 내 역할에 맞는 Azure 서비스 고르기 IT 운영 업무는 역할과 책임이 나름 명확합니다. 크게는 인프라와 애플리케이션/서비스로 구분할 수 있습니다. 더 세분해 들어가면 서버, 스토리지, 네트워크, 보안, 개발 등으로 나눌 수 있죠. 그렇다면 클라우드는? 조금 애매합니다. 기존에 하던 데로 각자 할 일을 나누려고 보면 뭔가 좀 묘하죠. 걸쳐 있는 영역들이 많아서 그렇습니다. 각자 역할, 주어진 일에 맞추어 클라우드 서비스를 골라야 하죠. 이럴 때 도움이 되는 기준 세 가지 질문을 알려 드립니다. 여럿이 모여 이 세 가지 질문을 던져 보면 각자 할 일이 무엇인지, 그리고 내가 필요한 클라우드 서비스는 무엇인지 알 수 있습니다. 첫 번째 질문: 어디까지 내가 통제할 것인가? 통제권을 기준으로 하면 크게 IaaS, PaaS, LaaS로 구분할 수 있..
클라우드 운영 팁 인공 지능이 내가 찾는 클라우드 문서를 알아서 추천 ~ 왠지 낯설지 않은 서비스 이름 '알라딘(Aladdin)' 클라우드를 쓰다 보면 원하는 구성이나 설정을 하기 위해 문서를 많이 찾아보게 되죠. 온프레미스처럼 누군가(?)를 붙잡고, 알아서 해달라고 하는 게 아니라 사용자 스스로 서비스 사업자가 제공하는 문서 사이트나, 커뮤니티에서 궁금한 질문에 대한 답을 찾아가며 노하우를 터득합니다. 클라우드 몇 년 쓰다 보면 검색 도사가 되는 이유도 그런 것인데요. 마이크로소프트가 이런 사용자들의 정보를 찾는 패턴을 인공 지능으로 공부한 다음에 마이크로소프트 애저 문서 사이트에 사용자가 들어와 특정 링크를 클릭하면, 알아서 다음 관심사를 제안하는 기능을 공개했습니다. 이를 위한 기술 역시 애저의 것을 쓰는데요 그 이름하여 '코그니티브 서비스(Cognitive Service)'입니다. 코그니티브에서 지능형 추천 및 의미 체계 검..