본문 바로가기

Database

HDInsight 클러스터 환경에서 운영하는 아파치 피닉스 ~ 이제 제플린 노트북으로 사용할 수 있다!

아파치 피닉스(Apache Phoenix)는 HBase 기반의 대규모 병렬 관계형 데이터베이스로 OLPT나 분석 워크로드 처리에 쓰입니다. 아파치 피닉스 운영 환경으로 궁합이 참 잘 맞는 것이 애저의 HD인사이트(HDInsight)입니다. 그 이유는 4개 정도로 압축할 수 있습니다. 


1) 아파치 피닉스 클러스터 생성의 간함
애저 환경에서 아파치 HBase나 피닉스 기반 워크로드 운영을 위한 클러스터를 생성하는 데 필요한 시간은? 몇 분이면 충분합니다. 애저 포탈을 통해 간편하게 만들 수 있습니다. 클러스터를 자주 만들어야 한다면 JSON 템플릿, 파워쉘, REST API, 애저 클라이언트 SDK를 통해 클러스터 생성 과정을 자동화할 수도 있습니다. 

2) 필요한 때만 쓰는 경제성 높은 클러스터 
HD인사이트에서 아파치 피닉스를 쓴다는 것은 곧 필요할 때만 클러스터를 운영할 수 있다는 것을 뜻합니다. 읽기/쓰기 작업을 더 이상 하지 않을 경우 클러스터를 삭제하면 됩니다. 데이터를 저장하는 데에만 비용이 듭니다. 클러스터는 필요한 때만 생성해 사용하면 됩니다. 

3) 관리 부담 제로 
직접 구축해 운영하는 클러스터 환경은 손이 많이 갑니다. 반대로 HD인사이트는 손 갈 일이 없습니다.  설정, 패치, 업그레이드, 유지보수는 마이크로소프트가 알아서 합니다. 99.9%의 SLA를 보장하므로 직접 운영하는 것보다 안정성이 더 뛰어납니다. 물론 클러스터 운영을 맡긴다고 해서 원하는 튜닝을 못하는 것은 아닙니다. 추가 설치를 원하는 컴포넌트가 있다면 옵션을 통해 더할 수 있습니다. 

4) 안전성, 신뢰성, 보안성 강화 
HD인사이트 환경에서 피닉스를 사용하면 엔터프라이즈 수준의 안정성과 보안성 확보가 가능합니다. 피닉스 클러스터는 사설 가상 네트워크를 통해 운영됩니다. 또한, 애저 인프라가 제공하는 고가용성과 재해복구 기능을 통해 서비스 중단 걱정도 없습니다. 각종 규제 준수 역시 애저가 인프라 수준에서 철저하게 따르기 때문에 한결 부담이 덜 합니다. 

다시 본론으로 돌아와서 최근 HD인사이트 팀에서 반가운 소식을 하나 발표했습니다. HD인사이트 환경에서 운영하는 아파치 피닉스가 제플린 노트북을 지원한다는 것입니다. 

아파치 제플린 노트북을 사용하는 HD인사이트 사용자는 이제 피닉스 테이블에 쿼리를 날릴 수 있습니다. HD인사이트 환경에 이미 제플린 노트북이 통합되어 있어 따로 뭔가 하지 않고 바로 사용하면 됩니다. 다음 그림과 같이 제플린 노트북을 열고 피닉스 SQL 쿼리를 작성하면 됩니다. 참고로 JDBC 인터프리터를 지원하는 제플린을 써야 합니다.