모듈식 아키텍처로 정형과 비정형 데이터 연계 처리

무공유 MPP 기반 관계형 DB 오픈소스 아파치 하둡 결합

EMC(회장 겸 CEO 조 투치)는 단일 인프라스트럭처 내에서 정형비정형 데이터 및 애플리케이션이 통합된 빅데이터 분석 플랫폼, ‘EMC 그린플럼 모듈식 데이터 컴퓨팅 어플라이언스’를 출시했다고 22일 밝혔다.

가장 큰 특징은 모듈식 아키텍처로, 업계 최초로 기업들이 무공유(Shared-nothing) MPP 기반 관계형 데이터베이스와 엔터프라이즈급의 아파치 하둡(Apache Hadoop)을 결합시킬 수 있도록 했다.

이를 통해 정형 데이터와 비정형 데이터의 상호 연계 처리 (co-processing)가 가능해졌으며 정형비정형 데이터를 단일의 통합 플랫폼에서 필요에 따라 확장할 수 있게 됐다.

DCA 모듈은 기업의 기존 스케일링 방식을 완전히 바꿔놓았다. 처음에는 작은 규모로 시작해, 보다 유연하고 비용 효율적인 방법으로 쿼터랙(quarter-rack) 단위로 증가시킴으로써 처리 성능 및 스토리지 요구량에 따라 어플라이언스를 늘리는 것이 가능해 진 것.

또한 그린플럼 데이터베이스와 그린플럼 HD(하둡) 모듈을 필요에 따라 상호 연계 처리 해 사용할 수 있으며, 그린플럼 데이터 통합 가속기(Greenplum Data Integration Accelerator, 이하 DIA) 모듈을 통해 모든 BI(Business Intelligence) 애플리케이션과 ELT(Extracting, Loading, Transforming) 툴을 같은 DCA 내에 있는 클러스터로 바로 이동시킬 수 있다.

그린플럼 데이터 컴퓨팅 어플라이언스의 네 가지 모듈은 아래와 같다.

• 그린플럼 데이터베이스 모듈(Greenplum Database Module): 목적별(purpose-built) DW 어플라이언스 모듈로 확장성이 매우 뛰어나다. 데이터베이스, 컴퓨팅, 스토리지 및 네트워크를 쉽게 실행할 수 있는 엔터프라이즈 시스템으로 통합할 수 있다. 업계 최고의 성능과 비용 효율성을 자랑한다.

• 그린플럼 데이터베이스 고용량 모듈(Greenplum Database High Capacity Module): 전원과 설치공간을 추가로 늘릴 필요 없이 수 페타바이트의 데이터를 관리할 수 있도록 설계됐다. 매우 방대한 양의 데이터를 정교하게 분석해야 하는 기업이나 장기적인 아카이빙이 필요한 기업들을 위해 단위당 가장 저렴한 비용의 DW를 제공한다.

• 그린플럼 HD 모듈(Greenplum HD Module): 세계 최초의 고성능 데이터 상호 연계 처리 하둡 어플라이언스 모듈이다. 하둡과 그린플럼 데이터베이스를 결합시켜 정형 데이터와 비정형 데이터 모두를 단일 솔루션 내에서 상호 연계 처리 할 수 있다.

• 그린플럼 데이터 통합 가속기 모듈(Greenplum Data Integration Accelerator Module): 배치 로드를 줄이거나 마이크로 배치 로딩을 실행할 경우 업계 최고의 데이터 로딩 성능을 제공한다.

기업들은 단일의 기본 랙에서 시작할 수 있다. 기본 랙에는 2개의 마스터 서버 -인증, 쿼리 최적화, 각기 다른 세그먼트 서버간 업무량 분산, 데이터의 내장애성(fault tolerant) 메커니즘 관리를 담당- 뿐만 아니라 단일 표준 혹은 고용량 그린플럼 데이터베이스 쿼터-랙 모듈, 다른 3가지 모듈을 위한 공간이 포함돼 있다. 기업들은 그린플럼 데이터베이스, 그린플럼 HD 혹은 그린플럼 DIA 모듈을 사용해 쿼터랙(4분의1랙)을 증가시켜 어플라이언스를 확장시킬 수 있다.

이번에 새롭게 출시된 그린플럼 DCA는 기존보다 가용성이 훨씬 높아졌으며 업계 1위의 EMC 데이터 보호 및 재해 복구 솔루션, 그리고 EMC 데이터도메인 중복제거 및 백업 기술과 간단히 통합될 수 있다.

한국EMC 데이터 컴퓨팅 사업부 김희배 이사는 “EMC 그린플럼은 업계에서 유일하게 단일 어플라이언스 내에서 관계형 데이터베이스 모듈과 하둡 모듈 간, 정형비정형 데이터를 상호 연계 처리 하고 빠르게 공유할 수 있는 기능을 제공하고 있다”라며 “DCA의 새로운 모듈 방식인 데이터 상호 연계 처리는 각 시스템들이 최고의 성능을 낼 수 있도록 하기 때문에 매우 중요하고 강력한 기술이다. 이로써 기업들은 자사가 다루는 모든 종류의 데이터로부터 빅데이터 분석의 이점을 얻어낼 수 있을 것”이라고 밝혔다.

<데일리그리드>

저작권자 © 데일리그리드 무단전재 및 재배포 금지