우리는 새로운 데이터 소스와 데이터 유형이 폭발적으로 증가하는 세상에 살고 있습니다. 최근 IDC 보고서에 따르면, 2013년에 생산된 전세계 총 데이터 양은 4.4조 기가바이트이며 2020년에는 44조 기가바이트로 10배 증가할 것이라고 합니다.

이러한 폭증하는 데이터로부터 통찰력을 끌어내려면 정보 인프라를 완전히 다시 설계해야 합니다. 지능형 데이터 플랫폼은 정제되고, 안전하며, 신뢰할 수 있는 데이터를 무한 제공하기 위해 필요합니다. 반면 변화 요구에 대한 일반적인 수명 주기(개발, 테스트, 구축)는 오류가 발생하기 쉽고 속도가 느리며 비용이 많이 듭니다.

이 방정식은 두 가지 요소로 구성됩니다. 하나는 데이터 자체이고 다른 하나는 플랫폼입니다. 먼저 데이터부터 시작하겠습니다.

진정한 지능형 데이터란 어떤 것일까요? 진정한 지능형 데이터라면 다음과 같은 특징을 보일 것입니다.

신뢰성. 데이터가 정제되고, 안전하고, 연결되어 있습니다. 다시 말해서 즉시 사용할 수 있습니다.
컨텍스트. 데이터에 즉시 액세스 가능한 메타데이터와 컨텍스트가 풍부합니다.
유용성. 데이터가 데이터 자체에 대해 설명할 뿐 아니라 관련된 추가 정보를 찾을 수 있도록 도와줄 것입니다. 또는 데이터를 더욱 풍부하게 만들어 주는 작업을 추천할 것입니다. Amazon.com의 상황별 쇼핑 경험을 떠올려 보십시오. 그리고 여러분의 데이터가 Amazon.com의 추천 엔진만큼 유용하다면 어떻게 될지 상상해 보십시오.

지능형 데이터의 이러한 특성은 미래의 비전 중 일부에 불과하다는 것을 알아야 합니다. 진정한 지능형 데이터가 탄생하려면 새로운 범용 표준이 필요합니다. 이 표준은 “신뢰할 수 있고 안전하며 유용한” 메타데이터가 사용자 사이에 배치된 데이터 컨테이너에 전달될 수 있도록 보장하는 역할을 할 것입니다. 다시 말해서, 데이터가 어떤 에코시스템에 상주하든 관계없이 새로운 에코시스템으로 데이터를 가져 가더라도 데이터는 데이터 컨테이너에 상주할 것입니다. 어디에 상주하든 데이터는 “지능적”입니다.

이번에는 플랫폼을 살펴보겠습니다. 이미 어떤 형태의 지능형 “데이터 플랫폼”이 존재합니다. 여기서 데이터는 반드시 지능적일 필요는 없지만 데이터를 처리하는 프로세스는 반드시 지능적이어야 합니다.

지능형 데이터 플랫폼을 구분하려면 데이터 마스킹을 살펴보아야 합니다. 관리자가 마스킹할 필드를 결정하고 해당 필드에 동적 마스킹을 설정해야 한다면 지능형 플랫폼이 아닙니다. 신용 카드 번호처럼 보이는 필드를 강조하고 해당 필드를 마스킹하라고 제안한다면 그 플랫폼은 지능형 플랫폼입니다.

다시 말해서 지능형 데이터 플랫폼은 일상적인 작업과 복잡한 작업을 모두 자동화하여 개발자의 시간을 절약해 줍니다. 따라서 개발자는 프로젝트의 전체적인 상황에 집중할 수 있습니다.

지능형 데이터 플랫폼을 사용하면 다른 방법을 사용할 때보다 더 짧은 시간에, 더 많은 시스템에서, 더 많은 데이터를 준비하고 관리하고 프로비저닝할 수 있습니다. 자유롭게 하지만 안전하게 공유하며 통합하고 정제할 수 있으며 실시간으로 연결되고 수정되는 데이터를 얻게 됩니다. 그러면 보다 신속한 개발 및 효율적인 비즈니스 인텔리전스가 가능해집니다.

미래에는 정보가 스스로를 이해하고 능동적으로 개발자를 돕는 것도 가능할 것입니다. 이러한 미래를 대비하여 인프라를 준비하시기 바랍니다.
 

저작권자 © 데일리그리드 무단전재 및 재배포 금지