현재 국내 데이터 품질 관리 솔루션 시장에선 지티원, 데이터스트림즈 등 국내 업체와 한국인포매티카 등 글로벌 업체가 함께 경쟁하고 있다.

솔루션을 고객에게 공급하면서, 국내 업체와 글로벌 업체 간 가장 큰 시각 차는 데이터 정제 자동화이다.

지티원, 데이터스트림즈 등 국내 업체는 데이터 정제를 위한 기반은 제공하되 정제 작업의 완결은 사람이 직접 해야 수행한다고 주장한다.

지티원 백운기 이사는 “간단한 정제는 툴을 이용해 자동으로 할 수 있지만 사람이 판단해서 정제해야 할 데이터도 많다”며 “수작업이 필요한 대상을 솔루션이 천편일률적으로 정제시킨다면 오히려 데이터 품질 수준이 저하될 수 있다”고 설명했다.

데이터스트림즈 정태호 이사 역시 “외국은 데이터 표준화가 워낙 잘되어 있어 정제 시 자동화가 필요하지만 국내 사정은 그렇지 않다”며 “아직 데이터 표준화도 잘 되어 있지 않은 국내 기업, 데이터 정제를 자동화하는 것은 시기상조”라고 일축했다.

반면 인포매티카 등 글로벌 업체는 데이터 정제를 자동화해야 한다고 강조한다. 한국인포매티카 최승철 대표는 “사람의 개입을 최소화해야 오류를 완벽히 수정할 수 있으며, 프로파일링-매칭-정제를 자동으로 수행해야 상시적인 품질관리가 가능하다”고 설명했다.

데이터 품질 관리를 일회성이 아닌, 장기 프로젝트로 가져가기 위해선 데이터 정제를 자동화해 관리자의 수작업을 줄이고, 관리 시간을 단축해야 한다는 주장이다.

데이터 품질관리, 상시 업무로 정착

한편 기업에서 데이터 품질 관리를 상시 업무로 정착시키려는 산업계의 시도를 주목해야 한다. 관련 업계에 따르면, 최근 기업은행, 대한지적공사 등 금융 및 공공 기관을 중심으로 데이터 품질을 상시 관리하는 체계를 구축하려는 기업이 늘고 있다.

한국인포매티카 최승철 대표는 “데이터는 시스템을 운영하는 과정에서 계속해서 생성된다”며 “데이터 품질은 한번 관리했다고 해서 끝나는 것이 아니며, 데이터 품질 관리를 위해 만들었던 품질 지표를 히스토리화한 후 상시적으로 품질을 진단하는 노력이 필요하다”고 강조했다.

지티원 백운기 이사는 “데이터 품질 관리는 정원을 관리하는 것과 같다”며 “정원을 며칠만 방치해도 지저분해질 수 있어 항상 관심을 갖고 관리해야 하는 것과 같이 데이터 역시 상시 관리가 꼭 필요하다”라고 조언했다.

<데일리그리드>

저작권자 © 데일리그리드 무단전재 및 재배포 금지