EMC가 데이터 과학 커뮤니티의 행동 양상과 사고를 비롯해 그들이 필요로 하는 것이 무언인지 알아보기 위해 실시한 과학 커뮤니티에 대한 연구 결과를 발표했다.

EMC가 미국·영국·프랑스·독일·인도·중국에서 실시한 데이터 과학 연구에 따르면 기업은 빅데이터와 데이터 분석이 결합할 때 발생하는 기회를 활용하는데 반드시 필요한 선행기술이 전반적으로 부족하다고 밝혀졌다. 또 비즈니스 의사 결정, 경쟁우위 확보, 생산성 증대 촉진, 혁신의 추진 및 고객 통찰력 파악을 위해 데이터를 효과적으로 사용하는 기업은 전체의 1/3에 지나지 않은 것으로 나타났다.  

이번 연구에 따르면 모바일 센서, 소셜 미디어, CCTV, 의학 영상 자료, 스마트 그리드 등에 의해 만들어진 디지털 데이터의 폭증은 이러한 데이터를 분석할 수 있는 새로운 툴과 결합해 데이터에서 가치와 통찰을 끌어 낼 수 있는 기회를 폭발적으로 성장시켰다. 이에 따라 데이터 과학자에 대한 기업의 수요가 인재 공급을 빠른 속도로 추월하고 있는 것으로 나타났다. 

이번 연구에는 IT 의사 결정권을 가진 전세계 데이터 과학 커뮤니티 회원 약 500명이 참여했다. 응답자에는 데이터 과학자를 비롯, 데이터 분석가, 데이터 전문가, 비즈니스 인텔리전스(BI) 분석가, 정보 분석가 및 데이터 엔지니어 등 관련 분야 전문가가 포함돼 있다.

이들은 자신이 속한 기업이 새로운 데이터에 기반해 비즈니스 의사결정을 내릴 수 있는 능력을 갖추고 있냐는 질문에 오직 1/3만이 ‘매우 그렇다’고 응답했다.

직원이 데이터를 가지고 실험할 수 있도록 데이터 접근 권한을 가지고 있는가라는 질문엔 BI 전문가의 12%, 데이터 과학자의 22%r가 ‘매우 그렇다’고 응답했다. 이는 아이디어를 빠르게 테스트하고 입증함으로써 혁신을 시도하는 데 있어, 기업의 역량이 부족하다는 점을 드러내는 결과라고 EMC 측은 밝혔다.

또한 데이터 과학 채택에 있어 가장 많이 언급된 방해 요인으론 기술 또는 훈련의 부족(32%), ‘예산과 자원의 부족(32%), 잘못된 조직 구조(14%), 기술과 툴의 부족(10%) 등이 꼽혔다.

데이터 과학자 중 65%는 향후 5년 동안 데이터 과학 인재에 대한 수요가 공급을 뛰어넘을 것으로 예상했고, 전체 응답자 중 83%는 새로운 툴 및 신기술로 인해 데이터 과학자에 대한 필요성이 증대될 것이라고 답했다. 또한 모든 응답자는 자사에 데이터 과학자의 필요성이 증가하고 있다고 했으나, 현직 BI 전문가가 그 수요를 충족할 수 있다고 응답한 이는 전체의 12%에 불과했다.

또한 이번 연구에선 데이터 과학자가 BI 전문가보다 훨씬 더 높은 수준의 비즈니스 및 테크니컬 기술을 필요로 한다는 점이 드러났다. 데이터 과학자는 BI 전문가에 비해 고급 알고리즘을 적용하는 비율이 두 배 더 높았고, 해당 데이터에 기초해 비즈니스 의사결정을 내릴 수 있는 비율은 37% 더 높은 것으로 나타났다.

또 데이터 과학자들은 BI 전문가에 비해 새로운 데이터를 확보하는 것에서부터 확보한 데이터에 기반해 비즈니스 의사결정을 내리는 것에 이르는 데이터 라이프사이클 에 대한 관여도가 높은 것으로 나타났다.

이밖에도 데이터 과학자들은 BI 전문가보다 파이썬(Python), 펄(Perl), 오크(AWK)와 같은 스크립팅 언어를 더 많이 사용하는 것으로 나타났다. 하지만 데이터 과학자와 BI 전문가rk 가장 많이 사용하는 툴은 엑셀(Excel)인 것으로 나타났으며, SQL이 근소한 차이로 그 뒤를 이었다.

아울러 이번 연구에선 자신이 일하고 있는 기업에 대한 응답자의 태도가 매우 우호적이라는 점을 알 수 있었다. 데이터 과학자들은 타사에 비해 자사의 IT 부서가 잘 조직돼 있고, 인재 채용에 능하며, 클라우드 컴퓨팅과 같은 핵심 기술 영역에서 앞서 있다고 응답했다.

한국EMC 김경진 대표는 “빅데이터의 시대의 도래에 따라 비즈니스와 우리가 일하고 살아가는 방법 역시 전례 없는 변화의 시기를 맞고 있다”며 “대용량 스케일아웃 스토리지, 차세대 분석 및 시각화 역량의 결합을 통해 빅데이터 시대에 가치를 이끌어 내기 위한 기술은 이미 마련됐다”고 말했다.

또한 김 대표는 “이제 필요한 것은 역동적이면서 상호 연결된, 고도로 숙련되어 있으면서 권한이 부여된 데이터 과학 커뮤니티가 빅데이터와 관련된 트렌드 및 패턴을 밝히고 거기에 감춰진 새로운 통찰력을 이끌어내는 것”이라고 강조했다.

<데일리그리드>

저작권자 © 데일리그리드 무단전재 및 재배포 금지