구글 알파고의 학습 방법중에 기계학습(Machine learning)이 있다. 바둑천재 이세돌을 넘어서면서 이 방법에 대한 관심이 커지고 있다. 기계 학습은 개발자가 프로그램을 하지 않고도시간이 지나면서 경험을 통해 얻는 통찰력을 이용해 발전하는 컴퓨터 및 소프트웨어를 뜻한다.

용어를 알건 모르건 기계학습을 우린 이미 체험하고 있다. 예를 들면 구글은 기계 학습을 이용해 지메일(Gmail) 사용자들의 받은 편지함에서 스팸을 99.% 걸러 낸다. SK텔레콤의 티맵은 교통량 데이터, 도로 구조, 날씨 조건, 요청하는 시간대 등를 감안해 집으로 가는 가장 빠른 길을 알려준다.

이처럼 기계학습은 우리의 생활은 물론 산업계 전문야로 확산되어 가고 있어 주목된다. 기계학습은 혼자서도 배우며 엄청난 양의 데이터를 분석하거나 예측하는 알고리즘이 고도화되면서 급격히 발전하고 있는 추세다.

기계 학습은 특히 변수분석(variable analysis)에서 인간 보다 우월한 가능을 발휘한다고 알려져 있다. 의사 결정을 할 때 인간은 불과 몇가지 변수에 집중해서 결론을 내리는 습성이 있다. 오히려 많은 변수를 고려했을 경우 결과가 좋지 않을 수도 있다.

이에 반해 기계학습 기능을 가진 소프트웨어는 의사를 결정할 때 인간보다 훨씬 많은 변수를 고려할 수 있어, 이론적으로 상대적으로 좋은 의사결정을 내릴 수 있는 설명이다. 특히 정보 과다로 인한 분석이 불가능하지도 않다. 플러그만 뽑아주면 쉬지 않고 분석할 수 있다.

이 때문에 기계학습은 이제 총체적 컴퓨팅 경험에 필수 요소로 자리잡는 중이다. 구글 외에도 다양한 벤더에서 이 학습 방법을 적용한 컴퓨팅 기법을 선보이고 있어 주목된다.

미국 HPE는 지난 10일 기계학습이 가능한 새로운 클라우드 서비스 「HPE Haven OnDemand」를 공개했다. 이 서비스는 마이크로소프트의 Azure 플랫폼에서 동작한다. 2014년 말에 베타가 제공되었으며, 현재 12,750여명의 개발자가 베타테스트에 등록한 것으로 알려졌다.

「HPE Haven OnDemand」는 60개의 API와 데이터, 오디오, 이미지, 소셜, 웹, 비디오에 대한 심층 분석이 가능한 서비스를 제공하며, 50여개 언어의 사용이 가능한 음성인식 기능도 제공한다.  

요금체계는 기본 서비스는 무료로 제공하고 추가 기능을 사용할 때만 요금을 받는 freemium 방식을 채택했다.  서비스를 이용하는 리소스 유닛이 1건, API 콜이 1만번 까지는 무료로 이용할 수 있다. 다만 기업용인 경우(Entrepreneur), 리소스 유닛이 35건에 API 콜이 12만번이 넘게 되면 월 315달러를 지불해야 한다.

또한 마이크로소프트도 최근 애저 가상러닝 서비스를 선보였다. 마이크로소프트의 애저 머신 러닝 서비스는 클라우드 기반의 기계 학습을  빠르게 시작할 수 있게 개발된 일종의 원스톱 샵이다.

사용순서는 이렇다. 먼저 애저 가상 머신에 가입하고 스토리지 옵션을 구성한다. 이런 파티셔닝을 통해 가상 네트워크를 제공해 모든 것을 연결하는 애저 포탈에서 이 서비스의 이용을 시작할 수 있다. 먼저 여기에서 ML 스튜디오(Machine Learning Studio) 작업공간과 전용 스토리지 계정을 만든다.

또한 이 포탈에서 애저 기계 학습 서비스의 소비를 모니터링하여 비용을 추적하고 모델을 공개할 준비가 완료되었을 때 알림을 수신하게 된다. 특히 ML API 서비스를 통해 모델을 기존의 애플리케이션과 매우 손쉽게 통합할 수 있다.

데이터 관리자들은 많은 시간을 ML 스튜디오에서 보내게 된다. 데이터 접근 및 준비, 모델 생성/시험/교육, 기업의 기존 비전매 특허 모델을 사설 작업공간으로 안전하게 가져오기 등 ML 스튜디오 내에서 데이터 과학 작업흐름을 단계별로 진행 가능하다.

삼성벤처가 투자하고 있는 국내 기업인 아임클라우드는 데이터 통계·분석 및 시각화 전문업체로 최근 가상러닝을 사업화하는데 관심 갖고있다. 이 회사는 빅데이터 기술에서 오픈 소스를 활용한 다양한 분석 결과를 시각화해 표현하는 오픈라이트를 개발한다.

빅데이터 뿐만 아니라 사물인터넷 관련 머신 데이터·로그 데이터·생산설비 센서 데이터의 대용량 처리 프로젝트 경험을 다수 보유하고 있는 기술집약적 회사다. 아임클라우드는 분산 알고리즘 활용과 기계학습을 통해 다양한 산업분야에서 발생하는 데이터를 수집·처리해 통계분석 및 예측모델링을 할 수 있도록 지원한다는 것이 특징이다.

기계로부터 수집되는 수많은 데이터를 인메모리 기술을 통해 실시간 처리가 가능하게 만들고, 오픈 소스 기반의 빅데이터 플랫폼 구축으로 데이터를 분석해 기업이 활용할 수 있는 정보를 시각화된 툴로 제공한다. 또 이 모든 기술을 자체 데이터센터·프라이빗 클라우드·퍼블릭 클라우드에서 모두 운영 가능해 클라우드 환경으로 이전하는 기업의 요구 사항을 충족할 수 있다는 설명이다.

조남욱 기자
저작권자 © 데일리그리드 무단전재 및 재배포 금지