행안부, 의미기반 연관 검색으로 ‘맞춤식 민원서비스’ 구현

사용자 필요한 연관정보, UI 환경에 맞게 구성 차세대 검색엔진으로 호응

 

행안부는 최근 ‘국가대표포탈 2단계 구축사업’(www.korea.go.kr)을 진행하면서, 검색엔진 분야에 1차 때 진행했던 단어검색 수준에서 벗어나 국민들이 필요로 하는 정보를 고객 맞춤형과 포트폴리오 방식으로 제공하는 ‘의미기반 연관검색서비스’를 구현했다. 문서를 의미 분석 할 수 있는 시맨틱 분석 데이터를 구축하고, 즉답(Direct Answer), 주제검색, 속성의 검색결과를 통한 사용자의 검색 의도가 반영된 분석 결과를 도출해 냈다.

 

방창완 편집장 bcw1@dailygrid.net

인터넷이 ‘정보의 바다’로 인식 된지는 오래됐다. 하지만 수많은 정보의 홍수 속에서 가치 있는 정보를 찾아내기는 수월하지 않다. 정보가 쌓일수록, 사용자들은 ‘원하는 정보’와 ‘가치 있는 정보’를 찾아내기 위해 씨름해야 한다.

최근 인터넷에서 단순한 단어검색 수준에서 벗어나, 시맨틱 환경에서의 ‘의미기반 연관검색 서비스’가 새로운 대안으로 떠오르고 있다. 의미기반 연관검색 서비스는 정보를 단어별로 검색하는 것이 아니라, 사용자 의도에 맞는 정보를 검색엔진이 파악하여 제공하는 방식이다.

즉, 의미 기반의 분석 데이터를 구축하고, 구축된 데이터를 이용해 즉답(Direct Answer), 주제검색, 속성의 검색결과를 통한 사용자의 검색 의도가 반영된 분석 결과를 제공하게 된다.

의미기반 연관 검색은 사용자가 원하는 질의에 대한 의미가 분석된 검색결과를 제공하기 위해 사용자 질의 의미를 분석해 적합한 주제별 문서/문장에 대해 적합도 높은 검색결과를 ‘즉답’ 형식으로 제공해준다.

기존의 키워드 방식의 기계적인 검색결과 대신에 질의와 검색 대상간의 의미적인 소통으로  정확도 높은 검색결과를 제공하는 것이다. 즉, 사용자의 검색의도와 콘텐츠의 의미를 파악함으로써 정보 사용자와 정보 공급자의 격차를 줄여주는 검색이다.

사용자가 원하는 의미가 분석된 검색 결과를 제공하기 위해서는 사용자 질의를 분석하고, 이에 적합한 검색 대상을 문장/문단 단위로 추출할 수 있는 기술이 필요하다. 따라서 기존의 기계적인 키워드 추출방식을 통한 의미 분석 결과보다는 정확도가 높은 수요자 중심의 의미 검색 결과를 제공하게 된다. 이것이 자연어 처리기반의 시맨틱 분석방법이기도 하다.

 

<네이트 시맨틱 검색결과- 이순신 출생지>

 

[Back ground] 고객 맞춤형 의미기반 연관 검색서비스 구현

행안부는 최근 ‘국가대표포탈 2단계 구축사업’(www.korea.go.kr)을 진행하면서, 검색엔진 분야에 1차 때 진행했던 단어검색 수준에서 벗어나 국민들이 필요로 하는 정보를 고객 맞춤형과 포트폴리오 방식으로 제공하는 ‘의미기반 검색서비스’를 구현했다.

행안부가 검색엔진 분야에 의미기반 분석 솔루션을 도입하게 된 배경은 1차 구축사업 이후, 각 산하기관과 청, 위원회 등 산발적으로 운영되고 있는 포탈에 대한 통합 운영이 절실했기 때문이다. 각 기관별로 제공하고 있는 콘텐츠를 조합해 운영은 하고 있지만, 콘텐츠 수집에서부터 분류, 관리 운영하는데 있어서 통합적인 체계가 잡혀있지 않은 점이 프로젝트 진행의 주요 과제였다.

과거의 포탈방식은 각 기관의 콘텐츠를 모아서 통합적으로 게시하는 수준이어서, 콘텐츠에 대한 성격 및 의미파악, 분류와 같은 분석이 어려울 뿐만 아니라 책임주체도 모호하다는 애로사항이 있었다.  산하기관에서 생성되는 콘텐츠를 단순 조합하는 개념이다 보니 기존의 단어검색 수준으로는 국민들이 필요로 하는 정보를 찾아 들어가기에는 많은 어려움이 따랐다.

검색에서 단어를 단순히 나열하는 형태로는 가치 있는 정보를 찾아내기가 매우 어렵다.

프로젝트에 참여한 코난테크놀로지 김원남 선임연구원은 “예를 들어, ‘이순신이 태어난 곳’이라는 키워드로 검색을 하게 되면, 보통 포탈을 통해 이순신과 태어난 곳에 대한 다양한 내용들이 열거된다. 이런 방식은 사용자들에게 혼란만을 야기시켜 준다. 정확한 정보를 찾아 들어가기 위해 더 많은 수고로움을 감수해야 한다”고 말했다.

 

<메인- 검색어 자동완성화면>

 

김원남 선임연구원은 “의미기반 연관검색은 자연어 형태소 분석을 통해 사용자의 검색의도(이순신 출생지)를 지능적으로 파악해 직관적으로 ‘한영 건천동’을 표현함으로써 검색에 따른 시간과 비용을 줄이는 효과를 준다”고 말했다.

‘의미기반 연관검색’은 사용자의 검색 의도와 콘텐츠의 의미, 문맥을 종합적으로 파악해 정확한 정보를 제공해주며, 사용자가 필요로 하는 연관 정보를 사용자 친화적인 UI(User Interface) 환경에 맞게 일목요연하게 구성해준다는 점에서 차세대 검색엔진으로 호응을 얻고 있다.

 

 

<연관검색-노인요양 화면>

 

예를 들어, ‘노인 요양’을 검색하게 되면 노인요양의 자격기준과 신청절차 및 진행과정, 관련 기관 등에 대한 상세정보가 포트폴리오 형태로 직관적으로 표현된다. 이런 방식은 사용자 의도에 따른 맞춤식 구성으로 대민 서비스에 적합할 뿐만 아니라, 정보 활용 측면에서도 가치가 높다.

김원남 선임연구원은 “초보자들이 주민등록등본을 인터넷에서 발급받을 경우도, 발급에 대한 절차(사용자의 의도)가 나와야 하는데 보통 차량과 토지 등 엉뚱한 검색들도 산발적으로 검색되는 경우가 많다”고 지적했다.

행안부가 검색엔진 분야에 코난테크놀로지의 솔루션을 도입하게 된 이유는 1차 프로젝트 이후 고도화(의미기반 검색)를 모색하면서, 외부 자문위원에 의한 객관적 기술평가에서 높은 점수를 받았기 때문이다. 네이트 시맨틱 검색을 통하여 ‘의미기반 검색 서비스’ 를 상용화시킨 경험을 가지고 있는 것도 큰 영향을 미쳤다.

 

[Project feature] “문장 형식 콘텐츠가 똑똑한 ‘즉답’을 보여준다”   

코난테크놀로지는 이번 국가대표포탈 2단계 구축 프로젝트를 위해 우선 현행 콘텐츠 성격 분석 작업에 들어갔다. 자사의 TNA(Topic Network Analyzer) 솔루션을 통해 현황 콘텐츠를 분석하고, 외부 콘텐츠와 비교해서 콘텐츠를 정제하는 작업을 실행했다. 콘텐츠 자동 분류엔진 통해 정치, 역사, 인물 등에 대한 기준에 따른 분류작업을 실행한 후

결과에 대한 색인작업을 진행했다. 

의미기반 연관검색을 위한 직관적인 UI 환경도 구현함에 따라 사용자들이 한눈에 요소정보를 포트폴리오 형태로 파악할 수 있는 화면을 구성했다. 김원남 선임연구원은 “콘텐츠 성격을 파악해 사용자들이 원하는 결과값을 보여주는 화면을 구성하는데 많은 노력을 기울였다”고 말했다.

프로젝트를 진행하는데 있어서 애로점도 있었다. 코난테크놀로지 홍순진 PM은 “의미 기반 연관검색은 그 분석 대상이 되는 콘텐츠의 규모가 클수록 정확한데, 국가대표포탈이 보유한 콘텐츠가 많지 않아 적정 수준의 데이터를 수집하는데 어려움이 있었다. 게다가 단순히 많은 양의 데이터뿐만 아니라 ‘문장 형식으로 이루어진 콘텐츠’ 가 중요하기 때문에 어려움은 배가 되었다”고 말했다. 

홍순진 PM은 “행안부의 공공 서비스는 ‘민원’이 키워드의 핵심이 되기 때문에 이 기준에 맞춰 콘텐츠를 구성하는 작업을 진행했다. 대표적인 키워드를 뽑아내고, 분석하며, 튜닝하는 과정을 진행했다”고 말했다.

 

[Best practice] 원클릭 싱글뷰, 맞춤형 포트폴리오 구성

‘국가대표포탈 2단계 프로젝트’는 공공기관으로는 처음으로 시행하는 ‘의미기반 검색서비스’로 각 해당기관과 민간 기업에 미칠 파장은 클 것으로 예상된다. 

효과적인 측면을 살펴보면 첫 번째로, ‘원클릭 싱글뷰’ 검색이 가능해 검색시간을 대폭적으로 줄일 수 있는 점을 꼽을 수 있다. 예를 들어 국민들이 주민등록등본을 검색하게 되면 주민등록등본 발급을 위한 절차와 해당기관 등이 한번에 일목요연하게 전달됨으로써 사용자 의도에 맞는 맞춤식 서비스가 가능해진다.

클릭수와 검색경로를 줄임에 따라 검색시간을 현저하게 줄이고, 직관적인 서비스를 통해 비용절감 및 업무 효율에 많은 도움을 주고 있다. 또 과거에는 하나의 서류 서비스를 받기 위해 여러 기관들의 사이트를 거쳐야 하는 애로가 있었지만, 자신의 의도에 맞게 필요한 서류를 한군데에서 검색할 수 있는 콘텐츠를 구현하게 됐다.

두 번째로는 타 기관들의 콘텐츠 내용을 일목요연하게 내용별로 구성하는 포트폴리오식 맞춤형 서비스가 가능하다는 점이다. 행안부는 속석상 다른 기관들의 정보가 산재되어 있는데 기관별로 내용이 구분되지만, 수집기와 자동분류기를 통해 내용에 따라서 콘텐츠를 재구성함으로써 보다 편리한 검색이 가능해진 점이다.

예를 들어, 검색속성에 맞게 각 기관들의 콘텐츠를 미디어, 정책에 따라 분류가 가능하다. 이것이 바로 의미기반 검색엔진의 주요 장점이다.

 

 

<연관검색-주민등록화면>

 

세 번째로는 3단계 프로젝트에서 진행될 모바일 환경에서의 의미기반검색 서비스를 위한 전초역할을 한다는 점이다. 모바일 검색시장이 활성화되면 기존에 웹 환경에서의 단어 검색은 제약이 따르게 된다. 스마트폰의 경우, 화면자체의 제약 때문에 산발적인 단어 검색으로는 사용자들이 인지하기 어렵다. 의도하는 검색에 때한 직관적인 표현이 그만큼 모바일 환경에서는 중요해 질 수 밖에 없다.

네 번째로는 검색엔진 성능에서도 높은 속도를 보이고 있다는 점이다. 코난테크놀로지 관계자는 윈백사례에서 보면 기존보다 2배 이상의 개선효과를 보이기 때문에 그만큼 고객들에게 신뢰성을 얻고 있다고 말했다.

다섯 번째는 생활에 밀착된 보다 고도화된 대국민 서비스가 가능해 진 점이다.  우리 생활에 꼭 필요한 소방과 날씨, 유실물에 대한 부분을 연관 서비스와 연계해 통합적으로 제공할 수 있다.

예를 들어 ‘가정주부’ 검색을 통해 가정주부에게 필요한 임신 및 육아정보와 관련된 정보를 하나의 화면에서 구현할 수 있다. 검색하는 수요자 요구에 따른 검색방식은 ‘수요자 맞춤형 포트폴리오’로 구현되며 이것은 결국 ‘개인화’라는 부분과도 밀접한 관련을 맺는다. 

김원남 선임연구원은 “노인들의 경우 요양원 정보와 다양한 복지혜택에 대한 콘텐츠를 구성할 수 있다. 결국, 20대 직장인을 비롯해 30대 주부, 60대 노인 등 나이와 직업군에 따른 콘텐츠 설계와 맞춤형 포트폴리오가 가능해진다”고 말했다.     

 

[Future plan] 생활편의 검색, 모바일로 확대

김원남 선임연구원은 “사실 이번 프로젝트는 공공기관에 시맨틱 기술이 도입된 첫 사례로 가치를 부여하고 싶다. 여타 공공기관에 성공적인 롤 모델이 될 것으로 기대한다”고 말했다.

행안부는 안정적인 ‘국가대표포탈 2단계 구축사업’ 이후 모바일로 검색 서비스를 확대할 계획이다. 또한 유관기관의 콘텐츠를 지속적으로 통합해 나가는 작업과 새로운 단어와 의미에 대한 추가 작업도 병행해 나갈 방침이다. 이렇게 되면 모든 국민들이 직관적으로, 또 개인의 실생활에 적합한 생활정보를 한눈에 파악할 수 있게 된다. 그만큼 국민들의 삶의 질과 편의성이 높아질 것으로 기대하고 있다.

현재 국내 검색시장은 단순한 단어 기반의 검색어 수준을 넘어 자연어 처리에 의한 의미기반의 검색 환경으로 진화하고 있다. 공공시장에서 촉발된 이런 사용자 관점의 ‘생활편의 검색시장’이 앞으로는 다양한 기업과 서비스에 확대 적용될 것으로 기대되고 있다.

<데일리그리드>









저작권자 © 데일리그리드 무단전재 및 재배포 금지