양질의 문서에 대한 수집 강화, 수집된 문서의 본문 내용 추출 및 분석의 정교화 계획

네이버(대표 김상헌)는 검색결과에서 원본문서를 우선 노출하기 위해 문서수집, 유사문서 판독 등에 대한 기술적 개선 과제를 더욱 심화시키는 한편, 원본문서 반영과 관련한 제반 요청사항을 전담 처리할 ‘원본반영 신청센터’를 신설한다고 29일 밝혔다.

설명에 따르면 네이버는 기술적 개선 과제의 일환으로 검색로봇의 문서수집 체계 전반을 개선하고, 원본문서와 유사문서(펌글) 간의 판독을 정교화한다. 이를 위해 네이버는 다수의 이용자가 검색했거나 원본문서의 가능성이 높은 문서의 수집량을 늘리는 방향으로 문서수집 시스템 전반을 개선한다. 또한 검색로봇이 수집한 문서에 대해서는 본문 내용을 정확하게 추출 및 분석하는 연구과제도 병행할 예정이다.

모든 검색 기업들이 깊게 고심하고 있는 원본문서를 판독해내기 위한 기술적 개선도 강화한다. 네이버는 유사문서(펌글)가 검색결과에 노출되는 것을 제어하고자 지난 수년 간 지속적으로 추진해 온 ‘유사문서판독 시스템’에 이어, 원본문서의 판독 가능성을 더욱 높일 수 있는 ‘SONAR’라는 새로운 알고리듬 로직을 추가할 계획이다.

‘SONAR(Source Navigation And Retrieval)’는 문서 간의 인용관계 및 문서의 중요도 등을 분석해 이용자가 찾고자 하는 정보의 원본문서를 추출할 수 있는 새로운 검색 알고리듬이다. ‘SONAR’ 로직이 적용되면 앞으로는 통합검색 최상단에 원본문서를 단독 노출하는 형태로 서비스를 제공할 예정이다.

또한 네이버는 원본문서 반영과 관련한 제반 요청사항을 전담 처리할 ‘원본반영 신청센터’를 신설해, 관련 문의 접수 절차도 간소화한다. ‘원본반영 신청센터’에서는 ▲ 검색결과에서 원본문서의 검색 반영 요청 ▲ 유사문서로 분류 시 원본문서 반영 요청 ▲ 검색결과 내 원본문서 노출순서 관련 문의 등을 전담 처리하게 된다. 단, 원본문서 반영과 무관한 경우 기존대로 고객센터로 이관돼 처리된다.

네이버 이윤식 검색본부장은 “원본문서의 신속한 반영을 추가적으로 지원할 수 있는 전담 고객센터를 신설하는 등 검색결과에서 원본문서의 우선 노출을 위한 기술적, 관리적 개선 노력에 지속적으로 힘쓰겠다”고 밝혔다.
 

최한기 기자
저작권자 © 데일리그리드 무단전재 및 재배포 금지