한기 10만건 레포트, 표절검색 사용자관점 관리, 통계 레포트환경 구현

핑거프린팅과 키워드 출현패턴 분석 기반의 표절검색 환경구현 국내대학 확산 교육시장 표준화 주도 

 

연세대학교는 최근 ‘표절검색시스템’을 도입했다. 연세대가 ‘표절검색시스템’을 도입한 이유는 ‘적발’이라는 의미보다는 ‘예방’과 ‘올바른 학업문화’를 정착시키기 위해서다. 연세대학교는 표절검색시스템 구축을 통해 시스템을 운영하는데 그치지 않고, 대학 내에 만연하는 표절행위를 예방 및 방지하며, 교내 과제물에 대한 공정한 평가를 위해 다방면에서 활용할 계획이다. 

 

방창완 편집장 bcw1@dailygrid.net

 

최근 교육시장을 중심으로 ‘표절검색 시스템’ 구축이 큰 이슈가 되고 있다. 표절검색시스템이 점차 확산되고 있는 이유는 그동안 학내에서 공공연히 진행됐던 보고서 표절문화를 불식시키고, 올바른 학업 문화를 확립하기 위해서다.  

지난해에는 한국방송통신대학교, 한국폴리텍대학교 및 사이버대학교 등, 온라인 강의에 비중을 크게 두고 있는 대학을 중심으로 표절검색시스템 도입이 활발했다면, 올해는 주요 4년제 대학으로 그 열기가 확산되고 있다.

 

 

<서울 서대문구 성산로에 위치한 연세대학교 전경>

 

[Back ground] 올바른 학업문화 정착 위해 표절검색환경 구현 

대학교 중에서는 연세대학교가 비교적 빠르게 ‘표절검색시스템’을 도입했다. 연세대가 ‘표절검색시스템’을 도입한 이유는 ‘적발’이라는 의미보다는 ‘예방’과 ‘올바른 학업문화’를 정착시키기 위해서다. 사실 학생들은 표절에 대한 명확한 기준이 없기 때문에 과제물과 논문을 작성하는 과정에서 출처를 밝히지 않는 무분별한 인용을 시도해오곤 했다.

자신도 인지하지 못하는 표절행위는 의도적인 것보다는, 정당한 인용과 표절에 대한 이해가 부족하기 때문이다. 연세대학교는 표절검색시스템 구축을 통해 시스템을 운영하는데 그치지 않고, 대학 내에 만연하는 표절행위를 예방 및 방지하며, 교내 과제물에 대한 공정한 평가를 위해 다방면에서 활용할 계획이다. 

연세대학교는 표절검색시스템을 검토하면서, 외국의 검색시스템도 고려했지만, 무엇보다도 한글 보고서에 적합한 표절검색구현이 필요하다는 사실을 인지했다. 표절 관련 검색엔진 업체 3~4군데에 대해 BMT를 진행한 결과, 코난테크놀로지의 표절검색 시스템 ‘밈체커(MemeChecker)’를 선택하게 됐다.

80%의 기술과 20%의 가격평가를 통해 채택된 ‘밈체커’는 현재 연세대학교 LMS(러닝 매니지먼트 시스템/온라인 강의시스템)과 연동을 통해 구현되고 있다.

연세대학교 교육개발지원센터 이러닝 지원팀 오재호 기획팀장은 “학생들이 표절에 대한 정확한 인식이 부족하기 때문에 표절을 예방하는 차원에서 시스템을 구축했다. 학내 교수님들의 검색 시스템 도입의 필요성에 대한 의견도 지속적으로 있었기 때문에 학생들의 보고서와 과제물에 대한 표절 검색 시스템을 구축하게 됐다”고 배경에 대해 설명했다.

연세대학교 학생들의 모든 보고서와 과제물은 온라인 강의 시스템인 LMS을 통해 제출되며, 표절검색 및 통합관리가 LMS와 연동되어 진행된다. 연세대학교 보고서 건수는 한 학기에만도 10만건에 이른다.

 

 

연세대학교 교육개발지원센터 이러닝 지원팀 오재호 기획팀장은 “학생들이 표절에 대한 인식이 부족하기 때문에 예방방지 차원에서 시스템을 구축했다”고 말했다.

 

[Project feature] 모사도 통해 표절에 대한 측정비율 산정

연세대학교는 표절검색 구축 기준을 △모사도를 통해 몇 %를 표절했는지에 대한 정확한 측정비율 산정과, △학생간 레포트간의 표절정도 분석 △레포트의 히스토리 기능 △정당한 인용에 대한 확인기능 △키워드 기반의 표절검색 △표절부분에 대한 상세비교와 레포트별 통계분석 기능 △레포트 포맷변환 솔루션 구축 △효율적으로 교수진들에게 결과물을 보여줄 수 있는 시스템 구현 방법론을 주요 과제로 선정했다.

또한 컴퓨터 활용방법이 서투른 교수및 강사들을 위해 사용 편리성에 주안점을 뒀다. 즉 정확하고 빠른 검색 결과와 직관적인 사용자 인터페이스, 쉽고 단순한 구성 체계에 초점을 뒀다. 액셀을 통해서도 다양한 표절에 대한 통계정보를 일목요연하게 볼 수 있도록 레포팅 환경을 구현했다.          

연세대학교 교육개발지원센터 이러닝팀 오재호 기획팀장은 “과제물 전체(지난학기 포함)에 대해 1:n의 비교로, 표절률 목록을 산출하고, 실제적인 문서비교로 표절사실을 확인하게 된다. 동일문장이나 유사문장을 보여주고, 해당학과 교수님들이 직접 평가를 할 수 있도록 하고 있다”고 말했다.

검색은 상세검색과 전체 모사율을 통해 표절결과를 일목요연하게 보여주며, 특정부분 표절에 대한 상세검색도 가능하다.

연세대학교는 시스템 구축과정에서 우선 교수자들을 대상으로 요구조사를 실시했으며, 업무협의를 통해 필요한 기능에 대해 합의점을 만들었다. 구축업체인 코난테크놀로지는  연세대학교에서 요구한 사항을 대부분 수용했으며, 요구사항에서 빠진 부분은 기능을 보완하는 방식으로 프로젝트를 진행했다. 

시스템 구축에 참여한 코난테크놀로지의 검색기술영업팀 강정민 영업대표는 "표절검색의 경우 국내에 사례가 많지 않아, 코난에서 그동안의 구축 경험을 바탕으로 UI를 제시하고, 이를 대학이 수용하는 방법으로 진행했다. 사이버대학과 다르게 연세대학교는 리포트 용량이 크고, 제출건수가 많은데 이를 LMS와 연동한 것이 국내 대학시장에서 하나의 표준으로 자리 잡을 것으로 전망된다." 고 말했다.

그는 또 “내부 표절 설정에 대한 알고리즘을 모르더라도 버튼클릭 하나로 확인이 가능하며, 웹서비스를 이용하듯이 직관적으로 검색이 가능하다”고 설명했다.

코난에서 제시하는 핵심 검색기술은 핑거 프린팅 기법과 키워드 출현 패턴분석이다. 사람 지문처럼 각각의 문서 파일이 가진 고유의 핑거 프린트(문서 지문)를 추출해 표절 혐의가 있는 문서를 뽑아내고 이렇게 추려낸 문서는 키워드 출현 패턴 분석기법으로 문장 및 단어 단위에 대한 모사여부를 검증하게 된다.

 

[Best practice 1] 레포트간 표절정도 상세분석

표절검색시스템 구축의 특징을 살펴보면 첫 번째로, 정당한 인용에 대한 확인기능을 꼽을 수 있다. 이는 정당한 인용을 시스템에서 표절로 인식하지 않도록 방지하기 위한 조치이다.  두 번째로는, 키워드 기반의 표절검색환경을 구현한 점이다. 보통 단어나 문장의 순서나 수 식어를 바꾼 경우에도 일단 표절로 분류한다.

세 번째로는 레포트간의 표절정도 분석(표절률)이 가능해진 점이다. 레포트에 대한 히스토리 기능과 상세리뷰를 통해 리포트에서 특정 부분에 대한 표절 사실을 확인할 수 있으며, 문서필터를 이용해 한글 및 워드파일, ppt와 같이 서로 다른 문서간의 표절 여부도 확인이 가능하다. 또한 해당 학기 과제물에 대한 표절률을 그래프와 통계화면으로 제시함에 따라 강의 관리자는 이를 한눈에 파악할 수 있다.  

 

 

 <독크루저 e러닝 데모화면>

 

[Best practice 2] 표절예방효과 특효약

실질적인 기대효과를 살펴보면, 첫 번째로 이번 표절검색시스템이 학내에서 표절예방효과에 많은 도움을 줄 것이라는 점이다. 공공연하게 이루어졌던 학생들의 표절 행위를 이번 기회에 불식시킬 것으로 기대된다. 

연세대학교는 시스템 구축과 함께 별도의 표절교육을 통해 학생들이 표절과 표절이 아닌 것을 구별할 수 있도록 하는 교육을 계획하고 있다. 

두 번째로는 교과목 담당자들이 일일이 표절을 가려냈던 수고를 덜게 된 점이다. 기존 LMS 인터페이스를 통해 시스템에 대한 구체적인 사용 매뉴얼의 도움 없이 직관적인 검색과 운영 및 관리가 가능하게 됐으며, 보고서 평가에 대한 부분도 손쉽게 이뤄지도록 했다.

세 번째로는 대학에 대한 신뢰도를 제고하고, 이것이 국내 모든 대학에 연계될 수 있는 기반을 마련하게 된 점이다. 현재 미국 등 선진국에서는 표절검색 시스템이 교육 인프라 구축을 위한 필수 요소로 자리잡힌 것에 반해, 국내에서는 전무한 게 현실이다. 대학 관계자들이 이번 기회에 개방적인 마인드로 표절검색시스템을 공유할 수 있다면, 국내 대학 경쟁력 강화에 많은 도움을 줄 수 있을 것으로 전망된다.

네 번째는 현재는 ‘표절검색시스템’이라는 명칭으로 표절과 관련된 시스템이 구현됐지만 이 기술을 학술 데이터의 검색엔진으로 활용 할 수 있는 등 응용의 폭을 넓힐 수 있는 가능성을 준 점이다. 누구나 학술 데이터를 쉽게 검토 할 수 있도록 색인 및 검색기술로 확장시킨다면 대학의 경쟁력 있는 지식자산으로 남게 될 것이다.

 

[Future plan] 안정화 거쳐, 2011 서비스 개시

연세대학교는 11월에 표절검색시스템 구축을 최종 완료하고, 12월에는 안정화 및 시범운영을 거쳐 내년 1학기부터 실질적인 서비스를 개시하기로 했다. 시스템이 완료되는 시점에서 보완해야할 사항들을 점검하고, 학내에서 표절에 대한 교육도 정기적으로 실행할 계획이다.  오재호 기획팀장은 “표절검색은 표절을 기계적으로 검색하는 차원을 넘어, 표절 행위자 스스로도 인지하지 못하는 표절의 의미를 일깨우는 데 보다 근본적인 의미가 있다”고  말했다.

<데일리그리드>







저작권자 © 데일리그리드 무단전재 및 재배포 금지