[사진=아하]

소셜 Q&A 커뮤니티 '아하'를 운영 중인 아하앤컴퍼니 주식회사가 자사 서비스 내 축적된 고품질 한국어 데이터 판매를 본격적으로 시작했다고 17일 밝혔다.

LLM을 자체 개발하거나 AI 및 데이터 관련 사업을 위해 고품질 한국어 데이터가 필요한 기업 등을 주요 잠재 고객으로 타기팅한다.

법률, 세금/세무, 인사/노무, 의료, 약료, 반려동물, 치과, 보험, 부동산 등 다양한 분야의 질문 및 전문가 답변 데이터가 주요 판매 상품이며, 1차적인 데이터 가공(개인정보 제거 등)이 선행돼 고객사의 검수 편의성 확보 및 학습 시 부적합한 답변 가능성을 줄여준다.

또한 아하 커뮤니티의 한국어 데이터는 질문 내용에 대한 답변만을 포함하고 있으며, 통상적인 짧은 문답이 아닌 특정 상황에 대한 자세한 답변으로 구성돼 있어 일반적인 한국어 데이터셋과 차별화된 강점을 보인다.

아하 커뮤니티는 활동하는 전문가를 대상으로 내부 정책에 따른 아하 지수 및 어뷰징 적발 알고리즘을 통해 답변자의 답변 퀄리티를 유지 중이며, 하기 기준들을 통한 답변자 내부 랭킹 산정 등 콘텐츠 QC 정책을 통해 한국어 데이터 생산 환경을 구축하고 있다.

김보라 기자
저작권자 © 데일리그리드 무단전재 및 재배포 금지