한국외대, 다국어 코퍼스기반 감성분석 프로그램 구현
문·언어학자들에 의해 감성주석 코퍼스를 설계하고 이를 구축하였다는 점에서 의의
이원지
wonji@dhnews.co.kr | 2017-02-01 15:12:18
[대학저널 이원지 기자]한국외국어대학교(총장 김인철) 글로벌다형지식연구센터(센터장 윤일동 한국외대 컴퓨터전자시스템공학부 교수)는 현대사회 SNS 환경에서 쉼없이 쏟아져 나오는 사용자들의 주관적 감정표현 및 오피니언들을 자동으로 분석하고 분류하는 감성분석 프로그램을 구현했다.
기존의 감성분석 프로그램들은 극히 제한된 규모의 사전과 코퍼스(말뭉치; 자연언어 연구를 위해 특정한 목적을 가지고 언어의 표본을 추출한 집합) 등의 언어리소스를 사용하는 통계기반 엔진이라는 점, 또한 대부분의 언어자원이 영어를 중심으로 구축되어 있다는 한계점을 가지고 있다.
이러한 점에서, 이번 연구는 본격적으로 인문·언어학자들에 의해 감성주석 코퍼스를 설계하고 이를 구축하였다는 점에서 의의를 가진다. 이 연구에서는 한국어 감성코퍼스를 코아 리소스로 설정하고 이를 토대로 인도네시아어 및 러시아어 SNS 텍스트로부터 다국어 감성코퍼스를 구축했고 또한 미래의 동서양어 다국어 감성코퍼스 구축을 위한 유형론적 토대 연구를 진행했다. 각 언어별 감성주석 코퍼스는 해당 언어의 모국어 원어민 연구자들이 직접 진행했으며 이에 대해 지속적으로 부분적인 교차 검증 작업을 수행했다.
이와 같이 체계적으로 구축된 언어자원을 이용할 때 이를 기반으로 하는 감성분석 엔진의 성능이 얼마나 향상될 수 있는지가 현재 계속 실험중이며, 이를 바탕으로 기계학습이 이루어진 감성분석 엔진도 신뢰할 만한 결과를 도출할 수 있을 것이라 기대된다.
[ⓒ 대학저널. 무단전재-재배포 금지]