Article
쓰기 자동채점 알고리듬의 성능 비교: 최대 엔트로피 기법과 서포트 벡터 회귀 기법
1,†, 2, 1, 3, 4, 4
1,†, 2, 1, 3, 4, 4
Received: Aug 27, 2013 ; Revised: Sep 30, 2013 ; Accepted: Oct 16, 2013
Published Online: Nov 30, 2013
요약
한국교육과정평가원에서는 국가영어능력평가시험에 최적화된 쓰기 자동채점 프로그램을 개발 중에 있다. 자동채점 프로그램의 성능은 기계학습에 적용되는 알고리듬에 의해 많은 영향을 받으며, 현재 국가영어능력평가시험 쓰기 자동채점 프로그램에서는 가장 일반적으로 사용되고 있는 알고리듬인 최대 엔트로피 기법과 서포트 벡터 회귀 기법을 적용하고 있다. 본 논문에서는 쓰기 자동채점 프로그램에 적용된 두 가지 알고리듬에 따른 채점 성능을 비교·분석하였다. 이를 위해 n-fold 방식을 이용한 모의실험과 실제 채점자료를 이용한 실증 연구를 통하여 두 가지 알고리듬의 성능을 비교하였다. 분석 결과, 모의실험 및 실증 분석 모두에서 서포트 벡터 회귀 기법이 최대 엔트로피 기법보다 국가영어능력평가시험 쓰기 영역 채점에 더 적합한 알고리듬인 것으로 확인되었다.
Keywords: 자동채점 알고리듬; 최대 엔트로피 기법; 서포트 벡터 회귀 기법; n-fold 모의실험