
대규모 영어 단문형 쓰기 평가를 위한 자동채점 프로그램의 적용 가능성 탐색

시기자1,, 박도영2, 임황규3
Ki-Ja Si1,, Do-Young Park2, Hwang-Gyu Lim3
Author Information & Copyright
1한국교육과정평가원 연구위원
2한국교육과정평가원 부연구위원
3한국교육과정평가원 전문연구원
1Research fellow, Korea Institute for Curriculum and Evaluation
2Associate Research fellow, Korea Institute for Curriculum and Evaluation
3Researcher, Korea Institute for Curriculum and Evaluation
Corresponding Author : Ki-Ja Si, E-mail :

ⓒ Copyright 2014, Korea Institute for Curriculum and Evaluation. This is an Open-Access article distributed under the terms of the Creative Commons Attribution NonCommercial-ShareAlike License ( which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: May 01, 2014 ; Revised: Jun 01, 2014 ; Accepted: Jun 13, 2014

Published Online: Jul 31, 2014


본 연구의 목적은 단문 형식의 쓰기 답안 평가를 위해 개발한 자동채점 프로그램의 성능을 검증하여 대규모 쓰기 평가에서의 적용 가능성을 탐색하기 위한 것이다. 본 연구에서 성능 검증에 사용한 문항은 ‘상황에 맞는 짧은 글쓰기’(15~25단어, 5분) 문항과 ‘그림의 세부묘사 완성하기’(하위문장별 10단어 이내, 5분) 문항이다. 본 연구에서는 단문 형식의 쓰기 평가를 위한 자동채점 프로그램의 성능을 검증하기 위해 인간채점과 자동채점에 따른 상관계수, 유사일치도 통계에 근거한 채점자 간 신뢰도의 차이, 다국면 라쉬 모형에 근거한 채점자 엄격성의 차이, 일반화가능도 계수에 근거한 검사점수 신뢰도의 차이, 시간 및 비용 차이 등에 대한 통계적 분석을 실시하였다. 분석 결과, 자동채점이 인간채점자 1명을 대체할 경우 채점자 간 신뢰도, 검사점수 신뢰도를 인간채점과 유사한 수준으로 유지하면서 채점자 엄격성에 의한 영향력과 시간 및 비용을 큰 폭으로 감소시킬 수 있음을 확인하였다.

Keywords: 단문형 쓰기 평가; 자동채점; 채점자 간 신뢰도; 채점자 엄격성; 일반화가능도 계수