표 2 자료 정제 과정과 예시

구분 내용
<1차>형태소 정제 ■ 고유한 의미가 없다고 판단되는 형태소 삭제 - 의존명사(이, 데, 년, 수, 회, 외 등)■ 동사, 형용사 원형으로 전환 - 부풀리 → 부풀리기 / 만들 → 만들다 / 새롭 → 새롭다 / 이끌 → 이끌다
<2차>지정어, 유의어 처리 ■ 원문에서 고유한 의미를 가진 경우, 행태소들을 통합하여 복합명사로 전환 - 성취, 평가제 → 성취평가제 / 고교, 학점제 → 고교학점제 / 절대, 평가 → 절대평가 / 상대, 평가 → 상대평가 / 성취, 수준 → 성취수준 / 선택, 과목 → 선택과목 / 지필, 평가 → 지필평가■ 유의어의 표준화 - 대학 입시, 대입, 대입 제도 → 대입 / 고등, 고교, 고등학교 → 고등학교 / 자사고, 자율형사립고 → 자사고 / 외국어고등학교, 외국어고, 외고 → 외고
<3차>불용어 처리 ■ 교육정책 관련 언론 기사에서 통상적으로 사용되는 단어 삭제 - 기자, 학년도 등