I. 서 론
‘경쟁 위주의 입시교육’은 한국 교육이 개선해야 할 고질적인 문제로 지적된다. 그 기저에는 학년별, 교과목별 석차를 부여하는 상대평가로 인한 부작용이 존재한다. ‘누가 더 높은 점수를 받는가’에 집중하는 평가 방식은 경쟁적인 학습 분위기 속에서 학생의 과도한 스트레스를 유발하고, 더 높은 점수를 받을 수 있는 교수학습 방안에 관심을 두거나 사교육의 병폐를 유발하는 요인이 되었다. 이러한 문제의식을 반영하여 2011년에 성취평가제 도입을 포함한 「중등학교 학사관리 선진화 방안」(교육과학기술부, 2011)이 발표되었다. 성취평가제는 ‘교육과정에 맞춰서 개발된 교과목별 성취기준 및 성취수준에 따라 학생의 학업 성취수준을 평가하고 A-B-C-D-E로 성취도를 부여’하는 평가제도로서(한국교육과정평가원, 2024), 기존의 교육 문제를 혁신하고 창의·인성 교육을 구현하는 데에 이바지할 것이라는 기대를 담고 있다.
이후 성취평가제는 단계적으로 중학교와 고등학교에 적용되었다. 2014학년도에 고등학교 1학년을 시작으로, 2016년부터는 전체 고등학교에서 운영되고 있다. 2019년 고등학교 1학년부터는 대입전형 자료로 진로선택과목 성취도가 석차 9등급과 병기 없이 제공되고 있다. 그리고 2025년 고등학교 1학년부터는 모든 선택과목에 성취평가제가 적용될 예정이다(교육부, 2023b).
성취평가제는 2025학년도부터 전면 도입되는 고교학점제로 인해 더욱 주목받고 있다. 적성과 진로에 따라 학생이 원하는 교과목을 선택하여 이수하고, 학점 취득 여부로 졸업이 결정되는 고교학점제(교육부, 교육과정평가원, 2023)는 고등학교 교육 체계의 혁신적인 변화를 시도하고 있다. 교육과정 변화에는 평가방법의 변화가 반드시 수반되는데, 고교학점제의 단계적 이행 계획 중 평가 측면으로는 성취평가제의 확대 적용이 중요하게 다루어지고 있다. 기본적으로 성취평가제가 학생의 진로, 적성, 흥미에 따라 선택과목을 이수하도록 하는 고교학점제 취지에 부합하는 평가 방법이기 때문이다. 석차등급제에서는 상대적으로 높은 등급을 받는 데에 유리한 교과목을 선택하는 경향이 높아지지만, 절대평가 방식인 성취평가제가 적용되면 학생의 교과목 선택 자율성이 보장될 수 있다. 또한 고교학점제에서 학점을 취득하기 위해서는 최소한의 성취수준에 도달해야 하는데, 선택과목의 이수·미이수 판정을 위해서 절대평가 방식이 적용되어야 한다. 이러한 측면에서 고교학점제가 가진 본연의 교육적 목적을 고려하면, 성취평가제가 제대로 작동해야 하는 것이다. 이처럼 성취평가제는 지나친 경쟁으로 인한 심리적 부담을 줄이고 학생의 수준을 정확하게 파악함으로써 학생의 성장과 발달을 돕는 방식으로 교육의 본질적 기능 회복에 기여할 수 있다.
그러나 성취평가제의 본격 적용을 앞둔 현재, 교육 현장에서는 혼란과 부작용 발생의 문제가 지적되고 있다. 첫째, 성취평가제 운영의 신뢰성 문제이다. 우선 성취평가제 적용 시, 교사가 성취기준과 성취수준의 설정, 문제 출제, 채점과 평가, 결과 활용 등을 담당해야 하지만 실질적으로 추진할 수 있는 역량과 지원 체계가 부족한 것이 현실이며, 교사의 업무 과중으로 이어질 것이 예상된다(조용, 2023). 이러한 학교 현장의 어려움은 오차 발생으로 학생평가 신뢰도를 낮추는 요인이 될 수 있다(김순남, 이병환, 2018). 더욱이 고등학교 내신성적이 대입 전형에 활용되는 상황에서, 교사는 가급적 좋은 평가를 하려는 유혹에 노출될 수 있다. 일명 ‘내신 성적 부풀리기’로 불리는 성적과대평가 현상은 성취평가제의 근본적인 취약점으로 지적된다(양길석 외, 2020). 실제로 성취평가제의 신뢰성에 대한 사회적 우려로 애초 계획과 달리 전면 적용은 유예되었다. 현재는 공통과목과 일반선택과목은 석차등급을 병기하고 있으며 2025학년도 이후에도 공통과목에는 석차등급이 병기될 예정이다.
둘째, 성취평가제의 내실화를 위한 학교와 교사의 역량 문제이다. 기본적으로 분할점수 산출 방식의 개선을 위한 학교 수준의 평가 역량이 요구되지만, 충분한 준비가 되었다고 보긴 어렵다(박혜영 외, 2022; 이정연 외, 2023). 5등급제 점수 산출을 위해서는 A-B, B-C, C-D, D-E 등급을 구분하는 4개의 분할점수를 산출해야 하는데, 여기에 고교학점제 전면 도입으로 이수와 미이수를 구분하는 분할점수를 추가하는 개선이 필요한 상황이다. 고정점수(90점, 80점, 70점, 60점)로 성취수준을 평가하는 ‘성취수준별 고정 분할점수’ 방식은 비교적 적용이 쉬워 다수의 학교가 사용 중이지만, 학교나 학생의 특성에 따라서 학생 성취수준의 분포를 파악하려는 성취평가제 취지를 고려할 때 점수 산출의 논리적 근거가 부족하다는 문제가 있다. 이에 교과 교사들이 문항별 정답률을 예상하고 협의를 거쳐 분할점수를 산출하는 ‘성취수준별 추정 분할점수’가 제안되고 있으나, 절차가 복잡하고 단위학교와 교사의 평가 전문성이 결과에 영향을 미친다는 점에서 학교 현장은 적용에 어려움을 느끼고 있다(김영은 외, 2024). 더욱이 분할점수 산출이라는 평가 역량뿐만 아니라, 미이수 학생에 대한 책임교육의 부담도 학교 현장에는 추가되었다. 그러나 이러한 평가 업무를 처리할 수 있도록 학교와 교사를 지원하는 구체적 방안은 제시되지 못하고 있어(박혜영 외, 2022; 이정연 외, 2023), 일부 학교에서는 미이수 학생을 최소화하기 위해 최소 성취수준을 낮게 정하고 기본 점수를 많이 부여하는 부작용도 확인된다(오마이뉴스, 2024. 7. 29.).
셋째, 대학입시와의 안정적인 연계 문제이다. 고등학교 성취평가제의 확대는 대학입시에 큰 변화를 초래할 것으로 예상된다. 성취평가제는 수능 위주의 정시와는 평가의 방향성이 다르므로, 향후 대학입시가 학생부 위주의 전형으로 변화될 가능성이 크다(신윤범, 원효헌, 2024). 그러나 일정 성취수준 이상이면 A등급이 부여되므로 학생부 위주 전형의 선발기준도 모호해질 수 있다(이정연 외, 2023). 당분간 대학입시를 대비하는 학생, 학부모, 교사, 대학 등 여러 교육주체가 혼란을 경험할 것으로 보인다. 이러한 시점에 교과 성적의 변별력이 확보되지 못한다면, 성취평가제의 내신 성적은 대입전형 요소로서 영향력이 축소되거나 사라질 수도 있을 것이다(허정은, 정영희, 박창언, 2022). 성취평가제 관점에서, 학생의 선택권을 보장하며 평가의 다양성을 기대할 수 있는 학생부종합전형이 보다 적합한 제도로 여겨지지만(신윤범, 원효헌, 2024; 조원기, 황우원, 2024), 대입전형에 적합한 교과 선택의 범위와 내용, 학생부종합전형을 보강하는 정성평가의 운영 방법 등 구체적인 연계 방안에 대해서는 명확한 정리가 필요한 상황이다(조원기, 황우원, 2024).
이처럼 성취평가제에 대해서는 교육적 변화에 대한 우리 사회의 기대와 현실적인 운영의 제약에 대한 우려가 공존하는 것으로 여겨진다. 교육제도에 대한 사회적 인식은 해당 제도의 실체를 파악하는 하나의 수단이 되며, 이를 토대로 향후 제도가 안착하기 위한 운영 수립에 도움을 줄 수 있다. 특히 고교학점제 전면 도입으로 성취평가제에 대한 관심이 높은 시점에 우리 사회가 성취평가제를 어떻게 바라보는지 확인하는 것은 교육 현장의 혼란을 줄이는 전략을 모색하는 데에도 실질적인 시사점을 제공할 수 있을 것이다.
성취평가제에 대한 사회적 인식 확인을 위해, 빅데이터를 활용한 연구는 고유한 관점을 제시할 수 있다. 온라인 공간에 방대한 규모로 생성, 가공, 공유되는 빅데이터는 시간의 흐름에 따라 축적되므로, 조사 도구를 활용하는 연구에 비해 사회적 현상을 생생하게 포착할 수 있다(Chen & Wojcik, 2016). 특히 교육제도와 같이 대중의 관심이 높은 주제는 다양한 사회구성원이 빅데이터를 생성하고 공유하므로, 해당 제도가 사회적으로 수용되고 운영되는 특성을 파악할 수 있다. 특히 교육정책의 실행, 국가 교육과정 개정이 미치는 영향이 큰 우리나라의 경우, 언론 기사, 웹 게시물, 카페, 블로그, 학술논문 등을 활용한 빅데이터 연구는 제도 변화에 따른 사회적 파급을 다각적으로 분석할 수있어 개선 방안 모색에 도움이 되고 있다. 예를 들어, 빅데이터를 활용하여 국가 교육과정의 개정에 대한 전반적인 인식은 물론(김인재, 구태진, 정제영, 2024; 서경숙 외, 2023), 자유학기제(이수안 외, 2019; 황은희, 장지현, 양현경, 2019), 고교학점제(지미영, 김수진, 강주현, 2023)와 같이 구체적인 제도에 대한 연구가 수행되었다. 성취평가제를 주제로 한 빅데이터 연구도 수행되었는데, 장은아와 정혜원(2024)은 성취평가제가 도입된 2011년부터 2024년 3월까지 게재된 학술논문을 대상으로 텍스트마이닝(text mining)을 실시하였다. 이 연구는 현재 빅데이터를 활용한 성취평가제 연구로서 유일한 사례로 확인되며, 연구가 미미했던 연구동향을 분석하여 향후 연구의 방향을 제시하였다는 점에서 의미를 가진다. 그러나 분석 데이터가 학술논문 87건이라는 점에서, 빅데이터 분석에 충분한 사례(전은정, 최윤정, 2024)를 확보하지 못했다는 아쉬움이 있다.
이에 본 연구는 성취평가제에 대한 언론 기사를 활용하여 텍스트마이닝 연구를 수행하고자 한다. 빅데이터에 포함되는 비정형 데이터 유형은 학술논문, 언론 기사, 소셜미디어 자료 등 다양하고, 각 유형별로 도출되는 결과가 달라질 수 있다(조은별, 민지연, 박수원, 2020). 예를 들어, 학술논문은 연구자의 이론적, 실증적 검증을 거친 결과물이며 엄정한 심사를 거쳐 게재된다는 점에서 내용의 질적 우수함을 기대할 수 있으나, 연구 주제에 따라 빅데이터 분석에 필요한 사례 수를 확보하지 못할 수 있다. 카페, 블로그, 웹 게시판 등의 소셜미디어 자료는 대중이 제한 없이 빅데이터를 생성한다는 점에서 사회적 인식을 가장 자연스럽게 파악할 수 있으나, 무분별한 홍보성 게시물의 해석과 비표준어, 비속어, 비문 등을 정제하는 과정의 어려움을 고려해야 한다. 반면, 언론 기사는 사회적 관심이 높은 주제에 대하여 취재 단계에 정부, 학생, 학부모, 교사, 전문가 등 여러 주체의 인식이 직간접적으로 반영된다. 배포된 언론 기사는 다시 대중의 인식 형성에 영향을 미친다는 점에서 사회적 인식 형성에 영향력을 가진다. 또한, 단어 선택 및 문장 진술 측면에서 비교적 정제된 빅데이터를 활용할 수 있다는 장점이 있다. 언론 기사에 출현하는 주요 단어의 특성과 토픽을 확인하고, 주요 토픽이 시간의 경과에 따라 변화되는 양상을 살펴봄으로써 성취평가제에 대한 사회적 인식을 확인할 수 있을 것이다. 이에 본 연구의 연구문제를 다음과 같이 설정하였다.
II. 이론적 배경
성취평가제를 간단히 정의하면, ‘누가 잘했는지’에 관심을 두기보다, ‘무엇을 성취했는지’를 평가하는 방식이다(이정연 외, 2023). 성취평가제는 석차와 같은 상대적 서열로 경쟁의식을 유발하는 교육환경을 지양하고, 학생의 성취에 대한 정확한 정보를 제공함으로써 학생의 잠재력을 최대로 이끄는 데에 목적을 둔다(박혜영 외, 2022).
성취평가제는 2009 개정 교육과정 도입과 함께, 학생평가 체제를 개선하고자 제안되었고(진경애 외, 2019) 「중등학교 학사관리 선진화 방안」(교육과학기술부, 2011)이 발표되면서 공식적으로 제도화되었다. 발표 당시, 성취평가제는 “교육과정에 맞추어 개발된 교육과목별 성취기준 및 평가기준에 따라 학생의 학업성취 수준을 평가하고 성취도(A-B-C-D-E-F))를 부여하는 제도”로 소개되었다. 여기서 성취평가제는 원점수에 대한 절대평가를 의미하는 것이 아니라, 국가 교육과정에 근거한 성취수준을 설정하고, 이에 대한 도달 수준을 평가하는 것이다. 교육과정의 성취기준에 따라 학생의 성취수준을 평가하는 성취평가제는 성취도를 5단계(A-B-C-D-E), 3단계(A-B-C), 2단계(P-F)로 구분하며, 학년(학기) 초 성취평가의 준거가 마련되는 것이 필수적이다(이정연 외, 2023). 여기서 성취도 부여의 기준인 성취기준은 내용기준과 수행기준으로 정의할 수 있다(김순남, 이병환, 2018). 내용기준은 학생에게 요구하는 지식, 기술 등이 서술된 것이고, 수행기준은 정의와 사례를 통해 학생이 할 수 있는 것을 제시한 것이다.
이러한 성취평가제는 2011년 12월 13일 「중등학교 학사관리 선진화 방안」 발표 이후, 2012학년도부터 중학교와 고등학교에 도입되기 시작하였다. 고등학교의 경우 2012학년도 1학년의 전문교과부터 시작되었고, 2014학년도 1학년부터 보통교과에도 적용되었다. 2016년부터는 전체 고등학교를 대상으로 운영되고 있다(이정연 외, 2023). 이후 「2022학년도 대학입학제도 개편방안 및 고교교육 혁신방향」(교육부, 2018)의 발표는 성취평가제의 큰 전환점이 되었다(장은하, 정혜원, 2024). 2019학년도 고등학교 1학년부터 진로선택과목에 대하여 2022학년도 대학입학 전형 자료로 석차등급과 표준편차 없이 원점수, 평균, 성취도, 수강자 수, 성취수준별 학생비율을 제공하는 방안이 제안되면서, 성취평가제 정착 노력이 가시화된 것이다. 이와 함께, 「포용과 성장의 고교교육 구현을 위한 고교학점제 종합 추진계획」(교육부, 2021b)에 고교학점제의 미이수 제도 도입이 포함되고, 2025학년도부터 성취평가제가 전체 선택과목으로 확대되는 계획이 수립되면서 성취평가제 중심의 학생평가에 대한 논의는 본격화되었다.
그러나 실제로는 성취평가제의 확대 계획에 기존의 상대평가를 병기하는 절충안이 적용되고 있다. 2023년 6월의 「모든 학생의 성장을 지원하는 공교육 경쟁력 제고방안(교육부, 2023a)」에서 석차 9등급제에 준하는 석차등급을 계속 병기하도록 하였고, 같은 해 12월에 발표된 「미래 사회를 대비하는 2028 대학입시제도 개편 확정안(교육부, 2023b)」에서는 보통교과에 상대평가 성적과 절대평가 성적을 함께 기재하도록 하였다. 이는 내신 평가의 신뢰성과 대입의 안정성을 확보하는 동시에, 고교학점제 운영 중 학생의 선택권을 확대하려는 목적을 반영한 것이다.
성취평가제 도입 이후, 평가의 현장 적용과 제도의 개선 방안을 모색하기 위한 성취평가제 연구들이 수행되고 있다. 주요 흐름은 다음과 같이 정리될 수 있다.
첫째, 성취평가제 도입과 운영의 방향성을 제안하는 연구이며, 성취평가제 도입 초기에 주로 이루어졌다. 예를 들면, 상대평가에서 벗어나 절대평가 방식으로 도입하는 것이 학생의 진정한 성장을 지원하는 것이라는 관점에서 성취평가제 도입의 필요성을 주장하고(김신영, 2012; 지은림, 2011), 관련 용어의 정의, 성취기준 및 성취수준 설정의 방안(김경희 외, 2012)을 제안한 연구들이 이에 해당한다. 이와 함께, 분할점수 산정 방법(이상하, 최혁준, 2012), 교과목별 성취기준 개발 모델(박준홍, 김경희, 2022) 등 구체적인 운영 방법을 개발하여 교육현장에 제안하는 연구들이 이어졌다. 이러한 연구들은 성취평가제가 학교 현장에 적용될 수 있는 기반을 마련하는 데에 기여하고 있다.
둘째, 성취평가제의 운영 사례 및 이를 통해 형성된 관련 주체들의 인식 연구이다. 성취평가제의 운영 사례가 확대되면서 인식 연구의 대상도 다양하게 확인되는데, 특히 교사 인식 연구가 주를 이룬다. 고등학교 교사 일반(현순안, 곽옥금, 2023), 국어, 수학, 과학 등 특정 교과 교사(송재환, 고호경, 2018; 전소현, 이현주, 2024; 최숙기, 2016), 고교학점제 시범학교 교사(이광상, 2023), 운영 사례를 가진 교육청 소속 교사(조용, 2023) 등 다양한 유형의 교사 인식이 분석되었다. 교사들은 대체로 성취평가제의 취지에 공감하고 관심을 가졌으나, 교사의 업무 가중 문제에 대처하면서 평가 전문성 확보를 위한 지원, 저성취 학생 선정 및 미도달 예방지도 방안 마련 등 현안이 해결되어야 한다는 문제의식을 가지고 있었다. 반면, 성취평가제 도입과 운영에서 중요한 주체인 학생(고영빈, 지은림, 2022)과 학부모(최원석, 길혜지, 2023) 인식 연구는 상대적으로 적었다.
셋째, 성취평가제 적용에 따른 문제점을 파악하고 대응 방안을 모색하는 연구이다. 특히, 고등학교 성취평가제는 대학입시와의 관련성이 높아 확대 적용에 따른 혼란을 방지하는 방안이 논의되고 있다. 학생의 성장을 우선시하는 발달적 기능을 고려한 도입 취지와 달리, 성취평가제 결과가 대학입시에서 선발적 기능을 담당하는 모순이 발생하기 때문이다. 더욱이 단위 학교에서 성취기준 및 성취도를 자율적으로 설정하게 되므로, ‘성적 부풀리기’의 가능성도 존재한다. 한편 성취평가제가 반영되는 과목은 수강자 수를 기준으로 내신등급 및 성취도가 달라질 수 있으므로, 학생들이 전공 적합성을 무시하고 대학입시에 유리한 교과목을 선택할 수 있다. 이러한 문제의식을 바탕으로, 고등학교 성취평가제의 근본적인 문제를 포착하여 정착 방안을 제안하고(김순남, 이병환, 2018), 대입에서 성취평가제가 활용되는 실태를 파악하여(신윤범, 원효헌, 2021) 대입제도의 개편 방안(조원기, 황우원, 2024)은 제안하는 연구들이 수행되고 있다.
III. 연구방법
본 연구는 검색 키워드를 ‘성취평가제’로 설정하고 언론 기사를 수집하였다. 선행연구에서 성취평가제 운영의 큰 변화가 이루어진 시점을 「2022학년도 대학입학제도 개편방안 및 고교교육 혁신방향」(교육부, 2018) 발표로 판단하는 점을 고려하여(장은아, 정혜원, 2024), 해당 발표가 이루어진 2018년 8월 17일부터 최근 시점인 2024년 6월 30일까지를 검색 기간으로 설정하였다. 성취평가제가 도입된 2011년 이후의 전체 언론 기사에 대한 분석도 의미가 있겠으나, 최근의 사회적 인식에 집중하여 시사점을 구체화하고자 한 것이다.
언론 기사 수집은 빅데이터 솔루션 텍스톰(Textom)을 활용하였다. 2024년 기준으로 검색엔진 사용 점유비율 1, 2위인(조선비즈, 2024. 7. 17.) 네이버(Naver)와 구글(Google)에서 검색되는 자료의 생성일, url, 제목, 본문 정보를 수집하였다. 단, 특정 기관의 보도자료나 정책 현안 브리핑 자료를 여러 언론사가 첨삭 없이 기사화한 경우에는 해당 사안이 사회적 인식으로 과잉 해석될 수 있다. 이에 선행연구를 참고하여 제목과 본문이 일치하는 문서는 하나의 문서만 분석에 활용하였다(양경은, 노법래, 2020). 단, 기사의 유사도가 높더라도 제목과 본문이 서로 다른 경우는 각 자료를 모두 분석에 포함하였다. 각 언론사의 관점을 반영한 기사화 과정이 포함되었다고 판단할 수 있기 때문이다. 분석에 활용된 언론 기사의 정보는 <표 1>에 제시하였다.
구분 | 2018년 | 2019년 | 2020년 | 2021년 | 2022년 | 2023년 | 2024년 | 계 |
---|---|---|---|---|---|---|---|---|
구글 | 22 | 27 | 10 | 49 | 21 | 63 | 23 | 215 |
네이버 | 188 | 236 | 99 | 252 | 202 | 333 | 63 | 1,373 |
계 | 210 | 263 | 109 | 301 | 223 | 396 | 86 | 1,588 |
텍스톰이 제공하는 MeCab-IMC 형태소 분석기를 활용하여 자료를 정제하였다. 이 분석기는 한국어 형태소 분석용으로 성능이 우수하다고 알려진 Mecab-ko(김원준, 2022)를 기반으로 신조어와 복합명사 분석 기능을 추가하여 결과의 안정성이 보다 향상되었다(Textom, 2024). 먼저 명사, 동사, 형용사를 추출하는 방식으로 형태소 분석을 실시하고, 이후 다음의 3단계 정제 작업을 진행하였다.
첫째, 추출된 형태소를 대상으로 고유한 의미를 가지지 못한 단어들을 수정, 삭제하였다. 이 단계에서 MeCab-IMC가 추출한 동사, 형용사는 어미를 추가하여 원형으로 정제하였다. 둘째, 지정어와 유의어에 대한 정제를 수행하였다. 지정어 정제는 추출된 형태소 각각을 통합하였을 때 맥락상 의미가 있는 경우, 복합명사로 전환하는 과정이었다. 특히, 성취평가제를 다룬 언론 기사의 특성상, 교육학 영역에서 의미가 있는 경우에는 가급적 복합명사로 전환하였다. 유의어 정제는 동일한 의미의 단어들을 통일하여 하나의 단어만 분석에 활용하는 과정이었다. 셋째, 불용어를 선정하고 분석에 반영하였다. 먼저, 언론 기사에 통상적으로 포함되는 단어, 교육정책 관련 정보에 높은 빈도로 등장하지만 실질적인 의미를 가졌다고 보기 어려운 단어들을 삭제하였다. 자료 정제의 기준과 예시는 <표 2>와 같다.
성취평가제를 다룬 언론 보조의 주요 쟁점을 파악하기 위하여, 주요 단어와 주제의 특성을 분석하였다.
첫째, 중요 단어의 특성은 단어 빈도 분석(Term frequency, TF)과 단어 빈도-역문서 빈도 분석(Term Frequency-Inverse Document Frequency, TF-IDF)을 통해 확인하였다. TF란, 수집한 자료들에서 특정 단어가 출현하는 수준을 의미하며, TF 수치가 높으면 대체로 주요 개념을 가진 단어로 판단한다. 텍스트마이닝 연구에서 가장 기본적으로 확인하는 결과이지만, TF가 높은 단어의 일부는 상투적인 표현으로 등장하여 의미가 과잉 해석될 수 있다. 이러한 우려로 등장한 TF-IDF는 수집된 자료 하나에 특정 단어가 가진 중요성을 의미한다. IDF(Inverse document frequency)는 문서 빈도(Document frequency)의 역수를 의미하며, TF-IDF는 TF와 IDF(Inverse document frequency)의 곱한 값이다. 따라서, 어떤 단어가 수집된 자료 전반에 통상적으로 등장하는 것이 아니라, 특정 자료에 집중적으로 출현한다는 의미로 해석된다. 단어 가중치의 의미를 가지는 TF-IDF는 습관적으로 무의미하게 등장하는 단어를 제외하고 중요한 단어를 확인하는 데에 유용하다.
둘째, 토픽모델링을 실시하여 성취평가제를 다룬 언론 보도에 포함된 주제의 수와 주요 내용을 확인하였다. 토픽 분석은 수집한 자료가 여러 주제를 포함한 집합으로, 각 주제를 여러 단어로 구성된 집합으로 전제하고 잠재적인 의미구조를 도출하는 텍스트마이닝 기법이다. 이에 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)(Blei, 2012) 알고리즘을 적용한 텍스톰의 분석 기능을 활용하여 최적의 토픽 수를 결정하였다. 토픽 수 결정에는 복잡도(perplexity)와 응집도(coherence) 수치를 참고하였다. 복잡도는 도출한 의미구조의 예측값과 측정값의 차이를 의미하며, 토픽 수가 증가할수록 수치가 감소하는 경향이 있다. 이와 비교하여 응집도는 특정 토픽으로 분류될 확률이 높은 단어들이 서로 유사한 정도를 의미하는데, 복잡도가 높아질수록 감소하는 경향이 있다. 복잡도는 낮을수록, 응집도는 높을수록 정확하고 일관성을 가진 의미구조라고 판단할 수 있다. 그러나, 토픽 수를 결정할 때 복잡도와 응집도의 수치만을 단편적으로 확인하는 것이 아니라, 주제의 특성 및 해석의 용이성을 고려한다. 이에 토픽이 일정 개수 이상이 되지 않도록 한정하여 토픽 수를 결정하기도 한다(이서진, 민경석, 2022). 본 연구에서는 복잡도, 응집도의 수치를 확인하되, 토픽의 수가 너무 많아지지 않는 범위에서 토픽 수를 결정하였다. 이어서 각 토픽에 포함된 주제를 함축하는 명칭의 초안을 정하고, 이를 빅데이터 연구 경험을 가진 교육평가 전공 박사학위자 1인, 현재 성취평가제를 운영하고 있으며 교육학 박사학위를 소지한 고등학교 교사 1인이 독립적으로 타당성을 확인하도록 요청하였다. 이처럼 연구진 이외의 전문가 의견을 최종 반영하여 토픽 명을 결정함으로써 연구 결과의 타당성을 확보하고자 하였다.
마지막으로 도출된 토픽에 대한 시계열 회귀분석을 실시하였다. 언론 기사의 발행 연도를 독립변인으로, 각 토픽의 연도별 비중에 대한 평균 값을 종속변인으로 설정하였다. 시계열 자료는 인접한 시점의 측정치 사이에 자기상관이 발생할 수 있으므로, 잔차의 독립성 검증이 필요하다. 이에 0에서 4까지의 값을 가지는 Durbin-Watson의 d 통계량이 2에 가깝다면 잔차 간의 자기상관 문제가 없다고 판단하는 방식으로 잔차의 독립성을 확인하였다. 회귀계수가 정적으로 유의한 토픽은 상승 토픽(Hot topic), 회귀계수가 부적으로 유의한 토픽은 하강 토픽(Cold topic), 회귀계수가 유의하지 않은 토픽은 중립 토픽(neutral topic)으로 구분하였다(박종순, 김창식, 2019; 최진수, 정혜원, 2024). 분석에는 SPSS 22를 활용하였다.
IV. 연구결과
성취평가제를 다룬 언론 기사에서 TF가 높은 단어는 ‘성취평가제’, ‘고교학점제’, ‘학생’, ‘도입’, ‘고등학교’, ‘평가’, ‘과목’, ‘대입’, ‘절대평가’, ‘내신’ 등의 순으로 확인되었다(<표 3> 참고). TF 상위 단어가 등장한 원문을 살펴보면, 주로 ‘성취평가제’의 개념을 소개하면서, ‘고교학점제’의 ‘도입’에 따라 ‘고등학교’ ‘학생’들에게 필요한 준비에 대한 정보를 제공하는 언론 기사들이 확인되었다. 또한, 성취평가제가 ‘절대평가’ 방식으로 ‘내신’을 ‘평가’하는 변화임을 설명하면서, ‘과목’에 따른 적용 방향을 ‘대입’과 연계하여 설명하는 기사들이 주로 포함되었다.
수집된 언론 기사에서 TF-IDF가 높은 단어는 ‘도입’, ‘학생’, ‘대입’, ‘고교학점제’, ‘평가’, ‘과목’, ‘고등학교’, ‘교육’, ‘내신’, ‘학교’ 등의 순이었다(<표 4> 참고). TF가 1순위인 ‘성취평가제’는 TF—IDF 상위 30위에 포함되지 않아, 수집된 문서에서 통상적으로 언급되는 단어임이 확인되었다. TF와 TF-IDF 상위 단어의 대부분은 중복되었고, TF-IDF만 상위에 포함된 단어는 ‘지원’, ‘학기’(음영 처리)였다. ‘지원’은 고교학점제 도입으로 성취평가제의 현장 안착을 위한 지원 방안이나 학생 평가를 위한 지원 방안의 필요성을 제기하는 맥락에서 등장하였다. ‘학기’는 입시에 성취평가제 점수가 반영되는 학기에 대한 정보를 담은 기사들이었다.
중요 단서 분석 시, ‘성취평가제’는 TF는 높지만 TF-IDF는 낮아 전체 문서에서 통상적으로 등장하는 가중치가 낮은 단어로 판단되었다. 이에 ‘성취평가제’는 삭제하고, 토픽모델링을 실시하였다. 수집된 자료에 포함된 최적의 토픽 수를 복잡도와 응집도 수치를 종합적으로 참고하여 결정하였다. 수치가 낮을수록 모형의 적합하다고 판단하는 복잡도는 토픽 수가 늘어날수록 감소하였다. 수치가 높을수록 모형의 일관성이 높다고 간주하는 응집도는 토픽 2개일 때 가장 높은 수치를 보였다. 3개 이후에도 수치가 감소하다가, 토픽 수가 6개, 7개, 12개 지점에서 다소 상승하는 패턴을 보였다(<표 5>, [그림 1], [그림 2] 참고).
이에 토픽 간 거리 맵(Intertopic Distance Map: IDM)을 함께 검토하였다([그림 3] 참고). 토픽 수가 2개~ 6개까지 토픽 간에 중복 현상이 없었으나 토픽 7개, 12개의 경우에는 중복이 발생함을 확인하였다. 이러한 분석 결과를 고려하여, 토픽 6개가 가장 적합하다고 판단하였다.
토픽 수는 6개로 지정하고 LDA 결과를 확인하였다. 토픽들에 포함된 주요 단어와 토픽에 포함될 확률은 <표 6>과 같다. 우선 토픽확률 상위 단어들이 여러 토픽 중복되는 경향이 확인되었으므로, 6개 토픽에 모두 포함된 단어를 제외하고 나머지 단어들을 중심으로 토픽 명 부여에 참고하였다(표에서 명암 표시). 동시에 언론 기사의 제목과 원문을 검토하면서 단어들이 사용된 맥락을 반영하여 토픽명의 적절성을 확인하였다. 각 토픽에 분류된 언론 기사의 예시와 이를 근거로 도출된 토픽 명은 <표 7>에 제시하였다.
토픽 1의 경우, 모든 토픽에 포함되지 않으면서 토픽확률이 높은 단어는 ‘교육’, ‘교육부’, ‘교육청’, ‘개편’, ‘적용’, ‘확대’ 등이었다. ‘고교학점제’는 모든 토픽에서 상위 단어였으며, 특히 토픽 1에서 토픽확률이 가장 높았다. 순위가 높은 단어들은 ‘교육부’의 고교학점제 단계적 이행 계획에 따른 교육과정과 평가 방식의 ‘개편’을 알리고 ‘교육청’ 중심으로 성취평가제의 ‘확대’에 대한 정보를 안내하는 기사와 관련되었다. 문서 토픽확률이 높은 언론 기사의 원문을 살펴보면, 교육청 주관의 고교학점제 설명회의 일부로 성취평가제가 소개된 내용들이었다. 전반적으로 교육부, 교육청 주도의 제도 안착 노력과 관련된 점을 고려하여, 토픽 1은 ‘정부의 안착 노력’으로 명명하였다.
토픽 2에서 다른 토픽들에 상위로 포함되지 않으면서 토픽확률이 높은 단어는 ‘학교’, ‘교육과정’, ‘교사’, ‘전면’, ‘반영’, ‘수업’ 등이었다. 5개 토픽의 토픽확률 1위 단어가 ‘고교학점제’였지만, 토픽 2만 유일하게 ‘학생’의 순위가 가장 높았다. ‘학생’은 고교학점제가 학생 선택권을 보장하는 가운데, 성취평가제가 학생성장을 지향하는 취지를 가지고 있음을 설명하는 맥락에 주로 등장하였다. 또한 ‘학교’ 단위에서 ‘교사’의 ‘수업’에 고교학점제와 성취평가제가 ‘전면’ ‘반영’되는 변화에 대한 정보와 관련이 있었다. 문서 토픽확률 상위 문서는 주로 성취평가제에 관한 교사 연수, 단위학교의 성취평가제 운영 사례를 다루고 있어, 교사 주도로 학교 단위의 수업에서 실행되는 성취평가제의 현황에 대한 주제로 이해되었다. 이에 토픽 2는 ‘학교 수준의 실행’으로 토픽 명을 정하였다.
토픽 3에서 모든 토픽에 포함되지 않았고 토픽 3에서 토픽확률이 높은 단어는 ‘전형’, ‘대학’, ‘전면’, ‘방안’, ‘교육청’, ‘교육’ 등이었다. 이들 단어는 고교학점제의 ‘전면’ 도입에 따라 ‘대학’ ‘전형’에 미치는 영향을 다룬 기사에 주로 등장하였다. 문서 토픽확률이 높은 언론 기사는 고교학점제와 성취평가제 도입에 따른 대입 전형의 변화, 시도교육감협의회의 교육의제로 해당 사안이 공론화되는 소식과 관련되었다. 또한 대학의 관점에서 고교학점제의 방향성을 제안하는 워크숍 소식이 확인되었다. 대학입시에 미치는 영향에 대한 내용이 주로 포함되었다는 점을 고려하여, 토픽 명은 ‘대입전형과의 연계’로 하였다.
토픽 4에서는 ‘교육’, ‘교육부’, ‘상대평가’, ‘확대’, ‘학교’가 모든 토픽에 포함되지 않으면서 토픽확률이 높은 단어였다. 이들 단어가 사용된 맥락을 살펴보면, 성취평가제를 ‘상대평가’에서 절대평가로 전환되는 ‘학교’ 평가 체제의 변동으로 설명하거나, ‘상대평가’와 절대평가를 지지하는 측에서 각각 부작용을 우려하는 주장들을 공유하는 내용이었다. 문서 토픽확률이 높은 언론 기사는 성취평가제의 신뢰도 제고를 위한 연수 소식, 특정 학교의 성취평가제 운영 사례, 입시학원의 고교학점제 대비 프로그램 개설 소식 등이었다. 토픽 4로 분류된 언론 기사들은 기존의 상대평가 방식이 성취평가제로 전환되었을 때 기대하는 교육적 효과와 함께, 큰 변화가 수반하는 교육 현장의 혼란에 대한 우려를 동시에 포함하였다. 따라서 토픽 명을 ‘변화에 대한 기대와 우려’로 부여하였다.
토픽 5에서는 ‘확대’, ‘성취도’, ‘학기’, ‘학교’, ‘성적’, ‘교육과정’, ‘반영’ 등이 토픽확률이 높으면서 모든 토픽에 공통으로 포함되지 않은 단어였다. 성취평가제 적용 시 입시에 반영되는 ‘학기’별 ‘성취도’, 또는 ‘성적’ 산출 방법에 대한 정보가 주로 포함되었다. 토픽 문서확률이 높은 언론 기사의 원문과 함께 검토하면, 과학고, 외고, 자사고의 입시 정보를 다루는 언론 기사가 높은 비중을 차지하였다. 즉, 중학교 성취평가제 ‘성적’이 고등학교 입시에 어떻게 ‘반영’되는지, 그 시기가 최근 ‘확대’됨에 따라 어떤 준비가 필요한지에 대한 내용이었다. 고등학교 입시를 위한 문서는 다른 토픽에서 확인되지 않았고, 문서 토픽확률 수치가 0.900 이상인 문서 51개 중 46개가 고등학교 입시에 반영되는 중학교의 성취평가제를 언급하였다. 해당 토픽에 포함된 문서들 중에는 고교학점제의 성취평가제 기사도 포함되었으나, 중학교 성취도, 성적에 대한 관심은 토픽의 차별성이 드러나는 부분이라 판단되었다. 이에 토픽 5는 ‘고등학교 입시부터 반영’으로 명명하였다.
토픽 6의 경우, ‘학교’, ‘교육’, ‘선택’, ‘상대평가’, ‘적용’, ‘성적’ 등의 단어가 모든 토픽에서 상위로 포함되지 않았지만 토픽 6에서 비교적 상위에 올랐다. 다른 토픽들과 비교하면 ‘선택’은 이 토픽에만 상위에 포함되어 토픽의 특성을 잘 보여줄 것이라 추측되었다. 원문을 참고하면, 고교학점제가 학생의 ‘선택’을 보장하는 새로운 시도로 교육환경 전반에 큰 변화를 유발하게 됨을 안내하는 내용들이었다. 토픽확률이 높은 문서들을 검토하면, 성취평가제를 포함한 교육의 변화가 이끈 마이스터고등학교의 학생 취업 성과, 고교학점제와 성취평가제의 도입에 대비하는 대학의 계획을 다룬 기사들이었다. 다른 토픽에서 중·고등학교 수준의 변화를 쟁점으로 다룬 것과 비교하면, 고등학교 이후 취업시장이나 대학입시에 미치는 사회적 파급력에 대한 관심이라 볼 수 있다. 이에 토픽 6은 ‘교육적·사회적 영향’으로 명명하였다.
토픽모델링 결과를 연도별로 정리하여 언론 기사의 빈도를 <표 8>과 같이 정리하고, 토픽의 비중을 [그림 4]에 제시하였다. 성취평가제 관련 언론 기사의 전체 빈도는 2018년 대비 2019년에 증가하다가 2020년에 감소하고, 이후 2023년까지 증가하는 양상을 나타냈다.
모든 토픽은 연도별 비중을 기준으로 지속해서 증가하거나 감소하기보다, 증감을 반복하는 양상을 나타냈다. 전년 대비 10% 이상의 차이가 나타난 토픽은 2020년의 토픽 2(13.16% 증가)와 토픽 6(12.63% 감소), 2021년의 토픽1(15.82% 증가)과 토픽 2(14.00% 감소), 2024년의 토픽2(10.12% 증가)였다. 2020년은 2018년에「2022학년도 대학입학제도 개편방안 및 고교교육 혁신방향」에 따라 진로선택과목에 성취평가제가 적용되면서 학교 현장의 정착 노력이 가시화된 시기이며, 2021년은 「포용과 성장의 고교교육 구현을 위한 고교학점제 종합추진계획」에서 성취평가제 확대가 발표된 시기이다. 2024년은 2025학년도 고교학점제 전면 도입을 앞둔 시점이라는 점에서 교육부의 정책 방향에 따라 순차적으로 학교 현장의 실행이 이어지면서 토픽의 비중에도 영향을 미친 것으로 파악된다.
성취평가제를 다룬 언론 기사의 토픽이 시간의 흐름에 따라 토픽에 어떠한 변화가 있는지 확인하고자 토픽별 시계열 회귀분석을 수행하였다. 우선 Durbin-Watson 검증 결과, 토픽별 d 통계량이 모두 2에 근접(1.710~1.891)하여 잔차의 자기상관은 없는 것으로 판단하였다. 토픽별 시계열 회귀분석에서는 토픽 2(학교 수준의 실행)만 회귀계수가 정적으로 유의하여 상승 토픽임이 확인되었다. 반면 나머지 5개 토픽은 회귀계수가 통계적으로 유의하지 않아 중립 토픽으로 분류하였다.
V. 논의 및 시사점
이 연구는 성취평가제에 대한 사회적 인식을 확인하여, 2025년 고교학점제 도입과 함께 확대 적용을 앞둔 성취평가제가 교육 현장에 참고할 수 있는 시사점을 모색하고자 수행되었다. 사회적 인식을 파악하기 위하여 ‘성취평가제’라는 키워드를 포함한 언론 기사 빅데이터를 수집하여, 주요 단어의 특성과 자료에 포함된 주제들을 도출하고 시간에 따른 토픽의 변화 양상을 확인하였다. 언론 기사는 정부, 학생, 학부모, 교사를 포함한 여러 교육 주체의 사회적 인식을 통합적으로 확인할 수 있는 빅데이터라는 점에서 성취평가제의 실체를 이해하는 자료로 의미가 있으며, 그 시사점을 성취평가제 운영과 이를 지원하는 연구 방향 도출에 참고할 수 있으리라 기대된다. 연구의 주요 결과와 이에 따른 시사점은 다음과 같다.
첫째, TF 분석과 TF-IDF 분석으로 언론 기사 빅데이터상의 중요 단어를 확인하고 그 특성을 파악하였다. TF 분석 결과, ‘성취평가제’, ‘고교학점제’, ‘학생’, ‘도입’, ‘고등학교’, ‘평가’, ‘과목’, ‘대입’, ‘절대평가’, ‘내신’과 같은 단어의 출현 빈도가 높았다. 자료 수집에 활용한 키워드 ‘성취평가제’를 제외하면, ‘고교학점제’의 빈도가 가장 높았다. TF-IDF 분석에서 ‘성취평가제’는 상위 단어에 포함되지 않았고, 그 외에 ‘도입’, ‘학생’, ‘대입’, ‘고교학점제’, ‘평가’, ‘과목’, ‘고등학교’, ‘교육’, ‘내신’, ‘학교’ 등이 특정 문서에 집중적으로 출현하여 가중치를 가지는 단어로 확인되었다. TF와 TF-IDF 분석 결과에서 ‘성취평가제’를 제외하면 상위 단어 대부분이 중복되었으므로, 상위 순위의 ‘도입’, ‘학생’, ‘대입’, ‘고교학점제’, ‘평가’, ‘과목’, ‘내신’ 등이 성취평가제의 사회적 인식을 이해하는 데에 중요한 단어임을 확인할 수 있었다. 단, TF-IDF 분석에서만 상위에 포함된 단어는 ‘지원’, ‘학기’였으며, 고교학점제 맥락에서 성취평가제의 안착을 위한 지원 방안, 성취평가제 결과에 반영되는 학기 정보 차원에서 활용되었다. 선행연구로서 장은아와 정혜원(2024)의 연구는 성취평가제 도입이 발표된 2011년부터 2024년까지 게재된 학술논문에 대한 텍스트마이닝을 실시했다. 이 연구에서 TF 상위 순위 단어는 ‘학습’, ‘성취수준’, ‘학교’, 교과’, ‘수업’, ‘교육과정’ 등이었고, TF-IDF 상위 순위 단어는 ‘성취수준’, ‘교육과정’, ‘방안’, ‘수업’, ‘적용’, ‘개발’ 등이었다. 이러한 결과를 통해 성취평가제 연구가 학습 환경 및 교육과정, 성취평가제 개선 방안, 교과별 성취개발 및 성취수준 보장에 관한 주제에 집중된 것으로 해석되었다. 앞서 수행된 학술논문 분석 결과와 본 연구 결과를 비교하면, 언론 기사 빅데이터의 중요 단어로 확인된 ‘고교학점제’, ‘도입’, ‘학생’, ‘대입’, ‘과목’, ‘내신’ 등은 성취평가제에 대한 사회적 인식에서 고교학점제의 도입, 학생의 내신 평가, 대입에서의 활용 측면이 중요한 요소임을 시사한다.
둘째, 토픽모델링을 통해 언론 기사에 형성된 사회적 인식을 6개 주제로 분류하였다. 각 주제는 ‘정부의 안착 노력(토픽 1)’, ‘학교 수준의 실행(토픽 2)’, ‘대입전형과의 연계(토픽 3)’, ‘변화에 대한 기대와 우려(토픽 4)’, ‘고등학교 입시부터 반영(토픽 5)’, ‘교육적·사회적 영향(토픽 6)’으로 명명하였다. 학술논문을 대상으로 토픽모델링을 실시한 장은아와 정혜원(2024)은 성취평가제 연구에 포함된 주제를 ‘교수학습 설계’, ‘고교학점제 도입’, ‘성취수준 개발 및 교사 인식’이라는 3개 토픽으로 정리하였다. 본 연구의 결과와 비교하면, ‘정부의 안착 노력(토픽 1)’, ‘대입전형과의 연계(토픽 3)’는 교육제도의 변화와 활용을 다루는 토픽이라는 점에서, 고교학점제 도입에 따른 적용 방안 및 대학입시 제도 연구들이 포함된 ‘고교학점제 도입’ 토픽과 유사한 맥락이라고 볼 수 있다. 한편 ‘학교 수준의 실행(토픽 2)’은 학교별 성취평가제 운영 사례, 평가 역량 개발을 위한 교사 연수 관련 내용이 포함되었다는 점에서, 성취수준과 문항 개발, 교사의 인식과 평가 역량 연구가 포함된 ‘성취수준 개발 및 교사 인식’ 토픽과 부분적으로 일치하였다. 반면, 학술논문 대상 연구에서 도출된 ‘교수학습 설계’와 유사한 토픽은 확인되지 않았으며, ‘변화에 대한 기대와 우려(토픽 4)’, ‘고등학교 입시부터 반영(토픽 5)’, ‘교육적·사회적 영향(토픽 6)’은 새롭게 확인되었다. 즉, 고교학점제를 중심으로 학생 평가 체제로서 성취평가제의 특성을 이해하고 수업 모형을 개발하는 학술적 관심과 비교하면, 언론 기사를 통해 형성된 사회적 인식은 교육제도의 변화가 유발하는 영향(변화에 대한 기대와 우려(토픽 4), 교육적·사회적 영향(토픽 6))과 중학교 성취평가제까지 포괄한 관심(고등학교 입시부터 반영(토픽 5))이 드러난다는 점에서 차별성을 가졌다.
셋째, 시계열 분석을 실시하여 시간 경과에 따른 토픽의 변화 추이를 확인하였다. ‘학교 수준의 실행(토픽 2)’는 회귀계수가 양적으로 유의하여 상승 토픽으로 확인되었다. 반면, 나머지 5개 토픽의 회귀계수는 통계적으로 유의하지 않아 중립 토픽으로 분류되었다. 즉 학교 수업에서의 실행에 대한 사회적 인식이 높아지는 가운데, 관련된 여러 다른 주제들은 시간의 흐름과 상관없이 비슷한 수준으로 공유된다고 해석될 수 있다. 이러한 결과는 학술논문에서 도출한 토픽의 시계열 회귀분석을 실시한 장은아와 정혜원(2024) 연구에서 ‘성취수준 개발 및 교사 인식’이 하강 토픽으로, ‘고교학점제 도입’이 상승 토픽으로 확인된 결과와는 다른 양상이었다. 이 연구에서 ‘성취수준 개발 및 교사 인식’으로 명명된 토픽은 「중등학교 학사관리 선진화 방안」(교육과학기술부, 2011)이 발표되면서 성취수준과 성취기준 개발 차원에서 다수 수행된 이후, 제도의 정착과 함께 비중이 감소한 것으로 해석되었다. 또한 2018년에「2022학년도 대학입학제도 개편방안 및 고교교육 혁신방향」(교육부, 2018)이 발표되면서, 중요한 교육정책의 변화가 ‘고교학점제 도입’ 연구의 증가에 영향을 주었을 것으로 설명되었다. 학술논문을 대상으로 한 기존 연구 결과와 종합하면, 성취평가제 도입 초기에 ‘성취수준 개발 및 교사 인식’ 연구를 통해 현장 적용의 기반이 마련되었다면, 시간의 경과와 함께 ‘학교 수준의 실행’을 안정화하는 실질적 방안 대한 관심이 높아진 것으로 사료된다. 다만, ‘학교 수준의 실행’ 이외의 토픽들이 중립 토픽으로 확인된 결과는 2025년 고교학점제 전면 도입으로 수업에서의 성취평가제 실행은 시급한 당면 과제가 되었으나, 기타 여러 쟁점에 대해서는 교육제도나 운영 차원에서 두드러진 개선이 없어 유사한 논의가 반복되고 있음을 시사하는 것은 아닌지 조심스럽게 추측하게 된다.
주요 결과를 종합하면, 언론 기사를 중심으로 형성된 사회적 인식은 성취평가제를 고교학점제의 맥락에서 바라보고 있으며, 학교 수준의 실행과 대학입시에 미치는 영향을 중요한 쟁점으로 포함하는 것으로 이해된다. 언론 기사를 통해 드러난 성취평가제에 대한 사회적 인식을 토대로 향후 운영과 연구의 방안을 다음과 같이 제시하고자 한다.
첫째, 성취평가제가 가진 본연의 교육적 의미에 대한 사회적 인식이 보다 강화될 필요가 있다. 본 연구에서 고교학점제는 성취평가제를 이해하기 위한 핵심 개념이었다. ‘고교학점제’는 TF와 TF-IDF 분석 모두에서 상위의 단어였고, 토픽모델링으로 도출된 토픽 6개 중 5개에서 토픽확률이 가장 높은 단어였다. 수집한 언론 기사의 대부분에서 성취평가제는 고교학점제의 추진 경과나 구성 내용을 공유하는 맥락에서 등장하였다. 성취평가제를 다룬 선행연구들 역시 성취평가제를 고교학점제의 학생평가 방식으로 설명하거나(박혜영 외, 2022) 고교학점제 도입에 따라 주목해야 할 변화로 언급하고 있어(고영빈, 지은림, 2022), 고교학점제는 현시점의 성취평가제 실체를 설명하는 가장 중요한 요인으로 판단된다. 그러나 성취평가제는 고유한 평가 기능을 바탕으로 고교학점제 논의 이전부터 도입, 적용되어 온 평가 방식이다. 성취평가제의 교육적 의미는 학생의 학업성취에 대한 학교의 책무성을 강화하고, 서열 중심 평가로 유발되는 불필요한 경쟁에서 벗어나 창의적인 교실수업을 구현하며, 결과적으로 학생의 진로, 적성, 흥미를 살리는 학교교육의 경쟁력을 강화할 수 있다는 점에서 찾을 수 있다(국가기록원, 2024). 그런데 급격한 제도 변화로만 성취평가제에 대한 사회적 인식이 형성된다면, 특히 교사, 학생, 학부모와 같은 이해관계자들은 개인 차원의 유불리를 따지는 데에 급급해질 수 있다. 결과적으로 성취평가제 본연의 방향성을 잃고 고교학점제 안착이 가능한 방식으로 조정되는 타협이 이루어지지 않도록 주의가 필요할 것이다. 이러한 측면에서, 국가, 교육청 차원의 교육과 홍보는 더욱 확대되어야 한다. 다만, 제도에 대한 정보적 전달에 그치는 것이 아니라, 창의적 교실수업 구현과 학교교육의 기능 회복의 가능성을 확인하는 자리가 되어야 한다. 이러한 관점에서, 국가와 교육청의 지원 속에서 단위학교가 교사, 학생, 학부모와 성취평가제의 가치와 시행 방향을 공유하는 기회가 마련되길 기대한다. 이러한 상호 소통의 장은 단위학교별 성취수준 설정과 평가 피드백을 실시하는 데에도 실질적인 도움을 제공함으로써, 학교 현장에서 성취평가제 본연의 가치를 실현하는 데에 기여할 것이라 여겨진다.
둘째, 성취평가제와 대학입시의 현실적 연계 방안에 대한 연구가 필요하다. TF와 TF-IDF 분석 결과에서 ‘대입’, ‘내신’은 순위가 높은 단어였다. 또한 토픽모델링을 통해 도출된 ‘대입전형과의 연계(토픽 3)’, ‘교육적·사회적 영향(토픽 6)’ 토픽은 성취평가제 실행의 결과로 대학입시에 미치는 영향과 관련된 것이었다. 정책과정(policy process)을 정책형성, 정책산출, 정책집행, 정책평가로 구분한다면(Copper, Fusarelli, & Randall, 2004), 성취평가제는 형성과 산출 단계를 거치면서 고교학점제 전면 도입으로 집행 단계에서 새로운 국면이 시작된 것으로 이해된다. 이에 정책평가에 대한 관심이 높아진 시점이라 볼 수 있다. 고교학점제 맥락으로 이해되고 있는 성취평가제에 대한 평가는 대학입시와의 안정적 연계를 기준으로 이루어질 것으로 추측된다. 실제로 성취평가제는 2011년 도입 이후, 처음 계획과 달리 적용 범위가 조정되거나 전면 도입 시기가 여러 차례 유예되었는데, 대학 입시전형 자료로서의 안정성 문제가 주원인이었다(장은아, 정혜원, 2024). 이러한 문제 인식은 성취평가제의 결과를 대입에 활용하는 방안을 탐색하는 연구가 일부 이어지고 있으나(신윤범, 원효헌, 2021; 이명애, 2021; 조원기, 황우원, 2024), 학술논문 대상의 토픽모델링 결과에서 대학입시와의 연계성을 다룬 연구는 별도의 토픽으로 도출되지 않았다(장은아, 정혜원, 2024). 이는 사회적으로 중요하게 인식하는 성취평가제 쟁점과 학술연구의 흐름 사이에 간극이 존재한다는 의미로 이해될 수 있다. 성취평가제와 대학입시의 연계 방안은 다양한 접근이 가능할 것이다. 예를 들어, 전형 자료로서 성취평가제의 변별력 문제를 보완하기 위해 학생부교과전형 측면에서 수능최저학력기준이나 정성평가를 도입하는 방안, 학생부종합전형에서 교과별 세부능력 및 특기사항을 정교하게 관리하는 방안, 고교학점제와 수능 체제의 연계성 강화 방안 등이 제안되고 있으나 구체적인 실행전략으로 반영되지는 못하고 있다(조원기, 황우원, 2024). 우리 사회의 대학입시에 대한 높은 관심을 고려할 때, 사회적 인식에 부합하는 대입 관련 성취평가제 연구는 현장의 요구가 높다고 판단된다.
셋째, 중등교육의 관점으로 성취평가제 연구가 확장될 필요가 있다. 본 연구에서 고교학점제는 성취평가제의 사회적 인식을 설명하는 대표적인 개념으로 확인되었다. 최근의 성취평가제 관련 학술연구들도 대부분 고등학교를 대상으로 수행되고 있다(고영빈, 지은림; 2022). 반면, 본 연구에서 도출된 ‘고등학교 입시부터 반영(토픽 5)’ 토픽에 포함된 언론 기사의 다수에는 과학고, 외고, 자사고 등 고등학교 입시에 반영되는 중학교 성취평가제가 다루어졌다. 즉, 성취평가제에 대한 사회적 인식은 중학교와 고등학교를 포괄하여 형성된 것으로 이해된다. 실제로 성취평가제는 「중등학교 학사관리 선진화 방안」(교육과학기술부, 2011)의 발표로 중학교부터 적용되고 있다. 그러나 중학교 성취평가제를 대상으로 한 선행연구는 고등학교 연구에 비해 상대적으로 적고(김석우, 2014; 박소영, 김정현, 2016; 박지선, 김인숙, 2018), 그나마 2022 개정 교육과정을 반영한 최근 연구는 아직 확인되지 않는다. 2025년 고교학점제 전면 도입이라는 중요한 현안이 있기에 정책적, 학술적 관심이 고등학교에 집중된 것으로 이해되지만, 실제 대중이 공유되는 사회적 인식을 반영한 학술적 논의가 이루어지지 못한 상황이라 할 수 있다. 중학교 성취평가제는 대학입시나 취업과 직결되는 고등학교 맥락과 다른 접근이 필요하다. 더욱이 내신에 상대적으로 불이익을 감수해야 했던 외고, 자사고는 성취평가제로 이 문제를 보완할 수 있는데, 외고, 자사고 존치가 결정됨에 따라(경북일보, 2024.08.11.), 고등학교 입시와 연계된 성취평가제 연구에 대한 요구는 더욱 높아질 것으로 예상된다. 특히 고등학교 입시에서의 성취평가제는 중학교와 고등학교 교육과정의 체계적 연계를 기반으로 논의될 수 있으므로, ‘중등교육’이라는 거시적 관점으로 성취평가제 연구의 방향이 고려되어야 할 것이다.
넷째, 교사의 평가 역량 개발을 위한 연구와 이를 반영한 현장 지원이 강화되어야 할 것이다. 도출된 토픽이 시간의 경과에 따라 어떤 변화를 보이는지 확인한 결과, ‘학교 수준의 실행(토픽 2)’은 상승 토픽으로 확인되었다. 나머지 5개 토픽이 중립 토픽인 점을 고려하면, 상승 토픽에 대한 사회적 관심에 부응하는 연구와 지원이 더욱 강화되어야 할 것으로 여겨진다. 학교 수준에서 성취평가제 실행을 지원하는 대표적인 방안은 평가 운영의 주체인 교사의 역량에 대한 지원일 것이다. 성취평가제 실행 중, 교사가 온정주의에 휘둘려 성적과대평가를 하거나(양길석 외, 2020), 미이수 기준을 처음부터 낮게 설정하여 미이수 학생의 표면적 숫자를 줄이고 책임교육의 부담을 줄이려는 경향(오마이뉴스, 2024.7.29.)이 발생하는 이유는 결국 교사의 평가 역량 문제에서 찾게 된다. 교사의 평가 전문성 확보는 성취평가제 도입 초기부터 꾸준히 강조되었으나(이광상, 2023; 조용, 2023; 지은림, 2011), 평가 전문성에 중점을 둔 연구 자체가 미흡한 실정이다(장은아, 정혜원, 2024). 이에 선행연구는 성취기준과 성취수준의 개발 원리, 분할점수 산출 방법, 미이수제 및 책임교육 운영 방법과 같이 보다 세부적인 교사 역량이 개발되어야 한다고 제안한다(박혜영 외, 2022; 이정연 외, 2023). 이러한 주제는 교사 평가 역량 개발을 위한 구체적인 내용이 되어야 한다. 동시에 교육청 단위의 평가관리센터 및 기초학력지원센터(이정연 외, 2023)의 운영은 학교 수준의 성취평가제 실행에 실질적인 지원 체계가 될 것이다. 나아가 데이터 기반의 평가관리 시스템의 구축과 활용의 필요성이 제기된다. 교사는 성취수준 데이터, 평가문항, 평가 결과 등이 축적된 정보를 활용하여 평가 업무의 부담을 덜고, 학생과 학부모는 학생의 성장과정을 관찰하면서 성취평가제의 교육적 효과를 자연스럽게 공유할 수 있을 것이다.
본 연구의 한계점을 반영하여, 다음과 같이 후속 연구를 제안하고자 한다. 첫째, 본 연구는 언론 기사만을 수집, 분석하였다. 언론 보도 자료는 특정 주제에 대한 사회적 인식을 반영하는 대표적인 빅데이터이지만, 언론사가 선별한 정보가 기사화된다. 또한 특정 기관의 홍보성 기사나 정책 현안 브리핑 자료를 여러 언론사가 기사화하는 경우, 분석 결과를 대중의 사회적 인식으로 확대하여 해석될 수 있기에 주의가 필요하다. 이에 교육 관련 커뮤니티 및 SNS를 포함한 소셜미디어 자료나 학술논문 등 다른 유형의 빅데이터와 비교 분석(조은별, 민지연, 박수원, 2020), 언론 기사의 댓글에 대한 분석(조효제, 길혜지, 2022)을 추가함으로써, 자료 유형에 따른 해석의 한계 문제를 해소할 수 있을 것이다.
둘째, 빅데이터 수집을 위한 주제어의 확장을 고려할 수 있다. 본 연구는 ‘성취평가제’만을 자료 수집 주제어로 사용하여 문제의식을 명확히 하고자 하였다. 우선, 성취평가제 맥락을 드러내는 주제어를 추가하는 방법을 고려할 수 있다. 관련 선행연구들을 살펴보면, 성취평가제와 관련이 있지만 제목이나 주제어에 ‘성취평가제’가 직접 드러나지 않고, ‘학생평가(이명애, 김성혜, 김영은, 2020)’, ‘최소 성취수준 보장’(조용, 2023), ‘이수·미이수제’(김영은, 노은희, 2020) 등의 용어가 사용된 사례가 확인된다. 또한, ‘학생’, ‘교사’, ‘학부모’ 등 주요 이해관계자를 추가로 검색 및 분석에 활용하는 방안이 있다. 대상별 사회적 인식에 대한 분석은 성취평가제의 현장 운영 및 제도적 시사점을 더욱 구체적으로 모색하도록 도울 수 있을 것이다. 다만, 현재 시점에 수집된 언론 기사는 1,588건이었다. 이는 토픽모델링에 필요한 최소 문서 수(약 700건)보다는 많지만 충분한 규모(약 2,000건)는 아니었다(전은정, 최윤정, 2023). 따라서 대상별로 문서를 분류한다면 문서 수의 감소로 해석에 제한이 발생할 수 있을 것이다. 제도 운영의 경과에 따라 추가로 축적된 자료를 활용한 후속 연구가 가능할 것으로 기대한다.
마지막으로, 텍스트마이닝 기법을 확대하여 사회적 인식의 새로운 관점을 탐색할 수 있을 것이다. 텍스트마이닝은 추출된 단어들이 문맥에 따라 미묘하게 달라지는 다의성을 포착하기에 근본적인 어려움이 있다는 점을 고려하여(Pollak, Coesemans, Daelemans & Lavrač;, 2011), 본 연구는 연구진 이외의 전문가 검토를 병행하였으나 방법론적 한계는 여전히 남아 있다. 전문가 검토와 같은 질적 보완과 함께, 다른 텍스트마이닝 기법으로 결과의 타당성을 확대할 수 있을 것이다. 예를 들어, 특정 단어와 연이어 출현하는 단어의 패턴을 분석하는 N-gram 분석, 빅데이터의 구조를 이해하기 위해 단어 간의 연결중심성, 매개중심성, 근접중심성을 확인하는 키워드 네트워크 분석, 중요 단어에 대한 가치를 긍정적, 부정적 감정을 이해하는 감정 분석 등은 성취평가제에 대한 사회적 인식 특성의 다른 측면을 보여줄 것이라 기대된다.