KBS한국어능력시험 등급부여 시스템(특허출원 제10-0038483호)은 국어사용능력을 평가하고 등급화 하는 방법에 관한 것으로 누적된 응시자 점수와 실제 언어수행능력 사이의 상관관계를 DB로 구축한 후 이를 토대로 등급을 부여하는 메커니즘을 산출하고, 매회 시험마다 다른 문항 특성이 반영되어 등급을 나누는 경계 점수가 연동하는 과학적인 평가 메커니즘에 관한 것임.
이는 국어사용능력평가 점수와 등급이 실제 언어수행능력을 얼마나 예측할 수 있느냐와 관련된 문제로 맞은 개수를 토대로 평가 기관이 임의적으로 구분한 등급을 부여하는 기존의 방법과는 달리 체계적인 평가 시스템으로 접근하는 것을 특징으로 함.
KBS한국어능력시험 등급 부여 시스템은 쉽게 출제된 시험에 응시한 수험생이 자신의 능력보다 높은 등급을 받는 것과 어렵게 출제된 시험에 응시한 수험생이 자신의 능력보다 낮은 등급을 받는 모순을 해결함은 물론, 동점자라도 변별력이 높은 문항의 정답률이 높은 수험생이 더 높은 등급을 받도록 해야 하는 과제를 해결한 평가 시스템으로 대단위 국어사용능력 평가에 유용하게 활용할 수 있음.
언어능력시험의 결과 표시 방식은 크게 등급제와 점수제로 구분할 수 있음.
등급제는 수험생의 언어숙달도의 위계를 미리 몇 개의 등급으로 나누고 해당 등급 수준에 도달해 있는지 여부를 테스트 받도록 하는 제도임. 현재 한국어를 모국어로 하지 않는 외국인 및 재외 동포를 대상으로 실시하는 한국어능력시험(한국교육과정평가원)이 이러한 방식을 채택하고 있음. 이 시험은 모두 6개의 등급별로 문제를 다르게 출제하여 정답률이 60%(과락 40% 적용)를 넘으면 합격으로 판정을 하는 방식을 취함. 수험자가 자신이 응시할 등급을 정하여 응시한 다음 합·불 여부를 판정하는 간단한 시스템이지만 두 개 등급을 동시에 응시한 응시자가 하위 등급은 불합격한 반면 상위 등급은 합격하는 모순이 발생하는 경우도 있음.
표면상 점수제와 등급제를 절충하는 경우도 있음. 이 경우는 맞은 개수(원점수)를 토대로 출제 기관이 임의적으로 작성한 등급표에 의해 등급을 부여하는 방식임. 이는 시험은 점수제로 실시하면서 원점수를 토대로 급간을 구분한 것이기 때문에 결국 점수제로 볼 수 있음. 이 방식은 문항의 배점을 달리하는 방식을 통해 변별력을 조절하기 때문에 한 세트를 구성하는 문항들의 난이도에 따라 국어사용능력이 변동하는 모순을 피할 수 없음.
점수제는 언어능력을 테스트하는 한 세트의 시험 문제로 특정 언어의 숙달도를 점수로 표시해주는 제도임. ETS의 토익과 토플, KBS한국어능력시험(KBS한국방송)이 이러한 방식을 사용하고 있음.
2008학년도 대학입학 수학능력시험부터 도입하는 9등급제는 전체 응시자 중에서 수험자의 위치를 산출한 석차백분율을 토대로 등급을 구분하는 방식을 취함. 따라서 언어영역의 등급이 국어사용능력의 수준을 의미한다고 볼 수 없으며, 단지 전국 응시자 중에서 어느 정도의 득점을 했는지를 가늠할 수 있을 뿐임. 엄밀히 말해서 이는 등급 부여 시스템이라고 볼 수 없음.
지필검사 방식의 KBS한국어능력시험에 3회 이상 응시한 대단위 응시자 중에서 언어수행능력 평가 데이터베이스(DB)를 구축하기 위해 주기적으로 준거집단(reference group)을 추출합니다. 표본추출프레임(sampling frame)은 점수 변동이 안정된 응시자를 대상으로 각 점수대별로 고르게 분포하게 구성하고 추출은 단순 무작위추출을 원칙으로 합니다.
준거집단으로 선정된 응시자를 대상으로 실제 직무와 관련된 말하기 및 쓰기 과제를 부여하여 실제 직무를 수행할 수 있는 언어수행능력을 평가합니다. 과제는 다음과 같이 네 가지 영역으로 구분하며 특정 영역에 종사하는 응시자가 유리하지 않도록 수행 과제를 선정합니다.
영역 | 과제사례 | |
---|---|---|
쓰기 | 조건 제시형 과제 | 기획서 쓰기 |
자유 과제 | 자유 작문 | |
말하기 | 조건 제시형 과제 | 설명(프레젠테이션) |
자유 과제 | 설득(대담) |
* 사진은 2007년 2월 KBS연수원에서 실시한 언어수행평가 실시 장면
수행평가 심사관으로 참여한 전문가 집단 협의를 통해 언어수행능력의 성취 수준을 기술하는 정성지표(등급표)를 구안합니다. 언어수행능력 등급표는 하위단계에 대한 기능의 습득이 상위 단계의 기능 습득으로 발전하는 구조를 취하되 등급별로 성취해야 할 지식수준과 기능수준을 구별하여 기술합니다. (이러한 정성지표는 사회적 요구를 반영하여 주기적으로 갱신할 수 있습니다.)
준거집단의 언어수행능력을 체크리스트로 계량화하여 다수 평가관의 평균점수를 부여합니다. 평가자 간 편차가 큰 점수를 보정하는 과정을 거쳐 다음과 같이 언어수행능력 데이터베이스(DB)를 구축합니다.
관리번호 | 국어능력시험 점수(990점 만점) | 언어수행능력 점수 (100점 만점으로 환산) | |||||
---|---|---|---|---|---|---|---|
A-001 | 3회 | 4회 | 5회 | 쓰기① | 쓰기② | 말하기① | 말하기② |
780 | 810 | 805 | 85.33 | 90.67 | 78.00 | 82.33 |
이전 단계에서 구축한 정성지표 및 준거집단의 국어능력시험 점수와 언어수행능력시험 점수를 분석하여 선형 방정식을 도출합니다. 결국 지필평가를 통해 취득한 듣기·읽기(Listening and Reading)능력과 언어수행평가에 해당하는 말하기·쓰기(Speaking and Writing) 사이의 관계를 하나의 식으로 도출하는 것이 이 단계의 핵심입니다. 이러한 과정을 거쳐 토대로 전체 응시자의 국어능력시험 점수(990만점)에 해당하는 추정 성취도를 도출한 다음 정성지표에 맞게 국어능력 등급을 부여합니다