본 논문은 모델 학습 과정에 있어서 반자동으로 학습 말뭉치의 오류를 수정하고, 학습 말뭉치의 양을 늘일 수 있는 시스템의 기반 연구를 진행하였다. 본 논문에서는 커널 RDR을 이용하여 말뭉치의 오류를 자동으로 수정할 수 있는 규칙을 생성하는 시스템을 구축하였다.
2. 관련 연구
2.1. RDR
RDR(Ripple-Down Rules)은 1993년 Edwards 와 Compton이 화학 병리학 보고서에 대한 병리학 유지 보수 시스템[10]에 처음 도입하였다. 이후 환자 관리에 도움을 주고자 RDR을 사용하여 화학 보고서에 주석을 작성하는 작업을 수행하였다[11]. 이 과정에서 RDR은 지식 기반 시스템을 구축하도록 수정되며 SCRDR(Single Classification Ripple Down Rules)과 MCRDR(Multiple Classification Ripple Down Rules), NRDR(Nested Ripple Down Rules) 등 다양한 형태의 RDR이 만들어졌다[12]. SCRDR은 입력된 값으로부터 하나의 결과를 출력하며, MCRDR은 한 개 이상의 결과를 출력한다. NRDR은 사용자가 정의한 임의의 조건에 따라 결과를 출력한다. 형태소 품사 태그 또는 개체명 태그 오류를 수정하는 작업을 수행하기 위해서는 입력된 오류 태그를 올바른 하나의 정답으로 수정할 수 있는 SCRDR이 적합하다. 따라서 본 실험에서는 SCRDR을 이용한 시스템을 구축하였다.