4. 결론 및 향후연구
본 논문에서는 RDR을 이용하여 형태소와 구문 분석, 개체명 말뭉치의 오류를 수정하는 방법에 대한 연구를 진행하였다. 형태소의 경우 임계치가 (15-3)일 때 생성한 규칙을 통해 오류가 7,503개에서 5,096개의 오류를 수정하여 말뭉치 성능이 기존 97.12%에서 99.08%로 1.96% 증가하였다. 구문 분석은 임계치가 (15-4)일 때 생성한 규칙으로 오류가 9,682개에서 4,728개의 오류를 수정하여 말뭉치의 성능이 92.46%에서 96.14%로 3.68% 증가하였다. 개체명은 임계치가 (10-1)일 때 생성한 규칙으로 오류가 217개에서 64개의 오류를 수정하여 말뭉치 성능이 97.39%에서 98.16%로 0.77% 상승하였다. 형태소와 구문의 경우 RDR로 생성한 규칙에 의해 많은 오류를 수정하여 말뭉치의 성능을 높히는데 좋은 성능을 보였으나, 개체명의 경우 커널을 이용한 주변 정보보다는 어휘에 의존도가 높기 때문에 상대적으로 낮은 오류 수정률을 보였다. 향후 연구로는 학습 시에 사용되는 임계치는 처음에 고정된 값으로 모든 유형의 오류가 동일한 임계치에 적용되어 생성된다. 따라서 각 오류에 적합한 임계치를 찾기 보다는 말뭉치의 오류를 가장 많이 수정할 수 있는 임계치를 찾는 방법으로 실험이 진행되었다. 이를 개선할 수 있는 방법으로 학습 하는 동안에 시스템이 각 오류 유형에 따라 자동으로 임계치를 결정하는 알고리즘을 적용한 시스템을 구축하려 한다. 또한 오류 정량화 시스템과 RDR 시스템을 결합하여 말뭉치를 반자동으로 생성 및 관리하는 시스템을 구축할 계획이다.