[컴퓨터공학 논문] 독일어 명사합성어의 기계분석 모델

1. [컴퓨터공학 논문] 독일어 명사합성어.hwp
2. [컴퓨터공학 논문] 독일어 명사합성어.pdf
[컴퓨터공학 논문] 독일어 명사합성어의 기계분석 모델
독일어 명사합성어의 기계분석 모델

1. 서론

본 논문의 목적은 독일어 명사합성어(Nominalkomposita)의 분석을 기계적으로 처리하기 위한 방법을 제시하는 것이다. 독일어는 어느 언어보다 명사합성어의 비중이 매우 높은 언어이다.1)1) SPRING-Corpus라는 독일 신문 자료에서 추출한 수천만의 어휘를 가지고 이루어진 한 실험 결과에 따르면, 사용된 전체 명사 중 명사합성어의 비중이 30.74%이며, 사용된 어근들 중 명사합성어에 사용된 어근이 90.62%라고 보고되었다.
그런데, 자연언어처리에서 독일어 명사합성어를 모두 사전에 등록시켜 단일어로 처리하는 것은 이미 많은 수가 존재하고 생산력이 강한 점을 고려할 때 적절하지 못하며 단기간에 수작업으로 처리해 내기가 매우 어렵다. 특히, 인간의 생성능력을 고려할 때 인터넷을 포함한 각종 신문, 잡지, 서적 등의 실세계 문서에는 날마다 새롭게 명사합성어가 생산되고 있어 이러한 문서들을 효과적으로 처리하기 위해서 독일어 명사합성어의 분석이 필수적이며 이는 현재 자연 언어 처리 분야의 중요한 문제이다.
명사합성어에 대한 맞춤법 검사는 명사합성어에 대한 분석 없이는 맞는 단어를 오류로 판단할 수도 있기 때문에 명사합성어의 분석이 필요하다. 문서검색기에서도 명사합성어를 색인하는 과정이나 검색어를 분석하는 과정에서도 명사합성어의 분석이 필요하다. 예를 들어, Wissenschaft라는 검색어를 통해 Naturwissenschaft나 Geisteswissenschaft 등의 명사합성어를 가진 문서도 검색해 낼 필요가 있다면 명사합성어의 분석이 필요하다. 독영 기계번역시스템에서 명사합성어의 대역어를 결정하는 문제를 위해서도 명사합성어의 분석이 필요하다. 독일어의 Hauswein은 영어로 번역될 때 단순히 대역어가 존재하지 않고 형태 분석을 통해 house wine으로 번역될 수 있다. 독일어의 등위접속구문을 분석하는 파서에서도2)2) 이민행(1998) 참고.
....