의미분석

Saltlux

Jump to: navigation, 찾기

의미분석은 자연어 구문분석 과정을 통해 구문트리 (Parsing Tree)가 생성된 이후에는
각 어휘의 의미애매성을 해소하는 일련의 과정을 의미합니다.

예를 들어 "배"라는 단어의 경우는 "과일의 배", "신체의 일부인 배", "선박을 지칭하는 배" 등의 똑같은 형태소이면서도 다른 의미를 가지고 있습니다.

이러한 의미애매성 해소는 기계번역과 정보검색 등에 활용될 수 있습니다.

기계번역의 예를 든다면 “I love apple. “라는 문장의 경우에서는
love: 사랑하다, 좋아하다, apple: 사과, 애플컴퓨터

나는 사과를 사랑하다, 나는 사과를 사랑하다, 나는 애플컴퓨터를 좋아한다. 나는 애플컴퓨터를 사랑한다. 라는 여러 가지 의미로 번역될 수 있습니다.

이러한 의미애매성을 해소하는 방법은 크게 규칙을 활용한 방법과 통계적 기법에 의한 방법으로 나눌 수 있습니다.

규칙의 경우는 제약조건 등을 활용하여 정의하며, 통계적 기법을 활용한 방법은 감독자의 개입여부에 따라
감독 애매성 해소와 비 감독 애매성 해소가 있습니다.

감독 애매성 해소
- 베이지안 분류

비감독 애매성 해소
사전-기반
- 전자사전에 나온 설명 등의 텍스트를 처리하여 통계적 정보를 추출한 후 이를 애매성 해소에 활용

시소러스 기반
- 시소러스는 용어들 사이의 관계에 대한 정보를 기록한 것으로서, 관계 정보를 기반으로 애매성 해소에 활용

병렬 말뭉치 기반
- 한-영, 한-일 등의 언어간의 번역 텍스트와 사전을 의미 애매성 해소에 활용


작성: 안태성