의미분석

Saltlux

Jump to: navigation, 찾기

개요

의미분석은 문장의 ‘의미’를 파악하는 과정입니다. 상세히 말하자면, 의미분석은 구문분석 과정을 통해 구문 트리 (Parsing Tree)가 생성된 이후 각 어휘의 의미 중의성을 해소하여 각 어휘에 대한 의미를 파악 하는 일련의 과정을 의미합니다. 의미 중의성이란 한 형태에 두 가지 이상의 의미를 가진 것으로 풀이됩니다. 의미 중의성은 단어의 중의성으로 인한 것, 문장의 구조 차이로 인한 통사적 중의성, 부정표현으로 인한 중의성, 상황에 따른 중의성 들이 있습니다. 예를 들면 다음과 같습니다.

  • 그녀는 손이 크다.

‘손이 크다’라는 관용적 표현에 의해 씀씀이가 크다는 뜻과, 손의 크기가 크다는 의미로 해석이 가능하므로 중의성을 가집니다.

  • 이것은 엄마의 그림이다.

엄마의 소유로 된 그림, 엄마를 그린 그림, 엄마가 그린 그림 등 여러가지로 해석 되므로 중의성을 가집니다.

  • 나는 어제 공원에서 그녀를 만나지 않았다.

어제가 아닌 그제 만났다는 것인지, 만난 사람이 그녀가 아니라 다른 사람이라는 것인지, 공원이 아닌 다른 장소에서 만난 것인지에 대한 해석상의 중의성을 가짐. 즉 않았다라는 표현이 부정하는 대상이 어제, 그녀, 공원 중 무엇이냐에 따라 여러가지로 해석됩니다.

  • 그는 구두를 신고 있다.

그가 구두를 신고 있는 상태인지, 구두를 신고 있는 중인지에 대한 여러 의미로 해석 되므로 중의성을 가집니다.

  • 얼굴이 까만 연탄 장수의 아들이 다녀갔다. (수식에 의한 의미의 중의성)

연탄장수의 얼굴이 까맣다는 의미 또는 연탄 장수 아들의 얼굴이 까맣다는 의미의 중의성을 가집니다.

  • 띄어쓰기에 의한 의미의 중의성

아버지 가방에 들어 간다. 와 아버지가 방에 들어 간다. 는 띄어쓰기에 의한 중의성 발생의예입니다.

  • 단어의 중의성에 의한 의미 중의성

나는 배를 좋아한다. 에서 먹는 과일 “배”와 타는 “배” 가 단어의 중의성에 대한 예입니다.

이러한 의미 중의성 해소는 기계번역과 정보검색 등에 활용될 수 있습니다. 기계번역의 예를 든다면 “I love apple. “라는 문장의 경우에서는

  • love: 사랑하다, 좋아하다, apple: 사과, 애플컴퓨터

나는 사과를 사랑하다, 나는 사과를 사랑하다, 나는 애플컴퓨터를 좋아한다. 나는 애플컴퓨터를 사랑한다. 라는 여러 가지 의미로 번역될 수 있습니다. 이러한 의미 중의성을 해소하는 방법은 크게 규칙을 활용한 방법과 통계적 기법에 의한 방법으로 나눌 수 있습니다. 규칙의 경우는 제약조건 등을 활용하여 정의하며, 통계적 기법을 활용한 방법은 감독자의 개입여부에 따라 지도 학습을 통한 중의성 해소 방법과 비 지도 학습 중의성 해소 방법이 있습니다.

기계 학습: 베이지안 분류 등의 알고리즘 사용

  • 사전-기반: 전자사전에 나온 설명 등의 텍스트를 처리하여 통계적 정보를 추출한 후 이를 중의성 해소에 활용
  • 시소러스 기반: 시소러스는 용어들 사이의 관계에 대한 정보를 기록한 것으로서, 관계 정보를 기반으로 중의성 해소에 활용
  • 병렬 말뭉치 기반: 한-영, 한-일 등의 언어간의 번역 텍스트와 사전을 의미 중의성 해소에 활용

콘텐트 히스토리