구문분석

Saltlux

Jump to: navigation, 찾기


구문 분석은 형태소분석 및 태깅이 끝난 데이터를 구문 단위로 묶어주는 과정을 의미합니다.

예를 들어
“The post office will hold out discounts and service concessions as incentives” 라는 문장의 경우
아래와 같이 3가지의 구문으로 묶일 수 있으며, 구문 분석 과정은 구묶음과 이 구묶음을 통해 발생한 애매성을 해소합니다.

Image:semantic_technology_01_1.jpg

문법의 정의

Image:semantic_technology_01_2.jpg 

Grammar 정의

  • Parser가 Grammar에 정의된 대로 구문분석 후 가능한 여러 개의 Parsing Tree 반환
  • CFG (Context Free Grammar)
  • Start Symbol (S) : Sentence
  • Non-Terminal (NT) : syntactic constituents
  • Terminals (T): lexical entities/words
  • Productions ⊆ NT× (NT∪T)+ ≡ grammar rules

Image:semantic_technology_01_3.jpg 

문법의 예

Bottom-up/Top-down 구문 분석

Image:semantic_technology_01_4.jpg

Back tracking 문제





차트 파싱

모든 Parsing 가능한 경우 Chart에 기록하는 방식으로 최적의 Path를 찾아 냅니다.
Image:semantic_technology_01_5.jpg


통계적 구문분석

모든 Parsing 가능한 경우 Chart에 기록하고 최적의 Path 검색하는 방식입니다.

Image:semantic_technology_01_6.jpg

작성: 안태성