[확률 기반의 자연어 처리] 확률문법 (stochastic grammar)
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)
혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다.
※ 확률문법(Stochastic grammar)으로도 불리는 언어이론의 통계학적 확장은 어떤 모습을 가지고 있을까요?
우리는 관련 문헌 속에서 다음과 같은 반복되는 주제를 관찰할 수 있습니다.
(1) 가장 적절한 언어이론 (or 언어능력문법)을 선택
(2) 이 이론의 생성단위에 적용 확률값 (application probabilities)을 할당
→ 문맥자유확률문법
→ 수형도부가 확률문법 (Stochastic tree adjoining grammar)
→ 통합기반 확률문법 (Stochastic unification-based grammar)
→ 머리주도 구구조확률 문법 (Stochastic head-driven phrase structure grammar)
→ 확률 어휘-기능 문법 (Stochastic lexical-functional grammar)
등을 예로 들 수 있습니다.
마찬가지로 일반 구구조 확률문법(Stochastic generalized phrase structure grammar)이나 범주확률문법(Stochastic categorical grammar)등도 정의할 수 있을 것입니다.
긴 글 읽어주셔서 감사합니다.
References
[1] K. Lee. (2003). 문법을 넘어서, 확률 기반의 자연어 처리.