[확률 기반의 자연어 처리] 확률문법 (stochastic grammar)

DataHolic26 2020. 8. 2. 23:03

이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)

혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다.

※ 확률문법(Stochastic grammar)으로도 불리는 언어이론의 통계학적 확장은 어떤 모습을 가지고 있을까요?

우리는 관련 문헌 속에서 다음과 같은 반복되는 주제를 관찰할 수 있습니다.

(1) 가장 적절한 언어이론 (or 언어능력문법)을 선택

(2) 이 이론의 생성단위에 적용 확률값 (application probabilities)을 할당

→ 문맥자유확률문법

→ 수형도부가 확률문법 (Stochastic tree adjoining grammar)

→ 통합기반 확률문법 (Stochastic unification-based grammar)

→ 머리주도 구구조확률 문법 (Stochastic head-driven phrase structure grammar)

→ 확률 어휘-기능 문법 (Stochastic lexical-functional grammar)

등을 예로 들 수 있습니다.

마찬가지로 일반 구구조 확률문법(Stochastic generalized phrase structure grammar)이나 범주확률문법(Stochastic categorical grammar)등도 정의할 수 있을 것입니다.

긴 글 읽어주셔서 감사합니다.

References

[1] K. Lee. (2003). 문법을 넘어서, 확률 기반의 자연어 처리.