일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 자연어처리
- 특허
- 공대생의연구공부
- 품질경영
- 언어학
- 산업공학
- 컴퓨터공학
- 영어영문학
- 통계적품질관리
- 국어국문학
- 정보시스템설계및분석
- 공대생의언어학공부
- 일일경제공부
- 확률기반자연어처리
- 지적재산권
- 최적화기법
- 공대생의문과공부
- 언어적지식
- 경제용어
- 인공지능
- 공대생의산업공학공부
- 고전방법론
- 이공계를위한특허이해
- 공대생의전공공부
- 지식재산경영
- 공대생의경제공부
- 통계학
- 메타휴리스틱
- 최적화문제
- 정보시스템
- Today
- Total
Fintecuriosity
[확률 기반의 자연어 처리] 언어수행에서 중의성 해소 본문
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)
혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다.
언어수행의 문제 중 하나인 중의성 해소(disambiguation)를 통해 이러한 이분법의 의미를 살펴볼 수 있습니다.
언어능력문법이 상당한 규모의 자연어를 다룰 수 있는 수준으로 확대되면, 곧 많은 문장들이 엄청나게 많은 구문분석을 문법에 의해 할당받게 됩니다. 하지만 인간언어의 사용자들은 이러한 분석들 중 한,두 개 정도만 인식을 하게 됩니다. 자연어 문장에 대한 구문분석 (그리고 그에 상응하는 의미해석)의 폭발적인 결합가능성은 언어이론에서는 무시되어 왔지만, 심리언어학과 언어기술 분야에서는 진지하게 다루어졌던 문제입니다.
◎ Martin et al.(1983)은 자신들의 문법이 아래의 예제 문장들에 할당되는 구문분석의 수를 보여주고 있습니다.
List the sales of products in 1973 3
List the sales of products produced in 1973 10
List the sales of products in 1973 with the products in 1972 28
List the sales of products produced in 1973 with the products produced in 1972 455
전치사구와 관계절의 여러 다른 부착 가능성으로 인해 언어능력문법은 이러한 문장들에 대해 많은 구조를 그 가능성으로 가지게 됩니다. 그러나 영어화자는 이러한 복잡한 중의성(ambiguity)을 포착하지 못하며, 단지 몇 가지 분석만을 즉각적으로 인지하게 됩니다.
그러므로 자연어의 수행이론은 문장들이 지니게 되는 가능한 분석공간을 기술하는 것이 아니라 실제로 어떤 분석을 화자가 자연어 발화에 할당하는 가를 예측할 수 있어야 합니다. 그러나 수행이론은 다양한 실세계의 상황, 다양한 단어와 구문의 발생가능성과 그에 따른 의미 등과 관련된 비언어적 지식을 요구합니다.
긴 글 읽어주셔서 감사합니다.
References
[1] K. Lee. (2003). 문법을 넘어서, 확률 기반의 자연어 처리.
'언어학 > 확률기반 자연어 처리' 카테고리의 다른 글
[확률 기반의 자연어 처리] 통계적 언어능력문법 (0) | 2020.08.03 |
---|---|
[확률 기반의 자연어 처리] 확률문법 (stochastic grammar) (0) | 2020.08.02 |
[확률 기반의 자연어 처리] 통계학적 접근방식 (0) | 2020.08.02 |
[확률 기반의 자연어 처리] 언어수행 모델에 대한 빈도기반 접근방식 (0) | 2020.08.02 |
[확률 기반의 자연어 처리] 언어능력-언어수행 이분법 (0) | 2020.08.02 |