일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 최적화기법
- 확률기반자연어처리
- 이공계를위한특허이해
- 품질경영
- 고전방법론
- 공대생의언어학공부
- 정보시스템
- 영어영문학
- 최적화문제
- 산업공학
- 통계학
- 일일경제공부
- 정보시스템설계및분석
- 통계적품질관리
- 컴퓨터공학
- 공대생의산업공학공부
- 언어적지식
- 메타휴리스틱
- 공대생의전공공부
- 인공지능
- 공대생의문과공부
- 특허
- 공대생의경제공부
- 공대생의연구공부
- 국어국문학
- 지식재산경영
- 자연어처리
- 경제용어
- 지적재산권
- 언어학
- Today
- Total
Fintecuriosity
[확률 기반의 자연어 처리] 표시 (Representations) 본문
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)
혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다.
우리는 아직 어떤 종류의 표시가 언어 사용자의 "구문구조 경험(syntactic structure experience)"을 나타내기에 가장 적합할 것인지 알 수 없습니다.
최근의 언어이론들이 채용하는 표시들은 이러한 목적을 위해 고려될 수 있는 후보들입니다. 하지만 DOP1을 위해서 우리는 훨씬 더 단순한 시스템을 채택해야 합니다. 발화-분석은 명칭이 붙은 수형도 (labeled tree)로 표시될 것이며, 명칭은 원소기호(primitive symbol)입니다. 이러한 표기(notation)에는 분명히 한계가 있으며, 구성성분의 의미를 표시하지는 못합니다.
이러한 표기는 표면구조(surface structures)와 일치하지 않은 "심층" 또는 "기능적" 구문구조를 무시하며, 심지억 격(case), 수(number), 성(gender)과 같은 구문자질(syntactic features)조차도 포함시킬 수 없습니다. 그러므로 이러한 시스템을 계속 유지할 수는 없을 것입니다. 하지만 현재의 논의단계에서 이 시스템은 두 가지 큰 장점을 지닙니다.
먼저 이러한 시스템은 매우 단순하다는 것이며, 현재 쉽게 이용할 수 있는 코퍼스에서 사용하는 표시라는 것입니다. 그러므로 John likes Mary라는 문장에 대해 아래의 그림과 같은 수형도를 할당할 수 있습니다.
긴 글 읽어주셔서 감사합니다.
References
[1] K. Lee. (2003). 문법을 넘어서, 확률 기반의 자연어 처리.
'언어학 > 확률기반 자연어 처리' 카테고리의 다른 글
[확률 기반의 자연어 처리] 합성 연산 (Composition Operation) (0) | 2020.08.28 |
---|---|
[확률 기반의 자연어 처리] 부분구조 (Fragments) (0) | 2020.08.10 |
[확률 기반의 자연어 처리] 구구조 표시를 위한 경험기반 모델 (0) | 2020.08.10 |
[확률 기반의 자연어 처리] DOP 모델의 평가 (0) | 2020.08.06 |
[확률 기반의 자연어 처리] 언어이해와 언어생성 (0) | 2020.08.06 |