[확률 기반의 자연어 처리] 표시 (Representations)

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

Fintecuriosity

[확률 기반의 자연어 처리] 표시 (Representations) 본문

언어학/확률기반 자연어 처리

[확률 기반의 자연어 처리] 표시 (Representations)

DataHolic26 2020. 8. 10. 07:00

이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)

혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다.

우리는 아직 어떤 종류의 표시가 언어 사용자의 "구문구조 경험(syntactic structure experience)"을 나타내기에 가장 적합할 것인지 알 수 없습니다.

최근의 언어이론들이 채용하는 표시들은 이러한 목적을 위해 고려될 수 있는 후보들입니다. 하지만 DOP1을 위해서 우리는 훨씬 더 단순한 시스템을 채택해야 합니다. 발화-분석은 명칭이 붙은 수형도 (labeled tree)로 표시될 것이며, 명칭은 원소기호(primitive symbol)입니다. 이러한 표기(notation)에는 분명히 한계가 있으며, 구성성분의 의미를 표시하지는 못합니다.

이러한 표기는 표면구조(surface structures)와 일치하지 않은 "심층" 또는 "기능적" 구문구조를 무시하며, 심지억 격(case), 수(number), 성(gender)과 같은 구문자질(syntactic features)조차도 포함시킬 수 없습니다. 그러므로 이러한 시스템을 계속 유지할 수는 없을 것입니다. 하지만 현재의 논의단계에서 이 시스템은 두 가지 큰 장점을 지닙니다.

먼저 이러한 시스템은 매우 단순하다는 것이며, 현재 쉽게 이용할 수 있는 코퍼스에서 사용하는 표시라는 것입니다. 그러므로 John likes Mary라는 문장에 대해 아래의 그림과 같은 수형도를 할당할 수 있습니다.

긴 글 읽어주셔서 감사합니다.

References

[1] K. Lee. (2003). 문법을 넘어서, 확률 기반의 자연어 처리.

'언어학 > 확률기반 자연어 처리' 카테고리의 다른 글

[확률 기반의 자연어 처리] 합성 연산 (Composition Operation) (0)	2020.08.28
[확률 기반의 자연어 처리] 부분구조 (Fragments) (0)	2020.08.10
[확률 기반의 자연어 처리] 구구조 표시를 위한 경험기반 모델 (0)	2020.08.10
[확률 기반의 자연어 처리] DOP 모델의 평가 (0)	2020.08.06
[확률 기반의 자연어 처리] 언어이해와 언어생성 (0)	2020.08.06

'언어학/확률기반 자연어 처리' Related Articles

Fintecuriosity

[확률 기반의 자연어 처리] 표시 (Representations) 본문

[확률 기반의 자연어 처리] 표시 (Representations)

'언어학 > 확률기반 자연어 처리' 카테고리의 다른 글

티스토리툴바