일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 고전방법론
- 최적화문제
- 지식재산경영
- 자연어처리
- 컴퓨터공학
- 특허
- 공대생의언어학공부
- 정보시스템설계및분석
- 통계적품질관리
- 언어학
- 품질경영
- 공대생의전공공부
- 지적재산권
- 영어영문학
- 메타휴리스틱
- 경제용어
- 최적화기법
- 산업공학
- 공대생의산업공학공부
- 공대생의연구공부
- 인공지능
- 정보시스템
- 국어국문학
- 공대생의문과공부
- 언어적지식
- 통계학
- 일일경제공부
- 이공계를위한특허이해
- 확률기반자연어처리
- 공대생의경제공부
- Today
- Total
목록언어학 (28)
Fintecuriosity
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. DOP1은 단 한 가지 합성연산, 즉 명칭 붙은 수형도에 대한 부분함수(partial function)인 마디-대치(node-substituition) 연산만을 기술합니다. 합성연산의 범위는 명칭이 붙은 수형도의 집합입니다. t º u 로 표기되는 수형도 t와 수형도 u의 합성은 t의 극좌 비종단(leftmost nonterminal) 경계마디상의 명칭이 u의 뿌리마디(root node)상의 명칭과 동일할 때만 정의됩니다. t º u 가 정의되면 ..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. DOP1이 단위로써 사용하는 코퍼스 수형도의 부분구조는 부분수형도(subtrees)입니다. 수형도 T의 부분수형도는 T의 부분그래프 (subgraph) t이며, 이 때 (1) t는 두개 이상의 마디(node)로 구성되며 (2) t는 연결되어 있으며 (3) t의 경계마디(frontier nodes)를 제외한 t에 있는 각각의 마디는 T에 있는 대응 마디들과 동일한 딸 마디(daughter nodes)를 가집니다. 예를 들어서, 아래의 그림에 있는 수..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. 우리는 아직 어떤 종류의 표시가 언어 사용자의 "구문구조 경험(syntactic structure experience)"을 나타내기에 가장 적합할 것인지 알 수 없습니다. 최근의 언어이론들이 채용하는 표시들은 이러한 목적을 위해 고려될 수 있는 후보들입니다. 하지만 DOP1을 위해서 우리는 훨씬 더 단순한 시스템을 채택해야 합니다. 발화-분석은 명칭이 붙은 수형도 (labeled tree)로 표시될 것이며, 명칭은 원소기호(primitive sym..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. DOP1으로 부르게 될 수형도구조(tree structures)에 근거한 데이터 중심 파싱(Data-Oriented Parsing) 체계를 구현을 제시합니다. 이를 위해서 각각의 관련 구성성분에 대한 특정한 선택들이 필요합니다. (1) 가정하고 있는 표시 (2) 새로운 표시를 생성하기 위해 사용되는 이러한 표시들의 부분구조 (3) 부분구조들을 결합하기 위해 사용되는 연산자 (4) 가정하고 있는 확률모델 상술 긴 글 읽어주셔서 감사합니다. Refer..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. DOP 모델들의 실제구현을 상술하기에 앞서 평가의 문제에 대해서 언급할 필요가 있습니다. 자연어 시스템의 평가는 오랫동안 다소 소홀하게 다루어졌던 문제입니다. ※ 자연어 파싱의 영역에서는 아래와 같은 절차가 일반적으로 사용되었습니다. 1) 테스트 문장세트를 선택 2) 시스템이 이 문장들에 대해 "최선의" 분석을 계산 3) 원어민에게 "최선의" 분석이 "적합하" 분석인지 결정 ※ 이러한 평가절차는 적어도 한 가지 결점이 있습니다. 원어민이 실험에 의..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. 일반적인 DOP 체계의 일차적 관심은 언어분석 (language parsing) 또는 언어이해 (language comprehension)에 있습니다. 하지만 DOP 체계는 언어생성 (language production)을 위해서 사용될 수도 있습니다. 생성의 문제는 보통 언어이해의 반대, 즉 어떤 의도 또는 의미가 언어사용자의 의해 어떻게 발화로 생성되는가 하는 것으로 볼 수 있습니다. 여러 다른 발화들이 동일한 의미를 표현할 수도 있으므로 언어..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. ※ Bod(1995a)에 의해 개략적으로 제시된 일반적인 DOP 구성에 따르면 특정 DOP 모델은 아래와 같은 4가지 매개변향을 명시함으로써 기술되고 있습니다. (1) 발화분석에 대한 적형표시 (well-formed representation)의 형식적 정의 (2) 새로운 발화의 분석을 구축함에 있어 단위로 사용될 수 있는 발화-분석의 부분구조의 정의 (3) 그러한 부분구조들의 결합이 이루어지게 하는 합성연산 (composition operatio..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. ※ 개인의 과거 언어경험이 어떤 형태로든 자신의 문장분석처리를 결정하게 된다는 것은 분명합니다. 데이터 중심의 파싱 (Data-Oriented Parsing, DOP)의 기본개념은 이러한 문장분석이 직접적인 방식으로 이루어진다는 것입니다. 개인의 과거 언어경험에 대한 표시로서 우리는 적절한 분석이 이루어진 이전에 발생했던 발화의 코퍼스를 사용합니다. 새로운 발화의 분석은 코퍼스에 있는 분석의 부분구조들 (fragments)을 자유롭게 결합함으로써 ..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. ※ 통계적인 방법에 의해 확장된 이런 종류의 언어능력문법은 한 언어의 모든 문장과 문장의 모든 분석을 정의합니다. 이러한 문법은 또한 각각의 문장과 분석에 확률값을 할당합니다. 따라서 이러한 문법은 중요한 언어 수행 현상 즉 (언어생성과 음성인식에 있어서) 서로 다른 문장들 사이에서 또는 (중의성 해소에 있어서) 서로 다른 문장 분석들 사이에서 선택할 때 사람들이 보이는 선호도에 대해 일정한 예측을 하게 됩니다. 하지만 이러한 예측의 정확성은 제한..
이번 글의 내용은 이강혁 교수님의 "문법을 넘어서, 확률 기반의 자연어 처리" 저서를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.) 혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. ※ 확률문법(Stochastic grammar)으로도 불리는 언어이론의 통계학적 확장은 어떤 모습을 가지고 있을까요? 우리는 관련 문헌 속에서 다음과 같은 반복되는 주제를 관찰할 수 있습니다. (1) 가장 적절한 언어이론 (or 언어능력문법)을 선택 (2) 이 이론의 생성단위에 적용 확률값 (application probabilities)을 할당 → 문맥자유확률문법 → 수형도부가 확률문법 (Stochastic tree adjoining gramma..