관리 메뉴

Fintecuriosity

[예측 및 분류를 위한 데이터 애널리틱스] Prologue 본문

Industrial Engineering

[예측 및 분류를 위한 데이터 애널리틱스] Prologue

DataHolic26 2020. 7. 17. 00:28

 

이번 글의 내용은 포항공과대학교 산업경영공학과 전치혁 특임교수님의 "예측 및 분류를 위한 데이터 애널리틱스 기법" 강의를 정리 및 참조하였음을 먼저 밝힙니다.

 

이번 포스트에서는 아래에 간단한 커리큘럼에 대해서 설명을 하고 무엇을 배우는지에 대하여 간략하게 핵심만 기재하겠습니다. 

 

"예측 및 분류를 위한 데이터 애널리틱스 기법"은 총 7주간의 수업이 진행되며 확률 통계, 선형대수를 기반으로 데이터를 분석하고 이를 활용하여 데이터 애널리틱스 방법론을 통하여 산업에 빈번하게 분석, 예측 관련 문제들을 해결할 수 있을 것 같습니다.

 

참고로 저는 학교에서 데이터 관련 수업을 들을 때는 다변량 통계 혹은 데이터 사이언스 수업 등에 나누어서 배웠습니다. 아니면 통계수업 혹은 인공지능 개론 수업에서도 회귀분석에 대해서 많이 다루었습니다.  본 수업에서는 compact 하게 예제와 개념, 연습 문제 등을 통하여 통계적 기반의 데이터 마이닝, 데이터 분석, 머신러닝 분야에 대하여 배우며 시야를 넓게 가져갈 수 있을 것 같습니다.

 


 

[Week 1] 강좌개요 및 단순회귀모형

 

1) 예측 및 분류 문제 정의 및 관련 기법들을 이해하고, 설명할 수 있다.

2) 단순회귀모형 이론에 대해 설명할 수 있다.

3) 가설 검정의 기초개념을 이해하고, 설명할 수 있다.

4) 실제 데이터에 적용하여 주어진 독립변수가 종속변수를 어떻게 설명하는 지 직접 해석할 수 있다.

 

[Week 2] 다중회귀 모형 이론

 

1) 다중회귀모형의 추정 및 검정을 이해하고, 주어진 문제를 해결할 수 있다.

2) 단계적 회귀분석과 다중공선성을 이해하고, 적합한 변수들만을 이용해 회귀모형을 구축할 수 있다.

3) 필요한 경우 적절한 변수 변환을 통해 범주형 독립변수 및 비선형 함수 문제를 선형회귀모형으로 해결할 수 있다.

 

[Week 3] 시계열 분석 기법

 

1) 다양한 비안정적 시계열 문제들이 증가함에 따라, 본 강좌를 통해 이 문제를 해결할 수 있는 능력을 기른다.

2) 예측기법으로의 시계열분석 기법을 이해하고, 주어진 문제를 해결할 수 있다.

3) 다양한 목적에 따라 시계열 분석 기법을 응용 하여 데이터 분석에 활용할 수 있다.

4) 실제 분석하고자 하는 시계열 데이터를 직접 다루어 원하는 미래 값을 예측할 수 있다.

 

[Week 4] 로지스틱 회귀모형 이론

 

1) k-인접객체법을 학습하고 활용할 수 있다.

2) 분류기법으로서의 로지스틱 회귀모형 이론을 이해하고, 활용할 수 있다.

3) 분류기법의 평가척도를 이해하고, 문제해결을 위해 활용할 수 있다.

4) 종속변수의 형태에 따른 모형 구축 방법을 학습한다.

 

[Week 5] 판별분석 이론 및 알고리즘

 

1) 판별분석을 위한 기초이론을 이해하고, 각각의 분석기법을 적용 사례를 토대로 설명할 수 있다.

2) 의사결정론 입각하여 판별분석을 시행할 수 있다.

3) 주어진 문제 상황에 따라 사전확률 또는 오분류비용을 적절히 고려하여 판별분석을 시행할 수 있다.

4) 상황에 가장 적합한 성능 척도를 고려하여 판별분석 결과를 평가할 수 있다.

 

[Week 6] 트리기반 분류기법 이론

 

1) 실제 새로운 데이터에 대해 분류를 해야 하는 많은 문제들이 존재함을 깨닫고, 본 강의에서 그 해결책을 찾는다.

2) 트리기반 이론을 이해하고, 문제해결에 활용할 수 있다.

3) CART기법의 핵심 이론을 이해하고, 데이터를 분석할 수 있다.

4) 불순도 함수를 활용하여 데이터 분석을 시행할 수 있다.

5) CART기법을 실제로 프로그래밍 툴을 통해 사용할 수 있다.

6) 새로운 데이터에 대해 분류를 해야하는 문제에 대해 직접 예측트리모형을 만들 수 있고, 중요한 독립변수를 선택할 수 있다.

 

[Week 7] 서포트벡터머신 이론 및 알고리즘

 

1) 최적화기반의 분류기법인 서포트벡터머신의 이론을 이해하고, 설명할 수 있다.

2) KKT 조건을 이용하여 최적화할 수 있다.

3) 문제에 따른 모형 구축 방법을 이해한다.

4) 커널 트릭을 통해서 비선형 모형을 학습할 수 있다.

 


 

긴 글 읽어주셔서 감사합니다.