관리 메뉴

Fintecuriosity

[패턴인식] Introduction 본문

Artificial Intelligence/패턴인식

[패턴인식] Introduction

DataHolic26 2020. 7. 22. 00:50

이번 글의 내용은 고려대학교 컴퓨터공학과 김승룡 교수님의 강의를 정리 및 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)

 

혹시 제가 잘못 알고 있는 점이나 보완할 점 있다면 댓글로 알려주시면 감사하겠습니다. 

 


 

 

 

첫 패턴인식 수업에서는 첫 강의에 진행하는 OT를 기반으로 전반적인 개요와 class structure, course outlook 등을 말씀해 주셨습니다.

 

 

제가 처음에 떠올린 Pattern Recognition 개념은 주로 컴퓨터 비전에서 혹은 연관성있는 규칙과 패턴을 찾아내는 task가 있을 것이란 막연한 생각을 하였습니다. 하지만 대학원 입학 후에 여러가지 머신러닝, 딥러닝 등의 공부를 하며 통계적 기반의 Pattern Recognition도 있다는 사실을 깨달았고, 더불어 영국 Oxford 대학에 재직 중이신 Christopher Bishop 교수님의 저서 중 "Pattern Recognition and Machine Learning"이라는 명저를 접하였습니다

 

 

 

(책은 영어판, 한글판으로 시중에 있습니다. 인지도와 퀄리티를 둘다 가진 책이니, 한 번 읽어보시면 좋을 듯 싶습니다. 물론 광고비를 받고 이렇게 말씀드리는 것은 아닙니다 ㅎㅎ;;) 위의 사진에는 김승룡 교수님께서 같이 공부하면 좋을만한 책들을 추천해 주셨는데, Bishop 교수님의 책도 포함되어 있습니다. 참고 MIT의 Gilbert Strang 교수님의 선형대수 강의는 저도 개인적으로 들어서 추천드리고 싶습니다. 

 

수업을 통하여 김승룡 교수님께서는 Machine learning skillset을 다질 수 있으며 추후에 career path로는 data scientist, machine learning engineer, and statistician 혹은 도메인 전문가가 될 수 있다고 하셨습니다. 하지만 이러한 career path는 단번에 AI 지식을 가지고 위와 같은 position을 얻을 수 없다고 하였습니다. 점진적으로 지식과 수업을 통해 background를 다지는 것이 중요하다고 강조하셨습니다.

 


패턴인식과 머신러닝은 같은 분야에 속해있습니다. 먼저 패턴인식은 데이터에서 자동으로 regularities를 찾으며 데이터를 카테고리 별로 분류해주는 것을 의미합니다. 머신러닝은 알고리즘 설계와 개발에 있어서 컴퓨터가 경험적인 데이터를 기반으로 진화,발전해 나가는 것을 의미합니다. (즉 쉽게 우리가 데이터를 기반으로 알고리즘을 컴퓨터를 통해 학습시키는 과정이라고 생각했습니다.

 

 

머신러닝에서의 알고리즘은 크게 3가지 종류로 나뉠 수 있는데 지도, 비지도, 강화학습이 있습니다. 

 

주로 지도 학습은 입력값(input)과 출력값(정답)을 가지고 진행을 합니다. 지도학습의 목표는 새로운 입력값을 통하여 맞는 출력값(정답)을 도출하는 것입니다. 지도 학습에서 쓰는 기법은 예측, 분류가 있습니다. 

 

비지도 학습은 입력값만 주고 정답을 맞추는 것이라고 이전에 배웠습니다. 또한 raw "unlabeled"데이터 안에서 숨겨진 패턴을 찾고 분석하는 것이 비지도 학습의 목표입니다. 비지도 학습에서 쓰는 기법들은 주로 토픽 모델링, 차원축소, 군집화, 독립성분 분석(Blind Source Separation, Independent Component Analysis and Applications) 등이 있습니다.

 

지도 학습은 위 사진(왼쪽)과 같이 분류방법을 통하여 데이터를 나눌 수 있습니다. 그리고 위 사진(오른쪽)은 비지도 학습을 visualizing한 것인데 군집화 방법을 통하여 데이터들을 분류할 수 있습니다. 즉 비슷한 특징을 가진 데이터끼리 묶는다고 볼 수 있습니다. 지도,비지도 학습은 boundary 경계선을 나누어서 정답을 찾을 수도 있습니다. 

 

마지막으로 머신러닝을 공부하며 여러가지 데이터들을 접할 수 있습니다. 이미지 데이터, 텍스트 데이터, 음성 데이터, 수치형 데이터, Multimodal data, 센서 데이터등이 있습니다. 그리고 게임 분야에서도 인공지능이 많이 활용되고 있고 우리가 알고 있는 강화학습도 알파고(바둑)를 통해 유명해진 것을 알 수 있습니다.

 

(강화학습에 대한 포스트는 아래 링크를 참조해주세요)

 

 

[강화학습] Introduction

이번 글의 내용은 '기초부터 시작하는 강화학습 / 신경망 알고리즘(손민규 지음, 위키북스 DS 시리즈)'의 내용을 참조 및 정리 하였으며 저의 개인적인 인사이트 또한 추가된 점을 먼저 밝힙니다.

fintecuriosity-11.tistory.com

 

머신러닝, 딥러닝 관련 수업들은 정말 많이 듣고 책도 읽었지만 그에 준하는 의미와 지식의 배경인 이론을 자세하게 공부해보지 않아서 Pattern recognition 수업을 통하여 기초를 탄탄히 다져 나가려고 합니다.

 

 

긴 글 읽어주셔서 감사합니다.


References

 

[1] S. Kim (2020). Graduate Course

 

[2] Comon, P.; Jutten C., (2010): Handbook of Blind Source Separation, Independent Component Analysis and Applications. Academic Press, Oxford UK. ISBN 978-0-12-374726-6

 

[3] Lahat, D., Adali, T., and Jutten, C. (2015). Multimodal data fusion: an overview of methods, challenges,
and prospects, Proceedings of the IEEE, 103, 1449–1477.