관리 메뉴

Fintecuriosity

[데이터마이닝] '데이터마이닝'이란 무엇인가? 본문

Industrial Engineering/데이터마이닝

[데이터마이닝] '데이터마이닝'이란 무엇인가?

DataHolic26 2020. 7. 13. 06:28

 

 

이번 글의 내용은 "비즈니스 인텔리전스를 위한 데이터마이닝" 책과 함께 고려대학교 산업경영공학과 김성범 교수님과 강필성 교수님의 강의를 참조 하였음을 먼저 밝힙니다. (다른 참조한 논문과 자료들은 아래에 기재되어 있습니다.)

 


 

※ 여러분은'데이터 마이닝' 이란 단어를 들으면 어떠한 생각이 드시나요? 

 

보통은 빅데이터나 머신러닝 등 최근에 유행하는 학습 분야 키워드들이 제일 먼저 떠올거라고 생각합니다. 

 

데이터 마이닝은 비교적 새로운 학문입니다. 그리고 계속적으로 지금까지 발전하는 분야입니다. 데이터 마이닝이란 용어에서 마이닝(채굴)이란 의미를 지니고 있습니다. 마치 광산에서 광물들을 캐내는 것에 비유하는데, 극히 소수의 가치있는 광물(금, 다이아몬드)을 여러 단계를 걸쳐서 추출하는 것처럼 수많은 데이터들로부터 유용한 정보를 찾아내는 것이라고 해석하고 있습니다.  

 

 

데이터 마이닝에 관련된 KDD 학회는 1995년에 처음으로 개최되었습니다. KDD 학회에서는 데이터 마이닝에 대한 연구들과 기법들이 활발하게 공유되며 분야가 빠르게 발전하는데 이바지를 하였습니다.

 

데이터 마이닝이란 방대한 데이터를 걸러서 의미 있는 정보나 그 안에서 연관성, 패턴, 추세등을 파악하는 task라고도 정의를 할 수 있겠습니다. 또한 통계적인 관점에서 보았을 때 머신러닝 분야에서도 사용되는 대용량 데이터에 대한 탐색적 데이터 분석(Exploratory Data Analysis, EDA)에도 활용되고 있습니다.

 

데이터 마이닝은 기존 통계와 차별점이 있다면, 주어지는 가설검정에서 그치는 것이 아니라 데이터로부터 유용한 새로운 가설수립 및 규칙 등을 찾아가는 것에 중점을 두고 있습니다.

 

 

 

긴 글 읽어주셔서 감사합니다.


References

 

[1] Data Mining for Business Intelligence CONCEPTS,TECHNIQUESShmueli, Galit & Patel, Nitin & Bruce, Peter. (2010). Data Mining for Business Intelligence: Concepts, Techniques, and Applications in Microsoft Office Excel with XLMiner. 

 

[2] S. Kim. (2020). Graduate Course

 

[3] P. Kang. (2020). Graduate Course