관리 메뉴

Fintecuriosity

[통계적 품질관리] 데이터의 분류 본문

Industrial Engineering/통계적 품질관리

[통계적 품질관리] 데이터의 분류

DataHolic26 2020. 8. 23. 21:59

 

이번 글의 내용은 '통계적 품질관리 4.0(양희정, 김광수, 정상윤 지음, 한국표준협회미디어)'의 내용을 참조 및 정리 하였습니다.

 


 

※  데이터는 어떤 활동에 대한 품질 특성이나 요인의 상태를 객관적으로 나타내기 위한 자료이므로 어떠한 척도로 표현되어야 합니다. 

 

척도는 수량화 할 수 없는 정성적 데이터(qualitative data)와 수량화가 가능한 정량적 데이터(quantitative data)로 구분할 수 있습니다.

 


 

1) 정성적 데이터(qualitative data)

범주형 데이터(categorical data)라고도 합니다. 원칙적으로 숫자로 표현할 수 없지만 필요에 따라 숫자로 나타내기도 하는데, 어떠한 값을 지칭하는 것은 아니며 순번 또는 이름을 대신한 것입니다. 명목데이터와 순위데이터로 나누어집니다.

 

ⓐ 명목 데이터(nominal data)

편의상 숫자로 표현하여도 순위의 개념은 없는 데이터입니다. 예를 들면 전화번호, 우편번호의 지역 구분 번호 등이 해당됩니다.

 

ⓑ 순위 데이터(ordinal data)

편의상 표현된 숫자가 순위의 의미를 가지고 있는 데이터로 제품을 1,2,3 등급으로 구분하거나, 대학입시 추가합격 대기번호 등이 해당됩니다.

 


 

2) 정량적 데이터(quantitative data)

데이터 자체가 숫자로 표현이 가능한 측정치 데이터(measurement data)이며, 이산형 데이터와 연속형 데이터로 나누어집니다.

 

 이산형 데이터(discrete data)

계수치 데이터라고도 하며, 부적합품수, 부적합수, 고장건수, 재해발생건수 등과 같이 개수로 세어지는 특성의 값을 말합니다. 이것은 직물 1m당의 흠의 수, 부품한상자의 부적합품수처럼 1, 2, 3, ... 으로 셀 수 있는 데이터입니다.

 

ⓑ 연속형 데이터(continuous data)

계량치 데이터라고도 하며, 길이, 무게, 질량, 시간 등과 같이 연속량으로 측정되는 특성치로 가공물의 두께(mm), 플랜트의 내부 온도, 컨베이어의 속도(m/sec)등이 해당됩니다. 일반적으로 계량치 데이터가 계수치 데이터보다 시간이나 비용은 많이 드나 1회당 측정 결과에 의한 정보의 질이 상대적으로 우수합니다.

 

 

 

긴 글 읽어주셔서 감사합니다.


References

 

[1] 양희정, 김광수, 정상윤. 한국표준협회미디어, "빅데이터 시대 품질관리의 내비게이션 통계적 품질관리 4.0", 19 (2019)