도수분포표와 히스토그램의 사용 목적
데이터 전체의 특징을 파악하기 위해서.
예를들어, 데이터가 2개만 있다면 한눈에 확인이 가능하지만 데이터가 5만개가 있다고 하면 이 데이터는 어떤 특징이 있는지 알기 어려움. 이때 도수분포표와 히스토그램을 사용하면 데이터의 특징을 파악하는데 용이함
계급의 개수와 계급의 크기를 분석가의 주관으로 판단하는 이유
계급의 개수와 계급의 크기는 주로 분석가의 주관적 판단으로 정한다. 수학적 표준에 따라 산출하는 공식이 있긴 하지만 추천하지 않는다. 그 이유는 도수분포표와 히스토그램을 사용하는 목적에 있다. 도수분포표와 히스토그램은 데이터 전체의 분위기(트렌드)를 한 눈에 파악하기 위해서다. 그러나 공식으로 구한 계급의 개수와 계급의 크기의 경우, 산술적으로는 정확하지만 그만큼 한번에 파악하기에는 복잡해보이는 경우가 많다. 예를들어, 주관적 판단으로 계급의 크기를 5, 10의 배수로 정하는 반면 공식을 통해 산출된 계급의 크기는 690, 23 등 깔끔하지 않다. 도수분포표와 히스토그램의 사용 목적을 다시 생각해보면 정확한 수치를 뽑아내기 위함이 아니라 데이터의 특징을 파악하는데 있다는 점에서 계급의 개수와 크기는 분석가의 주관적 판단으로 설정하는 것만으로도 충분하다.
계급의 개수 구하는 공식

n: 데이터의 개수
계급의 크기 구하는 공식

a: 계급의 개수 공식으로 구한 계급의 개수
b: 데이터의 최댓값
c: 데이터의 최솟값
[개념 통계 07] 도수 분포표와 히스토그램
안녕하세요. 홍박사입니다. 이전 포스트에서는 기술 통계와 추리 통계가 무엇인지 이야기 해보았습니다. 다시 한번 간단하게 요약하자면 기술 통계는 우리가 수집한 데이터가 어떻게 생겼는
drhongdatanote.tistory.com
'일상' 카테고리의 다른 글
매일 글 쓰기 도전! (4) | 2024.12.05 |
---|---|
서로 다른 단위, 서로 다른 집단의 데이터 비교하기: 표준값(z-score) (0) | 2022.03.15 |
[2주 챌린지] 하루에 물 2L 마시기 (0) | 2022.02.23 |
각개전투 (0) | 2022.02.16 |
자유도(degree of freedom), 불편추정량(unbiased estimator) (0) | 2020.10.10 |