[빅데이터분석기사 기출14] 산포도의 통계량(범위, 분산, 표준편차, 변동계수, 사분위수 범위)
일반적으로 기초통계라고 하면 평균, 중위수, 최빈값으로 설명되는 중심경향성(Central Tendency)을 통해 데이터를 살펴본다. 그러나 이러한 중심경향성은 데이터의 값들이 얼마나 흩어져있는지에 따라서 다르게 해석될 수 있기 때문에, 데이터 탐색시 값들의 산포도를 항상 고려해야한다. 산포도를 표현하는 통계량은 범위, 분산, 표준편차, 변동계수, 사분위수 범위가 있다. 산포도 데이터 값들의 흩어진 정도를 표현하는 통계량 1. 범위(Range) 최대 데이터 값에서 최소 데이터 값을 뺀 차이로 나타낸다. 2. 분산(Variance) 편차를 활용하여 산포도를 확인하는 방법으로, 데이터 간의 차이가 클수록 분산이 크다. 분산을 계산할 때에는 편차(데이터 값과 평균값의 차이)의 합이 0이므로, 편차의 제곱을 활..
2023. 2. 17.