중3 수학›통계

대푯값과 산포도

Mean, Median, Mode & Standard Deviation

직관 도입 -- 자료를 한 숫자로 요약하면?

퍼짐 정도1.5

👀 대푯값이 왜 필요할까?

①시험을 보면 30명의 점수가 나온다

②30개 숫자를 다 외울 수 없다

③딱 하나의 숫자로 요약 → 이것이 대푯값

④평균, 중앙값, 최빈값 -- 어떤 상황에서 뭘 쓸까?

대푯값 3가지

평균 (mean)

\bar{x} = x₁ + x₂ + ... + x_nn

모든 값을 더해서 개수로 나눈 것. 가장 많이 쓰는 대푯값

중앙값 (median)

자료를 크기순으로 정렬 → 중앙 위치의 값

n이 짝수면 가운데 두 수의 평균. 극단값에 영향을 덜 받는다

최빈값 (mode)

가장 많이 나타나는 값

여러 개일 수 있다. 범주형 자료(색깔, 성별)에 적합

💡 구체적 예시

①5명의 점수: 60, 70, 70, 80, 100

②평균 = (60+70+70+80+100)/5 = 76

③중앙값 = 3번째 값 = 70 (크기순 정렬 후 가운데)

④최빈값 = 70 (두 번 나와서 가장 많다)

⑤평균(76)과 중앙값(70)이 다르다 -- 100점이 평균을 끌어올렸다!

이상값과 대푯값의 선택

5번째 학생 점수80

⚠️ 이상값이 있을 때

①극단적으로 크거나 작은 값 = 이상값(outlier)

②이상값이 있으면 평균이 크게 왜곡된다

③하지만 중앙값은 거의 변하지 않는다

④예: 연봉 평균이 높아도 몇 명의 고연봉 때문 → 연봉 중앙값이 더 현실적

⑤시험에서: '극단값 있을 때 적절한 대푯값은?' → 중앙값!

산포도 -- 편차, 분산, 표준편차

편차

편차 = (변량) - (평균)

각 값이 평균에서 얼마나 떨어져 있는가. 편차의 합은 항상 0!

분산

V = (편차)²₁ + (편차)²₂ + ... + (편차)²_nn

편차의 제곱의 평균. 제곱하는 이유: 편차의 합이 0이라 그대로 평균 내면 0이 된다

표준편차

\sigma = \sqrt{V} = \sqrt{분산}

분산에 루트를 씌워 원래 단위로 돌려놓은 것

🔍 왜 제곱을 할까?

①편차를 다 더하면 + 와 -가 상쇄되어 항상 0

②그래서 제곱해서 모두 양수로 만든 뒤 평균을 구한다

③이것이 분산(V)

④분산은 단위가 (점수)²이라 해석이 어려움

⑤루트를 씌워 원래 단위(점수)로 돌린 것이 표준편차

시험 포인트 정리

산포도 핵심

분산 V = \Sigma(편차)²n, 표준편차 \sigma = \sqrt{V}

표준편차가 작을수록 자료가 평균 주변에 모여 있다

🎯 시험 포인트

①편차의 합 = 0 (항상 성립 -- 계산 검증에 활용)

②분산 = 편차 제곱의 평균, 표준편차 = 루트 분산

③표준편차가 작다 → 자료가 고르게 모여있다

④극단값 있으면 평균 대신 중앙값이 적절

⑤분산의 단위는 원래 단위의 제곱, 표준편차는 원래 단위와 같다