중3 수학통계

대푯값과 산포도

Mean, Median, Mode & Standard Deviation

직관 도입 -- 자료를 한 숫자로 요약하면?
1.5
👀 대푯값이 왜 필요할까?
①시험을 보면 30명의 점수가 나온다
②30개 숫자를 다 외울 수 없다
③딱 하나의 숫자로 요약 → 이것이 대푯값
④평균, 중앙값, 최빈값 -- 어떤 상황에서 뭘 쓸까?
대푯값 3가지
평균 (mean)
\bar{x} = x1 + x2 + ... + xnn
모든 값을 더해서 개수로 나눈 것. 가장 많이 쓰는 대푯값
중앙값 (median)
자료를 크기순으로 정렬 → 중앙 위치의 값
n이 짝수면 가운데 두 수의 평균. 극단값에 영향을 덜 받는다
최빈값 (mode)
가장 많이 나타나는 값
여러 개일 수 있다. 범주형 자료(색깔, 성별)에 적합
💡 구체적 예시
①5명의 점수: 60, 70, 70, 80, 100
②평균 = (60+70+70+80+100)/5 = 76
③중앙값 = 3번째 값 = 70 (크기순 정렬 후 가운데)
④최빈값 = 70 (두 번 나와서 가장 많다)
⑤평균(76)과 중앙값(70)이 다르다 -- 100점이 평균을 끌어올렸다!
이상값과 대푯값의 선택
80
⚠️ 이상값이 있을 때
①극단적으로 크거나 작은 값 = 이상값(outlier)
②이상값이 있으면 평균이 크게 왜곡된다
③하지만 중앙값은 거의 변하지 않는다
④예: 연봉 평균이 높아도 몇 명의 고연봉 때문 → 연봉 중앙값이 더 현실적
⑤시험에서: '극단값 있을 때 적절한 대푯값은?' → 중앙값!
산포도 -- 편차, 분산, 표준편차
편차
편차 = (변량) - (평균)
각 값이 평균에서 얼마나 떨어져 있는가. 편차의 합은 항상 0!
분산
V = (편차)21 + (편차)22 + ... + (편차)2nn
편차의 제곱의 평균. 제곱하는 이유: 편차의 합이 0이라 그대로 평균 내면 0이 된다
표준편차
\sigma = \sqrt{V} = \sqrt{분산}
분산에 루트를 씌워 원래 단위로 돌려놓은 것
🔍 왜 제곱을 할까?
①편차를 다 더하면 + 와 -가 상쇄되어 항상 0
②그래서 제곱해서 모두 양수로 만든 뒤 평균을 구한다
③이것이 분산(V)
④분산은 단위가 (점수)²이라 해석이 어려움
⑤루트를 씌워 원래 단위(점수)로 돌린 것이 표준편차
시험 포인트 정리
산포도 핵심
분산 V = \Sigma(편차)2n, 표준편차 \sigma = \sqrt{V}
표준편차가 작을수록 자료가 평균 주변에 모여 있다
🎯 시험 포인트
①편차의 합 = 0 (항상 성립 -- 계산 검증에 활용)
②분산 = 편차 제곱의 평균, 표준편차 = 루트 분산
③표준편차가 작다 → 자료가 고르게 모여있다
④극단값 있으면 평균 대신 중앙값이 적절
⑤분산의 단위는 원래 단위의 제곱, 표준편차는 원래 단위와 같다