본문 바로가기

카테고리 없음

자유도(degree of freedom)


자유도의 개념

(출처 : http://dain.tistory.com/m/317)

자유도의 개념은 표준편차의 개념과 연관되는 개념


표준편차 개념에 있어서 중요한 조건 중의 하나는 


 ∑(X-M)=0(X는 각 사례의 값, M은 평균 값)


예를 들어, 5명의 수학점수가 각각 21점, 23점, 24점, 27점, 30점이라고 가정한다면,

이때의 평균값은 25점

그렇다면 ∑(X-M)={(21-25)+(23-25)+(24-25)+(27-25)+(30-25)}=0 이다.


이 때  ∑(X-M)=0이 되기 위해서는 5명의 사례중 4사례는 어떠한 값이 되어도 상관없지만, 나머지 한 값은 반드시 특정한 값을 가져야 함


"어떠한 값이 되어도 상관없는" 4사례를 자유도(Degree of Freedom)이라고 함


자유도의 사용용도

(출처 : https://brunch.co.kr/@zhoyp/174)

표본의 분산을 구할 때 자유도를 이용


모집단의 분산() ∑{(X-M)의 제곱}을 N으로 나누어 계산

표본집단의 분산()은 ∑{(X-M)의 제곱}을 N-1으로 나누어 계산


왜?

모집단의 분산값에 최대한 근접하게 만들기 위해!


분산을 구하는 식의 분자( ∑{(X-M)의 제곱})에 제곱이 있으니 사례수가 많을수록 분자값이 커짐. 즉, 분산값은 사례수가 많을수록 커지는 경향이 있음


그러나 표본은 모집단에서 일부만 추출하는 것이므로 모집단보다 사례수가 적고 표본의 사례수가 적다면 표본의 분산값도 작아지는 것은 분명함


표본을 추출하는 목적은 표본의 통계치로 모집단의 모수추정하는 것

하지만 표본의 분산값이 너무 작게 나온다면 통계적 추정의 의미가 삭감됨(불편하지 않고 편향됨)

불편 추정 값을 구하기 위해 표본의 분산을 모집단의 분산에 근사해지게 하는 비율을 찾았는데 그것이 바로 N/(N-1)임

이를 표본의 분산에 N/(N-1)만큼 곱하면 모집단의 분산에 근사하게 됨

그런데 이때 분산의 원래 계산식에 있는 분모의 N이 약분되어 N-1만 남게 됨


즉, 표본의 분산을 모집단의 분산에 근사하게 불편추정하기 위해 N이 아닌 N-1로 나누게 되는데 이를 자유도라고 함


그러나 표본의 개수가 점점 커짐에 따라 모분산과 표본분산간의 차이도 점점 작아지게 됨

따라서 표본의 개수가 30개 이상일 경우에는 표본의 분산을 구할 때 굳이 자유도를 고려하지 않아도 됨


카이제곱 분포의 계산과정에서 변수의 제곱값 하나를 잃게 됨( 그래서 자유도 : N-1)

F분포는 2개의 카이제곱 분포 간의 비율이기 때문에 자유도는 N-2



자유도관련 


미국통계학회(ASA) 최초의 여성 학회장이자 컬럼비아대학에서 통계학과 교육학을 가르친 Hellen Walker가 '자유도' 개념을 설명하는 짧은 에세이

Degrees_of_Freedom.pdf

(출처 : http://www.statground.org/index.php?document_srl=5825&mid=FreeBoard)