1. 영가설(零假設, null hypothesis, 귀무가설)이란?

반응형

1. 영가설(零假設, null hypothesis, 귀무가설)이란?


학생들을 가르치다보면 영가설에 대해 어려워하는 이들을 많이 보게 된다. 이에 대해 정확히 이해하지 못하다보니 기껏 분석은 제대로 해놓고 결론을 틀리게 내리는 경우도 종종 보게 된다. 왜 이런 문제가 생기는 것일까?
사실 이건 조사연구와 데이터분석의 차이점 때문에 발생하는 문제이다. 조사연구는 이론적으로 만들어지는 개념정립을 바탕으로 풀어 설명한다면, 데이터분석은 숫자를 이용한 사실의 검정에 초점을 둔다. 
일반적으로 교재에서는 영가설을 “모집단의 특성에 대해 옳다고 제안하는 잠정적인 주장”이라고 설명하는데, 이게 무슨 말인지 이해가 쉽지 않다. 특히 이공계가 아닌 인문계열 등에서는 이해했다고 하더라도 이를 인문학적으로 받아들이기도 한다. 이들에게 위 문장을 “모집단의 특성이 표본집단의 특성과 차이가 없을 것이라는 주장”이라고 바꾸어 표현할 수 있다고 어떻게 설명할 수 있을까?

하여 철저하게 데이터분석의 측면에서만 개념을 단순화하여 설명해보고자 한다. 영가설에서의 零은 숫자 0을 말한다. 그리고 영가설의 영어 표현인 null hypothesis의 null도 말 그대로 ‘없다’는 뜻이다. 즉 영가설이란 ‘차이가 없다’는 주장이라고 정의할 수 있다. 영가설의 다른 표현인 귀무가설 또한 마찬가지 의미이다. 귀무(歸無)란 ‘차이가 없다(無)는 사실을 전제하는(歸)’ 가설이 귀무가설인 것이다. 따라서 영가설은 항상 “A와 B는 차이가 없다.”와 같은 식으로 표현된다.

영가설은 "차이가 없다"는 가설이다.

이제 다시 돌아가 영가설의 짝을 이루는 대립가설(alternative hypothesis)은 이러한 영가설에 대해 반대쪽에 서는 가설을 말한다. 그런데 이를 다른 표현으로는 연구가설이라고 부르기도 한다. 하지만 여기서는 연구가설이라는 표현은 잠시 잊자. 영가설의 반대가 되는 가설이 대립가설이며, “차이가 있다”는 가설이라는 사실만 기억하자.
그리고 데이터분석을 통해 우리가 검정할 수 있는 것은 이런 영가설을 기각하는 것밖에 없다. 

반응형