이번 포스팅은 모집단과 표본 / 합 /기술통계 와 추리통계 를 알아보도록 한다.
변인에 관한 포스팅은
2024.03.03 - [기초통계학] - 통계학의 기본용어 이곳에서 확인해주시길 바란다.
2. 모집단과 표본
사회과학 분야를 연구할 때에는 대부분 연구 대상의 천체 사례를 모두 다루는 것이 아니라 다만 그 전체 사례 중 일부분만을 다루게 된다. 예를 들어 어떤 교사가 새로운 교수법을 개발하여 그 효과성을 검증하려고 할 때 전국의 모든 학습자를 대상으로 새로운 교수 방법을 실험하기는 거의 불가능하다. 따라서 몇몇 학교 혹은 학급을 선택하여 실험 대상의 일부분만을 조사하게 된다. 그러나 실제로 연구의 목적은 몇몇 학교나 학급에 있는 것이 아니라 '새로운 교수 방법이 전체 학습자에게 효과가 있는가?'에 있다.
이때 연구의 주된 대상이 되는 전국의 모든 학습자 집단을 모집단(population) 혹은 전집이라 부르고, 실제의 연구대상이 된 부분적인 집단을 표본 (sample) 이라 하며 표본의 대상 수를 표본 크기 라 한다. 그리고 전체로서의 모집단에서 부분으로서의 표본을 추출하는 과정을 표집(sampling)이라 한다. 표집을 통해 모집단에서 선택된 표본을 가지고 모집단을 추론하는 것이므로 표집과정은 모집단의 특성을 제대로 대표할 수 있는 표본을 선정해야 한다.
모집단의 특성을 나타내는 값을 모수치(parameter)라 하고, 표본의 특성을 나타내는 값을 추정치(estimate)라 한다. 이를 통계치(statistic) 혹은 통계량이라고도 한다. 이 통계치를 사용하여 알기가 쉽지 않은 모집단의 모수치를 추정한다.
3. 합
통계에서 행해지는 가장 빈번한 연산의 하나는 분포에 있는 점수의 전체 혹은 부분 합 (summation) 이다. 매번 이 연산을 할 때 '모든 점수의 합'이라고 쓰는 것이 번거롭기 때문에 상징적 약어가 사용된다. 그리스 대문자 시그마(∑)는 합의 연산을 나타낸다. 합에 대한 수학적 표기 방식은 공식 (1) 과 같다.
이것을 '변인 X의 1부터 N 까지의 합' 이라고 읽는다. 시그마의 위와 아래에 있는 표기는 합에 오느 점수가 포함되어야 하는지를 ㅍ표시한다. 시그마 아래의 표기는 합에서 첫 점수를 나타내고 시그마 위의 표기는 마지막 점수를 나타낸다. 그래서 공식(1) 은 첫 점수에서 시작해서 N번째 점수까지 변인 X의 점수를 더하는 것을 나타낸다. 그래서 이것을 등식으로 나타내면 공식 (2) 와 같다.
그런데 합이 모든 점수(1부터 N까지) 를 포함할 때 합의 표기 방식은 종종 시그마의 위와 아래의 표기를 생략하고 쓴 기호 i 도 생략한다. 그래서 (3)과 같이 사용한다.
4. 기술통계와 추리통계
통계는 크게 기술통계와 추리통계로 구분된다. 기술통계 (descriptive statistics) 는 수집된 자료를 쉽게 이해할 수 있도록 요약, 서술하고 현상을 설명하려는 목적을 가진다. 즉, 어떤 자료에서 얻은 결과를 그 대상 이외의 다른 대상에게 적용하지 않고 해석의 의미를 국한시키는 통계다. 예를 들어 교사가 자기 반 학생의 기말고사 성적을 알고자 하여 이 집단의 평균, 표준편차를 구해서 자기 반 학생의 기말고사 점수의 특성을 설명하였다면 이는 기술통계라 할 수 있다. 왜냐하면 이는 얻어진 자료의 속성을 설명하여 주는 것에 그치고 통계로 모집단의 속성을 예견하여 주지 않기 때문이다.
추리통계 (inferential statistics)는 모집단에서 추출된 표본을 분석하여 이를 기초로 모집단의 특성을 추정한다. 추리통계의 목적은 표본의 특성인 통계치(statistic)에서 모집단의 특성을 나타내는 모수치를 확률적으로 추정하는 데 있다.
추리통계에서는 사례 수가 아주 많은 모집단 전체를 분석하는 것은 거의 불가능하거나 실용적이지 못하기 때문에 추출이 가능한 표본의 사례만을 이용한다. 예를 들어 초등학교 5학년 학생의 몸무게 평균을 알고자 할때, 현실적으로 모든 학생의 몸무게를 조사하기는 어렵다. 이런 경우에 5학년 학생을 대표할 수 있는 표본을 추출하여 그 표본을 대상으로 초등학교 5학년 학생의 몸무게 평균을 추정하는 것이 바람직하다.
특히 추리통계는 모집단 분포에 따른 가정 여부에 딸 모수통계와 비모수통계로 구분된다.
모수통계 는 모집단의 분포에 관한 어떤 가정에 입각한 통계적 방법인 반면에 비모수통계 는 모집단 분포에 관한 특정한 가정이 필요하지 않다.
이번 포스팅은 모집단과 표본 , 합 , 기술통계와 추리통계에 대해 알아보았다.
다음시간에는 표집방법과 측정과 척도 ,타당도와 신뢰도 로 통계학의 기본용어를 마무리 해보도록 하겠다.