본문 바로가기
기초통계학

통계의 기초 개념

by 찬란한 혜성 2024. 3. 3.
반응형

이번 포스팅은  과학과 통계의 정의 및 통계의 역할에 대하여 설명한다.

또한 통계의 오용과 통계적 오류 및 통계에서 컴퓨터의 활용 등에 대하여 알아본다.

 

 

1장) 통계와 통계 방법

 

 1. 과 학 

 

    과학에 대한 정의는 다양하지만 크게 내용에 의한 정의와 과정에 의한 정의로 분류할 수 있다.
내용에 의한 정의는 " 과학은 통합된 지식의 축적이다."라는 것인 반면,과정에 의한 정의는 " 과학은 자연의 중요한 변인을 발견하고 변인 간의 관계를 밝히며, 변인의 관계를 설명하는 활동이다"라고 할 수 있다. 이때 과학의 과정은 경험적이다.
곧 과학적 연구란 관찰에 근거를 두어야 한다.

과학의 목적 중 하나는 복잡한 현상을 간단하게 하고 어떤 특성에 따라 분류하고 조직하는 데 있다.
우리는 일상생활에서 수없이 많은 수치의 혼돈 속에서 삶을 영위하고 있다.이와 같은 수치를 어떻게 다스리고 정리하느냐의 문제는 그 혼돈 속에 숨어 있는 질서와 법칙을 어떻게 찾느냐 하는 것이다.

우리는 어떠한 수치를 다룰 때 주먹구구나 어림짐작이 아니라 사실에 대한 정확한 추정을 기초로 한 과학적 계획을 시도한다. 특히 행동과학에서 다루는 경험적인 자료는 그 의미를 과학적인 준거 위에서 찾아야 한다.
이를 위해 통계적 방법의 이해와 소양을 갖추어야 한다.

 

 2. 통 계

 

 사회과학은 사회현상을 체계적으로 설명하기 위하여 이론을 정립하는 경험적 방법을 사용한다. 새로운 이론을 도출하거나 기존에 존재하는 이론을 지지 , 거부 혹은 수정하기 위하여 경험적 연구 방법을 사용할 때에는 자료 수집을 거쳐 모은 자료를 검증함으로써 결론에 도달하는 절차를 거치게 된다. 통계(statistics) 란 이론을 도출, 지지, 거부, 수정하기 위하여 수집한 자료를 가지고 가설을 검증하는, 즉 확률적으로 판정하는 수리적 논리라고 정의할 수 있다.

예를 들어 성별에 따른 청소년이 선호하는 의상 디자인에 차이가 있는가를 알고자 한다. 이러한 현상의 가상적인 설명을 위하여 연구자는 우선 남녀 청소년이 선호하는 의상 디자인을 조사할 것이다. 이렇듯 남학생과 여학생의 측정된 의상 디자인의 종류를 가지고 남녀 청소년이 선호하는 디자인에 차이가 있는지 혹은 없는지의 잠정적 가설을 증명할 수 있다.

 

3. 통계의 역할

 

인간이 과학을 사용하는 목적은 무엇보다도 인간 생활에서 발생하는 사건이나 현상을 이해하고 설명하며, 나아가서 예측하고 통제하려는 데 있다. 이는 인간을 둘러싼 복잡한 현상을 간단하게 정리.분류.조직하여, 이를 기술 하거나 설명 또는 예측하는 것을 의미한다. 통계는 이러한 과학의 목적을 달성하기 위한 수단으로서 어떤 사건이나 현상을 요약하고 조직화하여 과학적인 연구를 수행하게끔 하는 역할을 하는 것이다.

통계학은 크게 두 가지 목적을 가지고 있다. 얻어진 자료를 단순히 설명.묘사하려는 것과 더 나아가 얻어진 자료의 결과를 일반화하려는 것이다.

 

예를 들어 남녀 성별에 따른 청소년이 선호하는 의상 디자인에 차이가 있는지를 비교하고자 할 때, 남녀 차이를 비교하여 얻은 결과를 그 얻어진 자료에 국한 시키는 경우와, 그 결과를 어느 특정 국가, 특정 지역에 살고 있는 남녀에게 적용시켜 일반화시키는 경우가 있을 것이다. 이때 전자를 기술통계라고 하고 후자를 추리통계라 한다.

 

기술통계는 수집된 자료의 특성을 요약. 정리해 주는 것이고, 추리통계는 분석된 자료를 근거로 모집단의 특성을 추론해 주는 역할을 하는 통계 방법이다. 

 

4. 통계의 오용과 통계적 오류

 

통계의 오용이란 무의식적이건 의식적이건 간에 사실을 왜곡 . 오해시키는 통계의 사용을 뜻한다 (김병수 외,1987)

따라서 오용된 통계는 사실을 오해시킨다는 점에서 허위성이 내포된 것이고 무의미하게 사용되는 것도 이에 포함될 수 있다. 그러므로 통계의 오용은 두 가지 , 즉 엉터리 통계와 무의미한 통계 로 나누어 설명할 수 있다. (최종후,이재창,1990)

엉터리 통계란 말 그대로 허위성이 내포된 통계 방법을 의미하며 , 무의미한 통계는 통계 방법을 적용하는 것이 자료를 이해하고 적용하는 데 전혀 도움이 되지 않는 경우를 말한다.

 

또는 통계적 오류는 통계분석에서 통계적 방법을 잘못 적용하거나 통계해석을 잘못하여 유발되는 사실의 왜곡을 말하며, 통계적 기법을 잘못 적용한 경우와 분석 결과를 잘못 해석한 경우로 나눌 수 있다.

 

궁극적으로 통계의 오용과 통계적 오류는 연구자의 윤리관과 지식으로 막을 수 있다. 통계 이용자나 통계적 기법을 활용한 연구자 모두 자신의 그릇된 편견이나 주관에 의해 통계를 자기방어 수단으로 사용할 때, 그것이 사회에 미치는 문제가 심각해질 수 있다는 것을 알아야 한다.

 

5. 통계에서의 컴퓨터 활용

 

통계에서 컴퓨터의 사용은 과거 수십 년을 거치면서 크게 증가하였다. 실제로 오늘날 사회과학 연구에서 거의 모든 연구 자료는 통계 컴퓨터 프로그램을 사용하여 분석하고 있다. 컴퓨터를 사용하면 시간과 노력을 아낄 수 있고 계산상의 오류를 줄일 수 있으며 자료를 표로 쉽게 나타낼 수 있다. 또한 많은 자료를 관리 할 수 있다.

 

여러 컴퓨터 프로그램을 통계분석에 이용할 수 있는데 , 가장 많이 사용하는 프로그램으로는 SPSS(Statistical Package for the Social Sciences), SAS (Statistical Analysis System) 등이 있다.

 

이번포스팅은  통계와 통계방법에 대해 알아보았다.

다음 포스팅으로는 통계를 이해하기 위한 기본개념과 용어 그리고 기본법칙을 설명하는 통계학의 기본용어에 대해 알아보기로 한다.

 

반응형

'기초통계학' 카테고리의 다른 글

통계학의 기본용어  (1) 2024.03.03