■ 목차
1. 함수 설명
2. 분산 - 통계의 기본 이해
3. Var 함수의 구문 / 사용방법
4. Var 함수 사용해 보기 - 분산 구하기
** 핵심 요약
- 오늘은 통계함수 Var 함수에 대해서 얘기를 해보도록 하겠습니다.
- 사실 통계가 어렵지 엑셀 Var 함수는 어려운 부분이 없습니다. ^^
- 저도 전공자가 아니기 때문에 제가 아는 부분을 설명을 드리는 것이고 간단하게 읽어보시고
- 이런 게 있구나 정도의 개념적인 부분이랑 주의하실 부분에 대해서 이해를 해주시면 될 듯합니다.
1. 함수 설명
- 엑셀에서 통계함수 중에 분산(Variance)을 구해주는 함수로 Var 함수가 있습니다.
- 분산이라면 평균이라는 중심값에서 데이터의 집합이 얼마나 떨어져 있는지 (= 벗어나 있는지)를 표현하는 통계적인 숫자입니다.
- 수식으로는 Sum ( ( x - avg ) ^ 2) / n으로 표현을 할 수 있으며
- 각각의 데이터로 평균값과의 차이를 구하고 제곱 함으로써 음수/양수 합계가 0이 되지 않고
- 크게 차이가 날수록 영향도가 커지도록 평균과의 차이값에 제곱을 하도록 되어 있습니다.
- 사실 실무에서 편차의 정도를 판단하는 용도로는 표준편차(Stdev 함수)나 변동 계수라 C.V (Coefficient of variation = Stdev / avg )를 많이 사용하고 있지만
- Stdev 함수나 C.V의 기본이 되는 개념으로 이해를 해주시면 되겠습니다.
- 그리고 참고로 실무에서 편차가 중요한 이유는 진정한 실력과 전략이 편차에서 나오기 때문입니다.
- 동일한 평균 70점이라도 모든 과목을 70점을 받는 학생이랑 50, 100, 60 점을 받아 평균이 70점이 되는 학생의 공부전략은 다르고
- 공정의 능력도 동일하게 해석이 되기 때문에 다른 전략으로 접근이 필요하기 때문입니다.
- 그리고 항상 뭔가의 실적이 나오면 분석하는 가장 기본이 되는 통계 분석으로 평균(Average 함수), 표준편차(Stdev 함수), C.V (Stdev / average 함수)입니다.
- 그리고 그 출발이 분산이기 때문에 사용을 그렇게 하는 함수는 아니지만 한 번 정도 어떤 함수인지 어떤 내용인지 알고 계시면 좋을 듯합니다.
- 통계 분석하면 항상 혼돈이 되는 모집단, 표본집단에 대해서도 이번 기회에 간단하게 이해를 하시면 좋을 듯합니다.
- 2개가 함수도 다르고 결과 값도 다른데 항상 혼돈되는 부분이 그래서 어떤 함수를 사용해야 하는 건지 하는 부분입니다.
- 모집단과 표본 집단의 정의 및 모집단일 때 사용하는 함수는 이것이고 표본 집단일 때 사용하는 함수는 이것이다 까지는 많이들 설명이 되어 있는데
- 그래서 내가 지금 어떤 함수를 사용해야 하는지 명확하게 얘기를 해주는 내용은 잘 찾기 힘든 것 같습니다.
- 결론부터 예기를 드리면 거의 대부분은 표본집단(Var 혹은 Var.S 함수)입니다. 모집단이라는 것은 이상적인 전체의 집단을 얘기하고 불변의 값이 되는 경우가 많기 때문입니다.
2. 분산 - 통계의 기본 이해
- 사실 저는 통계를 전공한 사람은 아닙니다.
- 실무적으로 데이터를 분석할 일들이 많기 때문에 통계에 관심을 가지고 있기는 하지만 제가 이해하는 수준이고
- 이런저런 통계적인 개념이 있다고 같이 이해를 해주시면 될 것 같습니다.
- 통계적인 지식이 있으시거나 모집단, 표본집단의 분산을 구분하실 수 있으신 능력자분들은 본 내용은 그냥 넘어가셔도 됩니다.^^
- 1) 분산(Variance) : 평균에서 벗어나는 정도
- 그래서 데이터 집합의 평균을 구하고 각 데이터에서 평균을 빼기를 해주면 (데이터 - 평균) 평균에서 차이나는 정도를 알 수가 있습니다.
- 이 차이나는 숫자를 모두 더하게 되면 +/- 가 되어 합계는 0이 되어 버리기 때문에 데이터 집합의 "평균에서 차이나는 정도"를 구할 수 없게 되는데
- 그래서 나온 개념이 차이나는 정도를 제곱( = (데이터 - 평균) ^2 )을 하게 됩니다. 그렇게 되면 차이나는 정도가 모두 양수가 되고
- 제곱된 값을 모두 더하게 되면 "평균에서 벗어나는 정도"를 구할 수 있게 됩니다.
- 그리고 최종적으로 데이터의 개수로 나누어 주게 되면 분산을 구할 수 있게 되는데
- 이때 "모집단"의 경우는 데이터의 개수 n으로 나누어 주고 "표본 집단"의 경우 (n-1)로 나누어 주게 됩니다.
- 2) 분산(Variance) : 모집단의 분산, 표본 집단의 분산
- 조금 혼돈이 되는 개념이 나옵니다. 모집단과 표본 집단입니다. ㅠㅠ
- "모집단"은 영어로는 Population으로 전체 인구라는 뜻을 가집니다 전체 인구 즉, 알고 싶어 하는 전체 대상입니다.
- 대한민국 국민의 평균 키를 알고 싶다면 모집단은 "대한민국 인구 전체"를 의미합니다,
- 모집단의 평균, 분산, 표준편차라는 값은 정해진 값, 즉 상수입니다. 다만 우리가 모를 뿐입니다.
- 우리가 특정 제품을 딱 10,000를 생산했다고 하면 10,000개를 모두 측정하고 평균, 분산, 표준편차를 구한다면 이는 모집단의 통계 데이터가 될 것입니다.
- 그런데 현실적으로 모두 측정하기가 힘든 경우가 거의 대부분인데 이럴 때는 샘플을 잘 뽑아서 계산을 하게 되고
- 이렇게 샘플로 뽑은 데이터의 통계값을 표본(Sample) 집단의 평균, 분산, 표준편차라고 합니다.
- 영원불변의 진실된 전체에 대한 값을 알고 싶다. 모(Population) 집단을 얘기하는 것입니다.
- 전체를 알고 싶기는 한데 현실적으로 불가능하다 그러면 표본(Sample) 집단을 얘기하는 것입니다.
- 그리고 거의 대부분의 데이터는 표본(Sample) 집단입니다. ^^
- 그래서 모집단은 데이터의 개수인 n으로 나누어 분산, 표준편차 등을 구하고
- 표본 집단은 데이터 개수를 하나 줄여서 n-1로 나누어 분산, 표준편차 등을 구해 줍니다.
- 그리고 표본 집단의 개수가 무한이 커지게 되면 모집단 = 표본 집단이 되게 됩니다.
- 거의 대부분 잘 모르겠으면 그냥 표본 집단으로 계산을 하시면 될 듯합니다.
- 엑셀에서도 아래와 같이 모집단, 표본 집단의 분산을 구하는 함수가 다르게 되어 있습니다.
- 모(Population) 집단 분산 : VAR.P 함수 (VARP 함수 - 엑셀 2007 이전 버전 함수)
- 표본(Sample) 집단 분산 : VAR.S 함수(VAR 함수 - 엑셀 2007 이전 버전 함수)
- 엑셀이 함수이름을 바꾸었습니다. VAR 함수는 VAR.S 함수로, VARP 함수는 VAR.P함수로
- 둘 다 사용이 가능하지만 VAR.S, VAR.P 함수 사용을 추천드립니다.
- Var, Varp, Var.S, Var.P 함수 모두 구문 및 사용법이 동일하고 구버전 신버전 및 모집단/표본 집단을 구분해서 사용하는 정도입니다.
3. Var 함수의 구문 / 사용방법
- 아래 구문은 엑셀 도움말의 설명 내용입니다. 우리는 엑셀 함수의 구문을 다 외울 수도 없고 그럴 필요도 없습니다.
- 다만 엑셀 도움말과 함수사용 시 표시되는 풍선도움말의 용어들에 익숙해질 필요가 있기 때문에 기회가 될 때마다 편하게 봐주시기 바랍니다.
- VAR(number1, [number2],...)
- number1 필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다.
- number2,... 선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 255개까지 지정할 수 있습니다.
- number1, 인수로는 number 즉 "숫자"가 들어갑니다. 보통은 숫자가 들어가 있는 셀 참조 주소를 지정해 주어 사용을 합니다.
- 특히 주의를 해주실 부분은 바로 "숫자"입니다. 숫자가 아닌 것들로 문자, 논리값(True, False) 그리고 숫자처럼 보이는 문자가 있습니다.
- 엑셀에서 분산, 표준편차 등의 함수를 사용하실 때는 숫자여부를 포함하여 아래 부분정도 주의를 해주시고 사용을 해주시면 됩니다.
- 물론 내가 사용하기 있는 통계 함수의 통계적인 의미는 알고 계셔야 결과 데이터를 효율적으로 활용이 가능하겠지요. ^^
- ① 모집단, 표본집단의 어느 함수를 사용할 것인가? - 거의 대부분은 표본집단이다 (Var.S 함수 혹은 Var 함수 사용)
- ② 논리값, 문자형식의 데이터가 있다면 반드시 숫자로 변형 후 계산을 해주자. - 모두 무시된다.
- 논리값, 문자의 경우 "셀 참조 형식"으로 입력된 때랑 "직접 인수 값으로 입력" 할 경우가 다르기는 하지만
- 현실적으로 데이터를 하나하나 직접 인수로 입력하는 경우는 없기 때문에 그냥 결과적으로 모두 무시한다고 이해를 하시면 됩니다.
4. Var 함수 사용해 보기 - 분산 구하기
- 다음 학급반 성적에 대한 분산을 구해보도록 하겠습니다.
- Var 함수는 Var.S 함수와 동일한 함수이며 표본집단 ( = Sample, 샘플 집단)에 대한 분산을 구해주는 함수입니다.
- 가능한 Var 함수대신에 Var.S 함수를 사용해 주시기 바랍니다.
- 사용방법은 Sum, Average 함수 등과 동일하게 함수를 입력하고 셀 참조 주소를 마우스로 지정해서 등록해 주시면 됩니다.
- 데이터를 분석하는 경우 일반적으로 사용하는 통계 함수로는 합계, 평균, 표준편차, 최대, 최소 정도입니다.
- 보다 다양한 통계적인 분석이 있기는 하지만 가장 기본이 되는 함수입니다.
- 그리고 평균의 경우는 조금 다양한 평균이 있는데 산술평균(Average 함수), 중앙값 (Median 함수)과 최빈값 (Mode 함수)이 있습니다.
- 거의 대부분 산술평균 (Average 함수)를 사용하기는 하지만 상황에 따라서 조금씩 다르게 사용을 하고 있으니 참조 바랍니다.
- 그리고 이 모든 통계적인 분석은 모두 "숫자"에 대한 것이니 데이터 관리를 잘하시는 부분이 중요할 것 같습니다.
- 오늘도 수고 많으셨습니다.
** 핵심 요약 : Var 함수 사용법 - 분산을 구해보자(Varp, Var.p, Var.s 함수)
1. 함수 설명
- Var 함수는 통계함수로 분산(Variance)을 구해주는 함수이다.
- 분산이라면 평균이라는 중심값에서 데이터의 집합이 얼마나 떨어져 있는지를 표현하는 통계적인 숫자이다.
- 실무에서는 표준편차(Stdev 함수)나 변동계수 C.V를 많이 사용한다.
2. 분산 - 통계의 기본 이해
- 1) 분산(Variance) : 평균에서 벗어나는 정도
- "(데이터 - 평균)^2"으로 차이값을 제곱해서 합계가 0이 되지 않게 하고
- 모집단의 경우 데이터의 개수 n으로 나누어 주고, 표본 집단의 경우 (n-1)로 나누어 준다.
- 2) 분산(Variance) : 모집단의 분산, 표본 집단의 분산
- 거의 대부분 표본 집단이고 전체의 값을 측정하거나 알 수 있는 경우 모집단의 분산을 구하는 공식을 사용한다.
- 모(Population) 집단 분산 : VAR.P 함수 (VARP 함수 - 엑셀 2007 이전 버전 함수)
- 표본(Sample) 집단 분산 : VAR.S 함수(VAR 함수 - 엑셀 2007 이전 버전 함수)
3. Var 함수의 구문 / 사용방법
- VAR(number1, [number2],...)
- number1 필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다.
- number2,... 선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 255개까지 지정할 수 있습니다.
- number1, 인수로는 number 즉 "숫자"가 들어간다. 보통은 숫자가 들어가 있는 셀 참조 주소를 마우스로 지정해서 사용한다.
- ① 모집단, 표본집단의 어느 함수를 사용할 것인가? - 거의 대부분은 표본집단이다 (Var.S 함수 혹은 Var 함수 사용)
- ② 논리값, 문자형식의 데이터가 있다면 반드시 숫자로 변형 후 계산을 해주자. - 모두 무시된다.
4. Var 함수 사용해 보기 - 분산 구하기
- Var 함수는 Var.S 함수와 동일한 함수이며 표본집단 ( = Sample, 샘플 집단)에 대한 분산을 구해주는 함수이다.
- 사용방법은 Sum, Average 함수 등과 동일하게 함수를 입력하고 셀 참조 주소를 마우스로 지정해서 등록해 주면 된다.
- 수식 : =VAR.S(C3:C7)
[엑셀 함수 강좌-플러스] - 999. 엑셀 함수 Plus 목차
* 엑셀 관련 궁금하신 거나 어려운 점이 있으시면 자유롭게 질문을 해주세요.
* 가능한 도움을 드릴 수 있도록 하겠습니다.
* 저도 많이 알지는 못하지만 누구나 그렇듯 시작이란 게 있고 경험이란 게 다를 것 같습니다.
* 편하게 문의하시면 됩니다. 저도 모를 수 있다. 감안해 주시고.
- ILU, SH -
댓글