:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
19/01/04 22:15
저것만으로는 계산 못하고, 분포의 형태를 알고 계산이 가능할 때
가령 집단의 크기가 아주 크다거나 해서 정규 분포를 따른다고 한다면 계산이 가능해집니다. 예를 들어 900점, 1100점 2명이라고 할 때와 800점, 1000점, 1000점, 1200점 4명일 때 둘 다 평균점수 1000점에 표준편차 100이지만 950~1050 구간에 샘플이 들어갈 확률은 아예 다릅니다.
19/01/04 22:28
그 계산이 가능하다고 할 때 그 개념을 뭐라고 부르나요?
그니까 어떤 집단이 다른 집단에 비해 값이 균일하게 분포하고 튀는 값이 적다는 것을 나타내주는 개념이요.
19/01/04 22:33
표준편차/평균을 CV라고 합니다.
https://ko.wikipedia.org/wiki/%EB%B3%80%EB%8F%99_%EA%B3%84%EC%88%98
19/01/04 23:19
(수정됨) 정규 분포로 분포의 형태를 고정하고 평균, 표준편차의 크기를 알면 분포를 아예 다 계산할 수 있습니다.
평균 1000점에 표준편차 100인 집단이 정규 분포의 형태라고 할 때, 샘플 하나를 뽑을 때 950~1050에 속할 확률은 38.3% 900~1100에 속할 확률은 68.26% 850~1150에 속할 확률은 86.64% 정도 됩니다. (이러한 계산은 표준정규분포표를 검색해보세요.) 그러니 추가로 개념을 더할 필요가 없이 평균, 표준편차 만으로 분포가 얼마나 균일한지 정도를 매길 수 있습니다. 반대로 분포의 형태가 다르면 하나의 개념을 더하는 정도로는 일반적인 비교가 제대로 될 수 없습니다. 앞의 덧글에서 예를 든 것을 연장해보면, 950~1050 구간에는 첫번째 집단은 0%, 두번째 집단은 50%지만, 850~1150 구간에서 첫번째 집단은 100%, 두번째 집단은 50%입니다. 어떻게 비교하는가에 따라, 혹은 균일성을 어떻게 정의하는가에 따라 우열이 반대로 매겨지게 되죠.
19/01/05 04:41
비교할 집단이 같은 부류의 데이터 (예를들면 시험점수) 라면 표준편차라는 개념 자체가 질문하신 내용의 답이 될겁니다.
단순하게 시험점수 분포 같은 경우를 생각하면 평균점수와 상관없이 표준편차가 더 작은 집단이 통계적으로는 더 균일하다고 볼 수 있습니다. 각 집단의 N이 너무 작으면 쉽게 한 쪽이 더 균일하다고 말하기 힘들수도 있긴 한데, 데이터의 수가 충분히 많다면 표준편차 그 자체가 균일성을 말해준다고 봐도 무방해요. 평균 1000점에 표준편차 100인 경우나 평균 300점에 표준편차 100인 경우나 분포의 대략적인 중심 위치(평균)만 다를 뿐 퍼져있는 정도는 같다고 볼 수 있으니까요. 다만 데이터가 너무 적거나, 혹은 너무 크게 튀는 값(outlier)이 있다거나 하는 경우는 해당 부분을 처리하는 방식을 따로 고민하긴 해야합니다. 예를들어, N=100인 두 그룹이 있다고 할 때, A그룹은 평균이 100이고 표준편차가 1인 정규분포 그룹의 경우로 말 그대로 표준편차가 1이고 100을 기준으로 위아래로 조금씩 편차가 있는 데이터라고 하고, B그룹은 98개의 값이 100이고 두개의 값만 50, 150인 경우라고 할 때, B그룹은 표준편차를 구하면 7.1정도가 됩니다. 평균은 A와 같이 100이 되고요. 수치상으로는 A가 균일하지만 B의 아웃라이어 두개를 제외해버리면 B그룹의 표준편차는 아예 0이 되어버리는 상황이죠. 그리고 두 집단, 혹은 여러 집단이 일대일로 같은 데이터로 볼 수 없을 땐 표준편차를 구하기 전에 동일한 잣대로 볼 수 있는 정규화 등을 먼저 거쳐야 합니다. 50점 만점인 시험과 1000점 만점인 시험의 점수의 균일성을 그냥 수치로만 놓고 볼 수는 없으니까요. 일반적으로 이런 경우 한 쪽 점수와 같게 바꾸든, 백분율로 바꾸든 하는 방식을 쓰게 되겠죠.
|