PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2019/01/04 21:54:30
Name moqq
Subject [질문] 통계 질문. 집단의 균일성 판단..
통알못인데 궁금한게 생겼습니다..

두 집단 A, B 가 있다고 할 때

변수들을 데이터 분석하면 통계와 표준편차가 나오잖아요.

A집단의 평균점수가 1000점에 표준편차가 100

B집단의 평균점수가 980에 표준편차가 200

이라고 하면 A,B 집단의 평균점수는 큰 차이가 없지만

B집단 내의 편차가 더 크고, B 집단에서 샘플을 고르면 그 샘플이 평균을 벗어날 확률이 더 크다는 걸 계산해보고 싶다면

어떤 방법으로 계산하나요?

단순히 평균값 대비 편차가 크다? 라는 것 말고 왠지 계산할 수 있는 방법이 있을 것 같은데 말이죠..

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
19/01/04 22:15
수정 아이콘
저것만으로는 계산 못하고, 분포의 형태를 알고 계산이 가능할 때
가령 집단의 크기가 아주 크다거나 해서 정규 분포를 따른다고 한다면 계산이 가능해집니다.

예를 들어 900점, 1100점 2명이라고 할 때와 800점, 1000점, 1000점, 1200점 4명일 때
둘 다 평균점수 1000점에 표준편차 100이지만 950~1050 구간에 샘플이 들어갈 확률은 아예 다릅니다.
19/01/04 22:28
수정 아이콘
그 계산이 가능하다고 할 때 그 개념을 뭐라고 부르나요?
그니까 어떤 집단이 다른 집단에 비해 값이 균일하게 분포하고 튀는 값이 적다는 것을 나타내주는 개념이요.
낚시꾼
19/01/04 22:33
수정 아이콘
표준편차/평균을 CV라고 합니다.
https://ko.wikipedia.org/wiki/%EB%B3%80%EB%8F%99_%EA%B3%84%EC%88%98
19/01/04 22:41
수정 아이콘
고맙습니다. 그냥 편차를 평균으로 나누는거네요.. 예상되는 오차라든가 새로운 개념이 있지 않을까 싶었는데.
19/01/04 23:19
수정 아이콘
(수정됨) 정규 분포로 분포의 형태를 고정하고 평균, 표준편차의 크기를 알면 분포를 아예 다 계산할 수 있습니다.
평균 1000점에 표준편차 100인 집단이 정규 분포의 형태라고 할 때,
샘플 하나를 뽑을 때 950~1050에 속할 확률은 38.3%
900~1100에 속할 확률은 68.26%
850~1150에 속할 확률은 86.64% 정도 됩니다.
(이러한 계산은 표준정규분포표를 검색해보세요.)
그러니 추가로 개념을 더할 필요가 없이 평균, 표준편차 만으로 분포가 얼마나 균일한지 정도를 매길 수 있습니다.

반대로 분포의 형태가 다르면 하나의 개념을 더하는 정도로는 일반적인 비교가 제대로 될 수 없습니다.
앞의 덧글에서 예를 든 것을 연장해보면, 950~1050 구간에는 첫번째 집단은 0%, 두번째 집단은 50%지만,
850~1150 구간에서 첫번째 집단은 100%, 두번째 집단은 50%입니다.
어떻게 비교하는가에 따라, 혹은 균일성을 어떻게 정의하는가에 따라 우열이 반대로 매겨지게 되죠.
Rorschach
19/01/05 04:41
수정 아이콘
비교할 집단이 같은 부류의 데이터 (예를들면 시험점수) 라면 표준편차라는 개념 자체가 질문하신 내용의 답이 될겁니다.
단순하게 시험점수 분포 같은 경우를 생각하면 평균점수와 상관없이 표준편차가 더 작은 집단이 통계적으로는 더 균일하다고 볼 수 있습니다.
각 집단의 N이 너무 작으면 쉽게 한 쪽이 더 균일하다고 말하기 힘들수도 있긴 한데, 데이터의 수가 충분히 많다면 표준편차 그 자체가 균일성을 말해준다고 봐도 무방해요.

평균 1000점에 표준편차 100인 경우나 평균 300점에 표준편차 100인 경우나 분포의 대략적인 중심 위치(평균)만 다를 뿐 퍼져있는 정도는 같다고 볼 수 있으니까요. 다만 데이터가 너무 적거나, 혹은 너무 크게 튀는 값(outlier)이 있다거나 하는 경우는 해당 부분을 처리하는 방식을 따로 고민하긴 해야합니다.
예를들어, N=100인 두 그룹이 있다고 할 때,
A그룹은 평균이 100이고 표준편차가 1인 정규분포 그룹의 경우로 말 그대로 표준편차가 1이고 100을 기준으로 위아래로 조금씩 편차가 있는 데이터라고 하고,
B그룹은 98개의 값이 100이고 두개의 값만 50, 150인 경우라고 할 때, B그룹은 표준편차를 구하면 7.1정도가 됩니다. 평균은 A와 같이 100이 되고요.
수치상으로는 A가 균일하지만 B의 아웃라이어 두개를 제외해버리면 B그룹의 표준편차는 아예 0이 되어버리는 상황이죠.

그리고 두 집단, 혹은 여러 집단이 일대일로 같은 데이터로 볼 수 없을 땐 표준편차를 구하기 전에 동일한 잣대로 볼 수 있는 정규화 등을 먼저 거쳐야 합니다. 50점 만점인 시험과 1000점 만점인 시험의 점수의 균일성을 그냥 수치로만 놓고 볼 수는 없으니까요. 일반적으로 이런 경우 한 쪽 점수와 같게 바꾸든, 백분율로 바꾸든 하는 방식을 쓰게 되겠죠.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
128961 [삭제예정] 아이폰 구입 질문 [4] v.Serum2305 19/01/06 2305
128960 [질문] 총 예산 600만원으로 부모님 뉴욕여행 가능할까요? [16] 69눈바디2966 19/01/06 2966
128958 [질문] 문자 메시지 수신/송신할 때 왜 휴대폰이 느려지나요? [1] 훈박사2253 19/01/06 2253
128957 [질문] 넥슨을 스마일게이트에서 살 일은 없나요? [6] bhsdp2890 19/01/06 2890
128956 [질문] 바이크 경고음? 회전음?질문 전설의오오타니1196 19/01/06 1196
128955 [질문] 스카이 캐슬에서 김주영이 보는 화면은 뭘까요? (스포) [8] 비싼치킨4511 19/01/06 4511
128954 [질문] USB로 충전하는 제품을 ac어댑터 사용해서 충전해도 괜찮을까요? [3] 그냥가끔1660 19/01/06 1660
128953 [질문] 대마도 낚시 여행 가보신분??? 살다보니별일이1863 19/01/06 1863
128952 [질문] 구글 캘린더의 "알림" 캘린더는 무슨 용도 인가요? [3] Googlo1806 19/01/06 1806
128951 [질문] 질럿 드라군 컨트롤질문 [3] 탕웨이3409 19/01/06 3409
128950 [질문] 자전거 뒷바퀴 굴리면 패달이 같이 돌아가는게 정상인가요? [5] monkeyD2387 19/01/06 2387
128949 [질문] 안양 사는 분들 맛집 생각나시는 곳 있나요? [19] 강미나2978 19/01/06 2978
128948 [질문] 자전거 잘아시는 분들께 물어볼게 있습니다 [2] 적폐의탑1798 19/01/06 1798
128947 [질문] 고급형? 프리미엄형 pc방도 있을까요 [6] 다크템플러2928 19/01/06 2928
128946 [질문] 전기자전거 추천 부탁드립니다 [1] 스트라스부르1920 19/01/06 1920
128945 [삭제예정] 영어 문법 인강 중 이런 강의 있을까요? [8] 고전파2859 19/01/06 2859
128944 [질문] 스카이캐슬 스포, 루머는 언급해도 괜찮은가요? [23] 2B4563 19/01/06 4563
128943 [질문] 고등학교 수학 질문입니다 (순열) [4] MyBubble2420 19/01/06 2420
128942 [질문] 신용카드 할부 결제 질문 입니다. [8] 광개토태왕1979 19/01/06 1979
128941 [질문] 구 안팎 뒤집기 거에서 왜 면은 서로 통과 가능하다고 가정하는 거에요? [6] norrell2650 19/01/06 2650
128940 [질문] 인천공항 심야 유심구매 [2] bonk32116 19/01/06 2116
128939 [질문] [재업, 수정] hwp파일 업로드 시 팅김 현상이 있습니다. [2] 제노스브리드2280 19/01/05 2280
128938 [질문] 지정학 관련 서적 추천 부탁드립니다. [2] Conan O'Brien1904 19/01/05 1904
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로