PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2019/01/04 21:54:30
Name moqq
Subject [질문] 통계 질문. 집단의 균일성 판단..
통알못인데 궁금한게 생겼습니다..

두 집단 A, B 가 있다고 할 때

변수들을 데이터 분석하면 통계와 표준편차가 나오잖아요.

A집단의 평균점수가 1000점에 표준편차가 100

B집단의 평균점수가 980에 표준편차가 200

이라고 하면 A,B 집단의 평균점수는 큰 차이가 없지만

B집단 내의 편차가 더 크고, B 집단에서 샘플을 고르면 그 샘플이 평균을 벗어날 확률이 더 크다는 걸 계산해보고 싶다면

어떤 방법으로 계산하나요?

단순히 평균값 대비 편차가 크다? 라는 것 말고 왠지 계산할 수 있는 방법이 있을 것 같은데 말이죠..

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
19/01/04 22:15
수정 아이콘
저것만으로는 계산 못하고, 분포의 형태를 알고 계산이 가능할 때
가령 집단의 크기가 아주 크다거나 해서 정규 분포를 따른다고 한다면 계산이 가능해집니다.

예를 들어 900점, 1100점 2명이라고 할 때와 800점, 1000점, 1000점, 1200점 4명일 때
둘 다 평균점수 1000점에 표준편차 100이지만 950~1050 구간에 샘플이 들어갈 확률은 아예 다릅니다.
19/01/04 22:28
수정 아이콘
그 계산이 가능하다고 할 때 그 개념을 뭐라고 부르나요?
그니까 어떤 집단이 다른 집단에 비해 값이 균일하게 분포하고 튀는 값이 적다는 것을 나타내주는 개념이요.
낚시꾼
19/01/04 22:33
수정 아이콘
표준편차/평균을 CV라고 합니다.
https://ko.wikipedia.org/wiki/%EB%B3%80%EB%8F%99_%EA%B3%84%EC%88%98
19/01/04 22:41
수정 아이콘
고맙습니다. 그냥 편차를 평균으로 나누는거네요.. 예상되는 오차라든가 새로운 개념이 있지 않을까 싶었는데.
19/01/04 23:19
수정 아이콘
(수정됨) 정규 분포로 분포의 형태를 고정하고 평균, 표준편차의 크기를 알면 분포를 아예 다 계산할 수 있습니다.
평균 1000점에 표준편차 100인 집단이 정규 분포의 형태라고 할 때,
샘플 하나를 뽑을 때 950~1050에 속할 확률은 38.3%
900~1100에 속할 확률은 68.26%
850~1150에 속할 확률은 86.64% 정도 됩니다.
(이러한 계산은 표준정규분포표를 검색해보세요.)
그러니 추가로 개념을 더할 필요가 없이 평균, 표준편차 만으로 분포가 얼마나 균일한지 정도를 매길 수 있습니다.

반대로 분포의 형태가 다르면 하나의 개념을 더하는 정도로는 일반적인 비교가 제대로 될 수 없습니다.
앞의 덧글에서 예를 든 것을 연장해보면, 950~1050 구간에는 첫번째 집단은 0%, 두번째 집단은 50%지만,
850~1150 구간에서 첫번째 집단은 100%, 두번째 집단은 50%입니다.
어떻게 비교하는가에 따라, 혹은 균일성을 어떻게 정의하는가에 따라 우열이 반대로 매겨지게 되죠.
Rorschach
19/01/05 04:41
수정 아이콘
비교할 집단이 같은 부류의 데이터 (예를들면 시험점수) 라면 표준편차라는 개념 자체가 질문하신 내용의 답이 될겁니다.
단순하게 시험점수 분포 같은 경우를 생각하면 평균점수와 상관없이 표준편차가 더 작은 집단이 통계적으로는 더 균일하다고 볼 수 있습니다.
각 집단의 N이 너무 작으면 쉽게 한 쪽이 더 균일하다고 말하기 힘들수도 있긴 한데, 데이터의 수가 충분히 많다면 표준편차 그 자체가 균일성을 말해준다고 봐도 무방해요.

평균 1000점에 표준편차 100인 경우나 평균 300점에 표준편차 100인 경우나 분포의 대략적인 중심 위치(평균)만 다를 뿐 퍼져있는 정도는 같다고 볼 수 있으니까요. 다만 데이터가 너무 적거나, 혹은 너무 크게 튀는 값(outlier)이 있다거나 하는 경우는 해당 부분을 처리하는 방식을 따로 고민하긴 해야합니다.
예를들어, N=100인 두 그룹이 있다고 할 때,
A그룹은 평균이 100이고 표준편차가 1인 정규분포 그룹의 경우로 말 그대로 표준편차가 1이고 100을 기준으로 위아래로 조금씩 편차가 있는 데이터라고 하고,
B그룹은 98개의 값이 100이고 두개의 값만 50, 150인 경우라고 할 때, B그룹은 표준편차를 구하면 7.1정도가 됩니다. 평균은 A와 같이 100이 되고요.
수치상으로는 A가 균일하지만 B의 아웃라이어 두개를 제외해버리면 B그룹의 표준편차는 아예 0이 되어버리는 상황이죠.

그리고 두 집단, 혹은 여러 집단이 일대일로 같은 데이터로 볼 수 없을 땐 표준편차를 구하기 전에 동일한 잣대로 볼 수 있는 정규화 등을 먼저 거쳐야 합니다. 50점 만점인 시험과 1000점 만점인 시험의 점수의 균일성을 그냥 수치로만 놓고 볼 수는 없으니까요. 일반적으로 이런 경우 한 쪽 점수와 같게 바꾸든, 백분율로 바꾸든 하는 방식을 쓰게 되겠죠.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
128923 [질문] 과거 뉴스 라이브러리 사이트가 궁금합니다. [4] 쿠키루키1199 19/01/05 1199
128922 [질문] 사진이나 그림관련 어플 질문입니다 [2] 에프킬라331423 19/01/05 1423
128921 [질문] 부천 맛집 추천 부탁 드려요 [3] mods1857 19/01/05 1857
128920 [질문] [LOL]유독 이렐,아트록스,아칼리에 적응힘들어하는 사람이 많은이유가 뭘까요? [21] 톰가죽침대6953 19/01/05 6953
128919 [질문] 꼬막으로 파스타 해먹을 생각인데 레시피가.. [8] 키토2017 19/01/05 2017
128918 [질문] 자동차키 고장났을 때 [3] 우메보시2104 19/01/05 2104
128917 [질문] 스타 컨트롤 유즈맵은 어디서 구하나요? 탕웨이1493 19/01/05 1493
128916 [질문] 혹시 이 폰트가 뭔지 아시는 분 계실까요? [1] Ilulissat1866 19/01/05 1866
128914 [질문] 중국산 낚시대 브랜드 좋은게 뭐가 있나요 [4] 지바고3211 19/01/05 3211
128913 [질문] 외국->외국 비행기 딜레이도 보상 가능한가요? [1] RookieKid2012 19/01/05 2012
128912 [질문] 해커스 토익 0원 인강 들어보신분 계신가요? [3] monkeyD2577 19/01/05 2577
128911 [질문] 게임기기 구입 질문/게임 추천 부탁드려요(vita) [12] 그대에게2666 19/01/05 2666
128910 [질문] 광단자로 스피커 물리면 음질이 조금 열화되는 듯합니다. [2] 트와이스정연1623 19/01/05 1623
128909 [질문] 넷북으로 크롬 실행시 가끔 화면이 깨집니다. [2] monkeyD1786 19/01/04 1786
128908 [질문] 플레시 게임 질문이요 [2] GGMT1313 19/01/04 1313
128907 [질문] 통계 질문. 집단의 균일성 판단.. [6] moqq3275 19/01/04 3275
128906 [질문] 부모님과의 오사카 2일 일정 좀 봐주세요ㅠㅜ [5] 사이시옷1890 19/01/04 1890
128905 [질문] 친구 어머니가 아프셔서 조만간 돌아가실거 같네요 [6] 옛설3347 19/01/04 3347
128903 [질문] IT 관련 자격증 중 가성비 갑은? [10] grrrill2459 19/01/04 2459
128902 [질문] 걸으면서 뭐 마시는 거 못하는 사람 많지 않나요? [24] 비싼치킨3379 19/01/04 3379
128901 [질문] 반품 할때 사진찍어두는게 나으려나요? [2] 키토1240 19/01/04 1240
128900 [질문] macOS에서 어플의 비밀번호가 저장이 되지 않습니다 [2] SaiNT1210 19/01/04 1210
128899 [질문] 서울 3차병원 종양 조직검사 병원에 대해 문의합니다 [10] SlaSh.2272 19/01/04 2272
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로