PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2019/04/04 10:13:06
Name moqq
Subject [질문] 통계 대응표본t검정과 anova 질문
제게는 raw data 한 셋이 있습니다.

이 data에서 연속적인 측정값 하나를 실험하고 있는데..

원본이 있고, 처리 1,2,3 을 한 data가 만들어졌습니다.

이 때 원본과 처리 1,2,3. 네 그룹의 측정값을 ANOVA로 돌리면 그룹간 유의한 차이가 없는 것으로 나옵니다.

근데 원본-처리1, 원본-처리2, 원본-처리3  이런 방식으로 대응표본 t 검정을 돌리면

처리1, 처리2에서는 유의한 차이가 있는 것으로 나옵니다.

어떤 걸 믿어야하는거죠?

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
여왕의심복
19/04/04 10:16
수정 아이콘
https://en.wikipedia.org/wiki/Multiple_comparisons_problem

참고해보세요~ 다중비교로 인한 문제로 생각됩니다. P-value 5%는 참 무의미하다는 생각이 듭니다.
19/04/04 11:03
수정 아이콘
다중비교 개념은 어렵더라구요... 사후검정시 본페로니 커렉션같은 걸로 p value를 낮춰서 검정해야한다는데..
각 그룹별 처리가 독립적인 거라면 애초에 anova를 해야할 필요가 있는건가 싶기도 하구요..
제 data도 그룹에 4개 나와서 anova를 돌린건데 유의하지 않아서 그런가보다 하고 실험결과를 정리하다 생각해보니
anova가 각 그룹의 측정값분포를 비교하는 건데..
원본에서 독립적으로 처리된 대응값이 존재하니까 대응표본 돌리면 되는 것 같은데? 싶어서 돌려보니까 결과가 유의하더라구요.
그리고 처리2,처리3도 꼭 해볼 필요가 없는 것들이라서.. 이걸 p-value를 낮춰서 검정할 이유가 있나 싶기도 하고..
여왕의심복
19/04/04 11:06
수정 아이콘
믿을 필요없이 그대로 해석하시면 됩니다. 아니면 Post hoc 방법을 다른 것을 써보셔도 되구요.
봉그리
19/04/08 01:25
수정 아이콘
이건 처리1, 처리2 하면 원본에서 뭔가 유의한 변화를 만들어내기는 하는데, 각 처리의 효과 사이에는 유의한 차이가 없다는 것이죠.
뭘 믿느냐의 문제가 아니라, 실험 설계 시 어떠한 가설을 세웠느냐에 따라서 선택하면 됩니다.

그리고 그룹이 4개가 아니고 3개입니다.
원본은 baseline이고, 처리1 vs 처리2 vs 처리3을 비교하는 것이니까요.
각 그룹간 baseline 차이가 없다면 그냥 처리 후 측정값을 비교하면 되겠고, baseline 차이가 있다면 보정하거나 나중 - 기저치 = difference를 구해서 3군을 비교하고요.
봉그리
19/04/08 01:26
수정 아이콘
실험 전 어떠한 가설을 세웠는지 그것부터 명확히 하셔야 합니다.
통계 방법 선택은 그 다음에 따라오는 겁니다.
19/04/08 09:21
수정 아이콘
처리1,2,3은 특별한 효과가 있는 건 아니구요. 각 처리 간에도 별 관계는 없습니다.
실제로 이 factor를 측정하는 방법은 원본,처리1,처리2,처리3이 동일합니다.
다만 처리 1,2,3은 흔히 발생하는 오류 3가지를 인위적으로 시행했을 때 원본과 얼마나 차이가 나느냐.를 테스트해본거에요..
가설은 이 측정방법은 오류가 발생해도 보정이 가능한 방법이다.라는 거죠.. 그래서 원본,처리1,2,3의 4개 그룹을 비교해야하는건지.. 각각 대응표본 검정을 원본-처리1,원본-처리2,원본-처리3 이렇게 해야하는 건지 애매해서요..
봉그리
19/04/08 13:25
수정 아이콘
대응표본이면 그냥 ANOVA하시면 안됩니다.
예를 들어 1-10번 개체에 4가지 조작(원본, 처리1,2,3)을 차례로 가할 경우 한 개체에 대한 처리효과는 서로 연관(nested)되어 있습니다.
이런 데이터는 검정하시려면 혼합모형(처리 = 고정효과(원본이 reference, 개체 = 랜덤효과) 쓰셔야 합니다.

아니면 원본과 각 처리를 하나씩 대응 t-test해도 되는데, 비교가 3번이므로 p-value <0.05 대신 p-value < 0.05 /3 = 0.016 쓰셔야 합니다.
19/04/08 14:06
수정 아이콘
다중비교에서 p 값을 낮추는 게 결국 전체 실험에서 쓰이는 조합 개수만큼 p value를 낮춰주는 거지요?

예를들어 제가 아무효과없는 알약 20개를 가지고 실험하면 5%확률상 하나는 효과가 있게 나오는 걸 보정하기 위해서요.
그러면 알약 20개로 실험한 다음에 19개 데이터를 버리거 유효한 한 개만 사용한다면 5%로 써도 되는건가요?
아니면 효과없는 알약 20개를 가지고 각각 페이퍼 20개를 내면 그건 5%씩 써도 괜찮은 건가요?

근데 애초에 유의하다는 기준이 왜 5%인 걸까요?
봉그리
19/04/09 22:11
수정 아이콘
쪽지 드릴까 하다가 댓글로 남겨서 다른 분들도 볼 수 있게 하는 게 좋겠다 싶어 그냥 댓글 달아봅니다.
어차피 알림 뜨니까 보실 수 있겠죠?

1. 실험을 20개 하고 연구 가설을 지지하지 않는 데이터를 버리면 연구부정입니다. 데이터를 버리거나(조작), 데이터를 쪼개면(살라미출판) 연구윤리 위반으로 처벌을 받고, 학계에서 추방됩니다. 나중에 어떠한 중요한 연구를 해도 아무도 믿어주지 않죠. 황우석씨가 예전에 그랬습니다. 이건 연구윤리 동영상 강의 같은 데 보시면 잘 나옵니다. 정상적인 전향적 연구라면 미리 몇 번 실험할지(연구대상자를 몇 명 모집할지), 그러면 실험 결과가 내 가설이 참일 경우 진짜 참으로 나올 확률이 얼마인지 계산해 놓고 합니다.

2. 유의수준 0.05는 원래 고전적 통계의 대가인 Fisher라는 분이 그렇게 하자고 해서 다들 그렇게 쓰는 겁니다. 그렇다고 0.05가 아무 의미 없는 관습은 아닙니다. 유의수준 0.01, 0.001 등 훨씬 엄격하게 실험을 설계할 수도 있지만, 그러면 필요한 실험 회수나 연구대상자 수가 너무 커져서 연구 결과로 얻게 되는 지식의 가치보다 연구에 들어가는 비용이 훨씬 크게 될 겁니다. 유의수준(거짓 결과를 참이라고 믿을 확률) 0.05는 그런 의미도 있습니다. 물론, 모든 전향적 연구들의 결과 p-value 0.04999999....라면 결과가 참으로 나온 모든 연구의 5%는 거짓일 겁니다. 하지만 결과가 확연하게(p < 0.001 같이) 참을 지지하는 연구들도 많죠.

3. 설명을 쫙 쓰다 보니... 저는 통계 전공이 아니라서 쉽게 설명드리기가 어려워 지웁니다. 일단, 알약 20개로 실험하고 데이터 19개를 버리면 신뢰구간이 제대로 안나옵니다. 40개를 실험하고 20개를 버릴 수는 있겠죠. 또, 다중비교에 의한 유의확률의 보정은 20개짜리 대조군 vs 20개짜리 실험군1 vs 20개짜리 실험군2 vs ... 이럴 때 고려하는 것입니다. 위약 20개 실험한 것 중에 하나가 호전을 보였다(=위약의 치료효과는 5%이다)와는 다른 문젭니다. 통계, 특히 표본과 표본평균, 1종 오류, 2종 오류에 대한 기초 개념을 확실하게 잡으셔야 겠습니다.
19/04/10 11:34
수정 아이콘
상세한 답변 고맙습니다. 통계에 대해 이 정도 답변받은 건 처음인 것 같아요. (아니면 답변받아도 제가 이해를 못했을 수도..)
통계책을 봐도 이럴 때 이런 걸 쓴다고만 나와있지.. 그 상황에 맞지 않을때 어떤 걸 어떻게 생각해야하는지가 어렵더라구요. 기초개념도 막연하게 거짓인데 참으로 나오는 오류, 참인데 거짓으로 나오는 오류라는 건 알겠는데.. 그래서 이게 복잡한 상황에서 어떻게 적용해야하는건지 어려워요 --.. 다른 사람한테 물어봐도 독립변인 설정과 그 관계부터 애매한 부분도 있고.. 여하간 고맙습니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
132070 [질문] 이 뮤직비디오(아이돌) 제목 아시는 분 계신가요? [2] Googlo2820 19/04/06 2820
132069 [질문] 액정 깨진 아이폰X 처분 방법 [1] 울림요정3149 19/04/06 3149
132068 [질문] 어제 임요환 트위치방송에서 임요환상대로 연승한사람 누군지 나왔나요? [5] 고블린점퍼케이블4604 19/04/06 4604
132066 [질문] 한국 항공사 보상 관련 궁금한게 있어요. [1] 삭제됨2744 19/04/06 2744
132065 [질문] 순간을 믿어요라는 가사들어간 노래 뭘까요 [5] 궁디대빵큰오리4464 19/04/06 4464
132064 [질문] 하드 도킹스테이션을 구매하려는데 어떤 제품을 구매해야 할까요? [3] 그냥가끔3668 19/04/05 3668
132063 [질문] 고성속초 산불 복구에 자원봉사하러 가고 싶습니다 [4] 새강이3690 19/04/05 3690
132062 [질문] 여의도 지금 벚꽃 피었나요?(여의도 놀거리 추천 부탁드립니다) [5] 클레멘티아3975 19/04/05 3975
132061 [질문] 고양이 있는 집 방문시 유의점 질문합니다 [11] SlaSh.3404 19/04/05 3404
132059 [질문] 게임용 마이크 구매 추천 부탁드립니다~ [1] 출근하기싫다4108 19/04/05 4108
132058 [질문] 핸폰 블루투스 연결된상태에서 스피커 쓰는법 포프의대모험2821 19/04/05 2821
132057 [질문] 하스스톤 복귀하려고 합니다. [2] Ahri2860 19/04/05 2860
132056 [질문] 폭행 상해 합의금 질문드려요 [11] 관지림4423 19/04/05 4423
132055 [질문] [LOL] 데프트 vs 뱅 [115] 레너블8655 19/04/05 8655
132054 [질문] 면세 위스키 질문 드려요 [7] 풍각쟁이3221 19/04/05 3221
132053 [질문] 대전역 근처 남자 6명이 술 마시며 식사할 곳 추천 부탁드립니다 [6] w.A3085 19/04/05 3085
132052 댓글잠금 [질문] 편법 인증 및 인증 미비 회원 관련 공지 삭제됨3126 19/04/05 3126
132051 [질문] 엑스컴2 질문입니다 [3] 첸 스톰스타우트2273 19/04/05 2273
132050 [질문] 현재 디비전2를 가장 저렴하게 사는방법은 뭘까요? [3] 양념반자르반3805 19/04/05 3805
132049 [질문] 에어프라이기 질문좀 할게요 [7] 레가르13045 19/04/05 13045
132048 [질문] vfx의 교과서 같은 영화(?) 있을까요? [4] toreta!2766 19/04/05 2766
132046 [질문] 아이패드 프로1 중고 6세대 신품 선택 조언 부탁드립니다 [2] StondColdSaidSo2883 19/04/05 2883
132045 [질문] 서울근교 여행지 추천부탁드립니다. Grundia2295 19/04/05 2295
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로