- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다. - (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date |
2021/02/11 13:57:36 |
Name |
pontine |
Subject |
[질문] 상관관계에 대해 질문드립니다(생각에 관한 생각 책 읽는 도중 궁금증) (수정됨) |
안녕하세요 통계분야에 계신분, 혹은 해당 책을 읽으신 분들께 이해안되는 부분 있어 질문드립니다.
생각에 대한 생각 342p 직관적예측 길들이기 중 비회귀직관에서 나오는 이야기입니다.
저자분이 '현재 주립대학 4학년인 줄리는 네살때 글을 막힘없이 읽었다. 대학 평점은 몇점이겠는가?'라는 추정을 할 때를 예시로 들었는데요.
많은 사람이 상당히 직관적으로 '네살 때의 독해능력'과 '대학평점'간의 상관성을 거의 똑같이 취급하는데
1) 어릴 때 독해능력이라는 그럴싸한 연결고리가 발견되면 보이는 것이 전부라고 생각하여 다른 정보를 신경안쓰고 현재 정보로만 그럴싸한 이야기를 만들고
2) 줄리가 대학평점에서 차지하는 백분위수를 어릴 때 독해능력이 가진 백분위수와 똑같이 취급하여 평점을 어림짐작한다.
라는 오류를 보인다고 지적합니다.
저자는 이런 직관적 예측을 수정하는 방법으로
읽기연령= 공통요소+읽기연령에 한정된 요소(a) = 100%
대학평점=공통요소+평점에 한정된 요소(b)=100% 로 구분하고 공통요소에 대한 추정이 필요하며,
두가지 추정치 간의 상관관계는 그 둘을 결정한 요소들에서 공통요소가 차지한 비율과 동일하다고 하며 공통요소에 대해 가장 낙관적인 추정치는 30%라고 이야기합니다. 이후 예측수정을 위해
1)평점의 평균을 추정
2)읽기연령에서 받은 인상에 어울리는 평점 구하기
3)읽기연령과 평점 간 상관관계구하기
4)상관관계에 따라 (낙관적으로 0.3) 1번의 평점평균에서 2번의 평점쪽으로 30%만큼 이동하라
라고 하는데요
위 언급중 공통요소에 대해 가장 낙관적인 추정치가 30%인 이유를 잘 모르겠습니다 공통요소가 차지한 비율이 상관계수 r을 의미하는 것으로 생각되는데 혹시 r값의 낙관적인 추정치가 0.3이라고 언급되는 기초적인 내용이 있다면 참고할 부분이라도 알려주신다면 감사하겠습니다~
|
통합규정 1.3 이용안내 인용
"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
|