:: 게시판
:: 이전 게시판
|
다시봐도 좋은 양질의 글들을 모아놓는 게시판입니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
12/09/06 13:13
일단 parametric statistic (이걸 모수통계라고 하는 걸 오늘 처음 알게되었습니다)을 적용하기 편해서 그런것이 아닐까요?
그리고, 모수통계에 적용되는 모델들은 정규분포를 따르게 되는 경우가 많기 때문에 사회현상을 일반화시켜 대중에게 설명하기 쉬운 이점도 있지 않나 싶습니다..... 라고 통계학 비전문가의 잡설이었습니다. ㅡㅡ;;;;;
12/09/06 13:32
중간값과 최빈값이 불편성을 만족하는 경우가 있더라도 최소분산성을 만족하지 않습니다.
반면 평균값의 경우, 불편서과 최소분산성을 동시에 만족하기에.. 표준오차는 그나마 중간값이나 최빈값보다 작기 마련이죠..
12/09/06 14:04
분산(편차의 제곱합)을, 결국 표준편차를 최소화하는 대표값이 평균이고,
절대편차(편차의 절대값)의 합을 최소화하는 대표값이 중앙값(median)입니다. (잠시 착각 ^^;) 어느 쪽이 더 낫다고 말하기는 어렵지만, 분산과 평균이 다루기는 훨씬 쉽습니다. 그리고 위 글에서는 문맥상 표준오차(SE)보다 표준편차(SD)가 적절하지 않을까요?
12/09/06 15:01
좋은 지적이십니다. 실은 둘 중 무엇을 사용할까 고민하다 표준오차를 적었는데요.
실생활에서 표준편차라는 말보다는 표준오차를 많이 사용하는 것처럼 느꼈기에 좀 더 익숙한 표현을 택하였습니다. 그리고 어차피, 실생활의 통계수치는 표준오차값이 더 적확하지 않나 싶기도 합니다. 한번 샘플링한것으로 통계수치를 나타내는 일이 실제로는 적지 않을까 싶어서 그렇기도 하구요.
12/09/06 13:33
통계란 정말 신기하면서도 어쩔땐 사기같아요. 그래서 표준오차가 더더욱 중요하겠죠. 좋은글 감사합니다.
뻘플이지만 통계글을 보니까 예전에 읽었던 통계의패러독스 라는 책 내용중 한구절 생각나네요. "세계에서 천식환자가 가장 많고 또 가장많이 천식으로 죽는 곳은? 알프스 휴양지. 왜냐하면 천식환자들이 좋은 공기를 마시며 요양하기 위해 몰려들기 때문" 고등학교때 읽었던 책인데도 이 글은 아직도 기억에 남네요.
12/09/06 15:22
실제로 미국차와 일본차가 저렇게 관리하지 않겠죠. 원래 6시그마 개념이 나오 것도 미국인데요.
직관적으로 생각할 때도 평균을 관리하는 게 표준편차를 관리하는 것보다 훨씬 쉽습니다. 1. 50, 100, 150 2. 95, 100, 105 1,2 번 모두 평균은 100이지만, 1번에 비해 2번의 표준편차가 훨씬 적죠. 당연히 2번 공정이 1번 공정보다 훨씬 우수한 공정이 되겠죠. 저도 통계가 전공도 아니고 6시그마 맛만 본 사람인데요. 말씀하신대로 통계란 놈은 다루기가 쉽지 않고, 어떤 의도로 통계를 이용하느냐에 따라 결과가 반대로 바뀌기도 하죠. 그래서 통계를 전가의 보도처럼 함부로 사용하면 안 된다고 봅니다.
12/09/06 17:40
또한 통계학은 거짓말을 하지 않죠.. 사람들이 통계학을 이용해서 '속이거나' 알지 못해서 '속는'것이지,
통계학에서는 기본적으로 얼마 정도의 가능성으로 (유의수준), 얼마 이상 잘못 예측할지(유의구간)을 다 말하는데 말이죠
12/09/07 12:31
좋은글 잘 봤습니다 .
짧게 부언하면 표준편차 : 측정치가 평균에서 떨어져 있는 정도 표준오차 : 표본의 평균이 실제 모집단의 평균과 떨어져 있는 정도 라고 정의 할 수 있습니다. 문맥상 보면 처음의 자동차 얘기에서는 표준편차가 어울리고 철수의 얘기에서는 표준오차가 어울려 보입니다.
|