PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2017/04/15 01:01:00
Name Chandler
Subject [질문] 학사던 석사던 박사던 비전공이던 통계학 아시는 분들 질문합니다.(김어준다큐 더플랜)
전자투표해킹, 시간역행미스테리, 역누적현상 이런주제도 있지만 이건 일단 좀 덜고 한개만 보면


누군가를 이기게할 목적이던 어떤이유던 그냥 심심해서건 어떤이유건간에 누군가의 인위적 개입없이 이른바 K값 ,
즉 박근혜 분류표/문재인분류표와
박근혜 비분류표/문재인비분류표의 비율이

전국적으로 1.5의 비율을 중심으로 정규분포를 보여준다던 그 부분



사실 이부분이 제일 핵심 의심증거라 보이는데

실제 데이터를 김어준측에서 조작했으리라 생각하지 않는다면(쉽게 뽀록날 거짓말을 김어준이 고의적으로 할거라곤 생각하지 않고요. 선관위에서 김어준멕일라고 오염된 데이터를 줬을리도 없고)

저 비율이 우연에 의해서는 불가능에 가까운거라는 복수의 전문가들이 증언하는데

한번더 크로스체크해보자면 실제로 우연의 개연성은 0.001조차 없는 굳건한 팩트인가요?

이거의 입증만으로도 어떤의도로던 어떤 방법으로던 뭔가 의도를 가지고 개입했다는 증거는 된다고 보는데 어떻게들 생각하시나요?

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
세크리
17/04/15 01:12
수정 아이콘
데이터가 충분해서 K값의 통계적 분포를 알거나 이상적인 상황에서의 분포를 알면, 유의확률을 구할 수 있습니다. 통계학의 세부적인 분석방법은 잘 알지 못하지만, 무효표가 나오는것이 정말로 투표한 후보에 상관없는 독립사건이라고 가정하면 표준편차를 구할 수 있는데요, 당장 생각에는 이항분포를 따르는 분포들의 sampling 비율이니 투표인원을 고려하면 1 주위로 표준편차는 0.001도 안되야 하는게 맞아보이네요. 1.5가 나올 확률은 뭐 백만분의 일도 안되지 않을까 싶습니다.
Chandler
17/04/15 01:14
수정 아이콘
하 믿고 싶지 않은 현실이네요....
17/04/15 01:17
수정 아이콘
거기 통계학 박사님이 그러셨죠 번개 두번 연속 맞을 확률이라고.
Chandler
17/04/15 01:21
수정 아이콘
보면서도 믿고싶지 않아서 내가 본 이게 진짜 내가 맞게 이해한건지 확인받고싶었습니다.
17/04/15 01:24
수정 아이콘
네 저도 눈을 의심하면서 봤습니다. 결국엔 박근혜표가 무효표와 일정 확률로 바꿔치기 된다는 얘기인데.. 좀 참담한 심정이네요.
세크리
17/04/15 01:24
수정 아이콘
뭐 제 말이 무조건 부정선거가 있었다는 것은 아니고, 저 데이터가 사실이라면 충분히 재검표를 해야한다고 주장 할 수 있다는 말입니다. K값이 1이어야 하는게 자연스러운 만큼, 기존의 선거결과에서 K값 분포가 어찌되었었는지를 좀더 확인 할 수 있으면 좋겠습니다. 저도 요약본만 봤는데, 선관위에서 예전 데이터들을 보관하지 않아 예전선거에서의 K값을 충분히 확보하지는 못했나보더군요. 하여튼 재검표 주장을 하기에는 충분한 자료로 보입니다.
김테란
17/04/15 02:17
수정 아이콘
그리 어려운 내용이 아니에요, 이건 김어준이 싫다 뭐 이런걸로 좌우될 수 있는게 아니고,
논문도 완성되었다던데 그 내용의 흐름도 학문적 발견이 아닌 실사례에 대한 분석 형식이라 어려운 내용이 아닐거구요,
내용 흐름 이해하더라도 각자가 하기 힘든 논문내 시뮬레이션등의 세부에 오류가 있는지에 대한 구체적 검증은 전문가들이 하겠죠.
자게 보면 영상보시고도 뭘 말하는건지 제대로 이해못하는 분들 좀 있던데, 뭘 말하는거냐면
각 개표소마다 일정한 비율인 1.5란 수치를 보이는 미분류표, 그 이유에 대해서 설명을 해야 할건데
미분류로 뱉어내면 각 개표소에서 어떤 작전에 의해 그걸 박근혜 유리하게 혹은 특별히 박근혜가 더 많은 미분류가 나오는 사회적(연령,지역등) 이유,
일부 개표소의 세팅 혹은 기기 이상 뭐 이런 것으로 설명할 수 있는게 아니라는거에요.
이걸 아주 명확하게 설명할 수 있는 아주 강력한 시나리오는 기기가 미분류를 비정상적으로 뱉어내도록 중앙통제가 있었다는 것이며,
그외에 어떤 걸로 이정도 일치하게 설명해보겠느냐 던져주고 있는거구요, 매우 어려워보입니다.
R제곱 0.98 이건 위에 언급한 수준의 이유들로 나올 수 있는 수치가 아니거든요, 성능 떨어지는 측정기기와 실제 힘 이런 정도에 가까운 상관관계에요.
중앙에서 특정 명령이 내려갔고 그걸 각 개표소의 기기들이 수행했어요, 미분류표에 대한 미세한 수검표의 변수도 있구요, 무슨뜻인지 아시겠죠.
이 명령과 각 개표소의 미분류표 결과의 상관관계에 대한 결정계수가 0.98정도 나올 수 있는거에요.
이런 정도의 매우 직접적인 원인급 되지 않는 이상 이 이상의 일치도를 보일 수가 없으니,
미분류를 비정상으로 뱉어내는 중앙통제의 가능성에 대해선 피해가기 힘들걸, 하는 내용인 것이구요.
그게 중앙에서의 조작실수일 수도 버그일 수도 있겠죠(전 결국 이런쪽으로 빠져나가려 할 것이라 생각되네요)
허나 이런게 원인였더라도 당장에 개표 시스템을 원천적으로 바꿔야 하는 매우 큰 문제인건데 지금껏 아무말 없었죠.
그럼 그 외엔 해킹등의 의도적 조작 말고 뭐가 또 있을까요.
그런 조작이 있었다면 예를 들면 미분류를 비정상적으로 10배 뿜어냄으로써,
기기에서 분류된 표들의 확인이 그만큼 힘들 수 있겠죠. 분류표에 대한 조작등은 없었겠냐는거에요.
현재 쓰이고 있는 기기에 컴퓨터가 연결되어 있는 한 그 조작은 매우 쉽고, 범위는 그 어느것도 가능하다는 것을 시연으로 보여준 것이구요.
달과바다
17/04/15 09:46
수정 아이콘
결론부터 말씀드리면 문제없습니다.

개표기는 투표용지를 한장씩 빨아들여 스캔하고 스캔한 결과를 판독하는 과정을 거칩니다. 개표하기 전에 일선 선관위에서는 한달여간 개표기를 계속 시험가동하면서 미분류표를 줄이기 위한 최적의 세팅을 찾습니다. 그래도 개표상황에서 미분류표가 나오는 것은 어쩔 수 없습니다. 미분류를 비정상적으로 뱉어내도록 중앙통제가 있으려면 개표기를 하나하나 다 조작할 수는 없으니까 컴퓨터에 심어진 개표프로그램을 건드려야 할 것인데 확인 해 보면 될 것 같네요. 그런데,

미분류 표가 몇장나왔고 그 분포가 어떻건 간에 미분류 표를 더 정확하게 확인하는게 보통이라 전혀 문제가 안됩니다. 미분류는 정리부에서 한장 한장 모두 확인하는 과정을 거치구요. 미분류가 아니라 분류된 표들도 물론 기계가 제대로 분류했는지 육안으로 모두 확인하는 과정을 거치는데 제가 경험한 바로는 거의 대부분의 사람들이 확인을 합니다. 가끔 이런 의무를 소홀하게 하면 뉴스에 나오곤 하죠.

그리고 이런 과정을 각 당에서 나온 개표참관인들이 보고있습니다. 아쉬운 점은 개표결과가 위원장에 의해서 정식 공표되기까지 시간이 많이 걸리기 때문에 참관인들이 개표과정이 제대로 수행되는지 감시하기보다는 개표기 앞에서서 개표결과를 보고하기 바쁘다는 겁니다. 근데 또 거꾸로 말하면 각 당에서도 개표과정을 신뢰한다는 거죠. 개표기상에서의 결과와 정리부에서의 검수결과가 큰 차이가 없기때문에 빠른보고가 중요해지는 겁니다. 앞에서 아쉽다고 표현했지만 어느정도 개표 윤곽이 드러나고 나면 대개 개표참관인들도 보고 보다는 이곳저곳 둘러봅니다. 개표과정이 조작하기가 굉장히 어려운 시스템이에요.
17/04/15 02:23
수정 아이콘
전 이거 그냥 음모론중 하나라고 생각했는데 학문적으로도 꽤 뒷받침할 근거가 있나보네요..좀 섬짓한데요;
17/04/15 08:29
수정 아이콘
모든 통계적 모델은 도구이고 이를 해석하는 사람의 가정에 따라 달라집니다.
K값이 1.5가 조작 없이는 불가능하다는 근거를 위해서 성립해야 하는
핵심적인 가정은 '무효표가 랜덤하다'입니다.
그냥 간단히 유효표 사이의 문재인 박근혜 지지 비율과
무효표 사이의 문재인 박근혜 지지 비율이 동일하다는게 대전제인거죠.

이 대전제가 깨지는 방법은 몇 가지가 있는데
1. 기호 1번과 기호 2번의 비대칭성.
기호 1번은 위에 후보가 없는 반면 기호 2번, 그리고 3번 등등은 위 아래에 후보가 있죠.
자동 개표기의 알고리즘에 따라 이는 기호 1번, 그리고 8번에서
무효표가 상대적으로 더 많이 (혹은 적게) 나올 수 있다는 얘기입니다.
물론 이는 반대로 기계 특성상 1번 무효표가 적게 나오는 쪽으로 작용할 수도 있습니다.

2. 문재인과 박근혜의 지지층의 비대칭성.
여러 번 나온 얘기긴 하지만 고연령대로 갈수록 박근혜 지지율이 높죠.
그리고 그 노인분들은 상대적으로 교육 수준도 기력도 떨어지고요.
"노인들이 (기계가 읽어냈을 때) 무효표를 더 많이 발생시킨다"라는 가설이
성립한다면 역시나 K가 1이어야 하는 당위성은 사라집니다.
노년층이 도장을 너무 얕게 찍거나 가장자리에 너무 근접하게 찍는 비율이 높다면 가능한 얘기죠.

그렇다면 제가 생각하기에 이게 근거 없는 음모론인 이유를 대보겠습니다.
1. 개표 과정에는 수많은 참관인들이 있습니다. 박근혜 쪽 지지자들, 문재인 쪽 지지자들 다 포함해서요.
무효표 중 박근혜 표로 재분류되는 표들 중 문재인 지지자가 확인하지 않는 표가 거의 없으며
반대 상황도 마찬가지입니다.

2. K값이 1.5를 주위로 정규분포를 그리고 있다. 그리고 지역별로 각자 다른 K값을 주위로 정규분포를 그리고 있다.
이는 조작에 대한 근거로 사용되곤 하는데 저는 오히려 이는 조작 가능성을 낮추는 근거로 봅니다.
서 너개의 개표소에서 대놓고 조작하는 것은 쉽진 않겠지만 가능하다고 치지만
이를 전국적으로 일정한 비율로 조작하는데 어느 한 군데에서도 개표 과정에서 이상한 점이 발각되지 않았다?
1번과 연결해서 매우 가능성 낮은 얘기라고 봅니다.

추가적으로 조작이 일어졌다면 둘 중 하나겠죠.
A. 박근혜를 찍지 않은 표를 박근혜 찍은 유효표로 둔갑함
B. 무효표를 재분류할 때 박근혜를 찍지 않은 표를 박근혜 찍은 유효표로 둔갑함
위에서 반박한건 B에 대한 반박이고
A에 대한 반박은 역설적으로 K값이 높게 나왔다는 점에서 가능합니다.
만약 박근혜를 찍었다는 threshold를 낮춰서 false positive를 늘리는 쪽으로 조작이 이뤄졌다면
반대로 K값이 1보다 낮게 나오는게 정상적이겠죠.
다크템플러
17/04/15 09:42
수정 아이콘
문제는 호남에서도 K값이 1.5라는게..
덧붙여 이전의 경우, 데이터가 다 남아있진 않고 일부만 남아있는데
16대 대선, 서울 관악 : K = (4,719/7,041) / (101,562/158,467) = 1.05
17대 대선, 서울 노원 : K = (5,353/10,831) / (68,561/141,229) = 1.02
17대 대선, 용인 수지 : K = (1,142/3,701) / (23,345/80,485) = 1.04
라는군요. 물론 18대 대선의 세대구도가 워낙 뚜렷한점도 있습니다만은..
17/04/15 10:13
수정 아이콘
http://www.millgall.com/fsboard/m_fsboard.asp?id=military3&mode=view&idx=21320&page=1#doc
보시면 알겠지만 호남은 대략 1.25 주위로 분포되어 있고
반면 대구 경북은 1.7 주위로 분포되어 있음을 확인할 수 있습니다.

저는 18대 대선이 특별히 16대나 17대 대선보다 세대구도가 뚜렷하다고 생각하지는 않고
가설 1. 개표기 알고리즘이 변했거나
가설 2. 기호 1번과 2번의 비대칭성과 노년층이 적게 투표했다는 점을 함께 고려하면 어느 정도 설명이 가능합니다.
Chandler
17/04/15 11:00
수정 아이콘
가설1이 핵심인거 같습니다

인위적일 정도로 개표기 알고리즘이 변했다는거

그 개표기 알고리즘에 누군가 인위적으로 손댄게 아닌이상 저정도 수치가 나오는건 불가능이라 보는거죠.

그 알고리즘을 통해 어떻게 이득을 보았는지는 가설일 뿐이고 어쨋든 인위적 개입인이상 이미 부정선거죠.
MirrorShield
17/04/15 12:29
수정 아이콘
인위적으로 손댄게 아니라 그냥 버전업했을 가능성이 제일 크죠 ;;

왜 그게 부정선거로 넘어가는지 이해가 안가네요.
17/04/15 08:36
수정 아이콘
확률로 생각해보고
임의의 값으로( 실제보다 훨씬 분산이 커질만한) 해봐도 1.5는 절대 못나옵니다.
그런데 박근혜 미분류표 문재인 미분류표는 어떻게 추산한건가요? 미분류가 박근혜인지 문재인인지 어떤 기준으로 정해진건지 좀 궁금합니다.
엣헴엣헴
17/04/15 09:13
수정 아이콘
제가 공돌이라 그런지 기호 1번과 2번만이 아니라 2번과 3번, 3번과 4번, .. 등등 다른 번호와의 차이들도 다 보기 전에는 그냥 개표분류기 알고리즘 문제라고 생각하고 있습니다.
해나루
17/04/15 10:33
수정 아이콘
근데 김어준이라면 '쉽게 뽀록날 거짓말을 고의적으로 할거라곤 생각하지 않고요' 라고 마냥 하기도 힘들지 않나요. 저는 그래서 패스했습니다.
Chandler
17/04/15 10:57
수정 아이콘
음모론 제기로 유명하고 주의해서 봐야한다고 생각도 하는데

공개된 데이터를 비교만 잠깐 하면 뽀록날 걸 4억원써가면서 만들정도로 멍청한 사람은 아닙니다.
MirrorShield
17/04/15 12:30
수정 아이콘
으음 저랑은 김어준에 대한 판단이 좀 다르시군요.
인간_개놈
17/04/15 21:52
수정 아이콘
음... 통계학적(과학적/수학적) 접근을 하고자 하시는데
그 시작이 "김어준은 그럴 사람이 아니다"라는 주관적인 판단이라는게 좀...
Chandler
17/04/15 22:22
수정 아이콘
공개된 숫자를 주작할정도는 아니다라는 믿음이죠 뭐..크게 무리한 전제는 아니라고 생각합니다. 김어준만 알 수 있는 데이터도 아니고 선관위에 공식적으로 남아있는 자료니깐요.
인간_개놈
17/04/17 11:10
수정 아이콘
저도 주작질 할 사람으로는 생각하지 않습니다.
다만 인간은 누구나 잘못된 판단을 할 수 있긴 하죠
전문가들도 자기 분야에서 오류를 범하는게 흔한 일이구요
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
101070 [질문] 경리단길 데이트코스 추천좀 부탁드립니다. [6] 깐딩7316 17/04/15 7316
101069 [질문] 한국 제외 유명한 댄스가수는 누가 있나요? [5] Tyler Durden2874 17/04/15 2874
101068 [질문] 유럽 신행 코스 어디가 좋을까요(로마in 로마out) [7] 제라스2064 17/04/15 2064
101066 [질문] 자동차 긁었는데 견적얼마나 나올까요? [7] 아스날3821 17/04/15 3821
101065 [질문] R 프로그램 fwf 파일 열 때 고정길이 설정 관련하여 halogen2602 17/04/15 2602
101064 [질문] 송염치약 대신할 치약 있을까요? [2] will2916 17/04/15 2916
101063 [질문] 금연하기에 너무 늦어버린걸까요 [17] 콩콩지3421 17/04/15 3421
101062 [질문] 안철수 정책이나 지지 이유에 대해 알고 싶습니다. [6] 삭제됨2548 17/04/15 2548
101061 [질문] 김연경선수 해외배구리그 다시볼수있는곳 있나요 ? [2] 천우희2182 17/04/15 2182
101060 [질문] [KBO] NC 응원하시는 분께 질문입니다. [4] Healing1757 17/04/15 1757
101059 [질문] 아침 7시 30분에 빨래돌리는거 잘못된걸까요? [74] 참교육23522 17/04/15 23522
101058 [질문] [정치] JTBC사과 했나요? [6] 드림3952 17/04/15 3952
101057 [질문] 통신사 가입되면 자동으로 멤버십 가입되는게 아닌가요? [4] 도토리해물전2150 17/04/15 2150
101056 [질문] 양복 소매와 바지 길이는 어떤 기준이 좋은 것인지요...? [6] nexon5210 17/04/15 5210
101055 [질문] pgr에서 대댓글이 안달아 집니다. [7] 1q2w3e4r!1917 17/04/15 1917
101054 [질문] 로건 영화에서 엑스맨이 모시는 할아버지질문입니다 [10] CR73147 17/04/15 3147
101053 [질문] 마사지샵에서 마사지 받으면 정말 시원한가요? [13] 레너블5479 17/04/15 5479
101052 [질문] lg그램 발열로 인한 느려짐 현상 및 노트북 거치대 문의 [2] 수루룩7881 17/04/15 7881
101051 [질문] P플랜이 정확히 뭐죠? [1] 삭제됨3921 17/04/15 3921
101050 [질문] 요즘 일베나 다른 보수사이트(?) 반응은 어떤가요? [12] Dow3295 17/04/15 3295
101049 [질문] 개인 홈페이지를 운영하고 싶은데 몇가지 질문드려요. [5] StayAway2103 17/04/15 2103
101048 [질문] 학사던 석사던 박사던 비전공이던 통계학 아시는 분들 질문합니다.(김어준다큐 더플랜) [22] Chandler4120 17/04/15 4120
101047 [질문] 콜드플레이 공연가시는 분 계세요? [6] 늅늅이2422 17/04/15 2422
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로