PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2020/08/14 15:09:44
Name Charli
Subject 드디어 업로드된 fivethirtyeight의 미국 대선 예측



uTghWnP.jpg
결론만 말하자면 72:28 바이든 우위입니다.




Ivlqdvs.jpg


이건 2016년 예측입니다. 놀랄정도로 비슷합니다. 하지만 좀더 들어가면 상황이 조금 다르다는게 네이트실버의 예측입니다.



네이트실버가 직접 모델을 설명하는 팟캐스트인데 짧아서 들어볼만합니다.
짧게 하이라이트만 번역해보겠습니다.

[예상보다 바이든의 당선 확률이 낮게 나온 이유는?]
8월이고 앞으로의 불확실성까지 포함한 모델이라서 그렇다.

[2016년 모델과 다른점은?]
2016년 모델은 굉장히 정확했다고 본다. 다른 모델보다 훨씬 정확하게 트럼프의 확률을 높게 쳐줬다. 우리 모델을 보고 베팅을 했다면 돈을 많이 땄을거다.
그때와 다른점은 Covid다. 코비드 때문에 불확실성에 관한 팩터들을 더 많이 포함하려고 했다.
그렇다고 올해가 역대 가장 불확실한 대선은 아니다. 오히려 올해는 역대 대선중에선 평균 정도의 불확실성으로 보인다.

[지금 모델에 2016년 데이터를 주고 예상한다면 예측이 달라질까?]
전혀 아니다. 다시 말하지만 2016년에 우리모 델은 굉장히 정확했다. 2016년에 트럼프 예측한 여론조사 기반 모델이 있다면 그건 구린 모델이다.
지금 와서 2016년에 트럼프가 당선되도록 모델을 바꾸는 짓은 의미가 없다. 많은 케이스에 reasonable한 대답을 하는 모델이 의미가 있다.

[지금같은 여론조사가 계속된다면 11월에 모델은 어떤 예측을 할까?]
오늘 대선이 열린다고 가정하면 모델은 90퍼, 92퍼 바이든 우위로 본다. 하지만 지금부터 11월까진 많은 일들이 일어날수 있다.

[처음 모델을 만들고 놀란 점은?]
개인적으론 85% 정도 바이든 우위로 봤는데 예상보다 낮았다.

[모델은 어떻게 구성되는가?]
모든 여론조사를 사용한다. 주(state) 여론조사가 당연히 더 중요하다. 전국 여론조사는 trend line adjustment에 사용한다. 예를 들어 지난주에 네바다 여론조사가 없었다면 전국 여론조사를 이용해 그 주의 퍼센티지를 조정한다. 여론조사 외에는 사전(prior) 확률을 포함하려고 한다. 현직 대통령 우위 (incombency), 양극화, 경제상황을 포함한다. 놀랍게도 (여론조사를 빼고) 사전확률만 보자면 트럼프는 아주 간소하게 바이든에 뒤지고 있다. 정부의 부양책에 따른 가처분 소득의 증가, 주식시장, 양극화를 포함한 확률이다. 이 사전확률을 여론조사와 합치게 되면 여론조사보다는 조금 더 박빙인 결과가 나온다. 사전확률은 지금은 전체결과에 25%에서 20%정도이지만 대선 당일에는 0%로 줄어들게된다.

[코비드는 어떻게 모델에 반영되는가?]
이건 나중에 시간되면 번역..

[대선의 결과를 가를 제일 중요한 주는?]
펜실베니아와 플로리다. 생각보다 여론조사가 박빙이고 많은 선거인단수가 걸려있다. 언론에서 말하는 위스콘신이나 애리조나보다 중요하다고 본다.


통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
우주전쟁
20/08/14 15:11
수정 아이콘
여기 지난 대선 때 힐러리 당성된다고 주장해서 거하게 틀린 곳 아닌가요?...--;;
20/08/14 15:13
수정 아이콘
다른데 다 90퍼이상 확률로 힐러리 예상할때 트럼프에게 확률을 후하게 준 거의 유일한곳입니다.
아린어린이
20/08/14 15:12
수정 아이콘
16년 모델이 정확했다고 주장하는데 결과가 아닌데도 계속 옳았다고 주장하는 이유가 뭘까요??
예측 프로그램의 평가는 결과를 맞췄느냐가 최 우선 아닌가요??
오클랜드에이스
20/08/14 15:15
수정 아이콘
오버피팅 문제가 있어서 그런것 같습니다.

만약 체중이랑 키로 성별을 예측하는 모델이 있다고 쳤을때

김연경선수를 여자로 정확하게 분류한다면 대신 보편적 데이터에서는 신체스펙이 비슷한 남자 여럿도 여자로 분류하는 문제가 생길 수 있겠죠.

아마 16년 미국 대선 상황 하에서 트럼프가 당선된걸 특이케이스로 보고있는것 같네요.
20/08/14 15:26
수정 아이콘
정확합니다.
아린어린이
20/08/14 15:50
수정 아이콘
그렇다면 트럼프의 당선이
샤이보수 의 숨은 표심, 러스트 벨트의 민심이반, 힐러리 전략의 실패 등이 아닌
그냥 이변에 가까운 결과로 분석하는건가요?? 다시 재투표했다면 결과가 바뀔 가능성이 높은??
신기하네요. 재미있기도 하고.
20/08/14 16:16
수정 아이콘
(수정됨) 결과에 대한 분석과 데이터에 기반한 확률은 서로 다른 영역이니까요... 거론하신 원인들은 분석 데이터에 포함되지 않거나 작은 비중만 반영되었을 것 같고...
데이터화해서 들어온 내용만으로 봤을 때 본인들의 분석은 정확하다는 말인 것 같습니다.
또 결과로 나오는 확률은 예측의 확률이지 다시 한다고 해도 결과는 불변이겠죠
위의 김연경 선수를 예로 들자면 키와 체중만으로 김연경 선수가 남자인 확률 90%도출했다 해도, 김연경 선수를 100번 검사하면 100번 다 여자겠죠.
다만 키와 체중이 동일한 표본 100명을 검사하면 90명은 남자일 것이다... 이런 이야기일 듯 합니다.
Justitia
20/08/14 19:27
수정 아이콘
전국에서 300만 표, 득표율로도 2% 이상 더 많이 얻은 쪽이 진 역대급 케이스라서...
전국여론조사 자체를 완전히 배제하는 모델이 아닌 한 맞추는 게 사실상 어려웠죠.
그렇다고 주 단위 여론조사만으로 하기에는 반영에 포함하는 시행횟수가 너무 적게 되어 정확성이 더 나빠질 겁니다.
홍준표
20/08/14 15:16
수정 아이콘
주사위를 던지는데 “6은 안나올듯” 이렇게 예측하는 모델은 옳지만 틀릴 수 있죠. 538의 입장에서 지난 대선은 그 낮은 확률로 6이 나온거라 보는 것 같습니다.
20/08/14 15:30
수정 아이콘
사실 7:3이면 스포츠에서도 심한 언더독은 아니죠.
스칼렛
20/08/14 21:48
수정 아이콘
트럼프 이길 확률을 1%가 아니라 30%로 예측했으니 다른 예측에 비해 상당히 정확했다고 봐야죠.
빙짬뽕
20/08/14 15:13
수정 아이콘
틀린거 지적했더니 응 그래도 우리 모델은 맞아...
흠 이게 대체 뭘까요
뭐 통계학적으로는 옳다 뭐 이런 말을 하려는거 같은데
20/08/14 15:18
수정 아이콘
통계학적인 모델이니까요
쿠키고기
20/08/15 00:31
수정 아이콘
99% 의 확률이라도
1%가 터진다고 그 통계가 잘못 된 것이 아닙니다.
통계는 모 아니면 도 로 보는 것이 아니에요.
In The Long Run
20/08/19 05:24
수정 아이콘
주사위를 두번 던져 6이 두번 나올 확률이 실제 결과가 6 6 으로 나왔다고 해서 100%가 되는게 아니죠
20/08/14 15:14
수정 아이콘
.286 타자가 안타치는건 이상한 일이 아니긴하네요.
어강됴리
20/08/14 15:16
수정 아이콘
일관성은 보기좋네요 결과론에 흔들리지 않는게
여론조사는 신탁이나 점집이 아니라 확률싸움이고 힐러리가 높은 확률을 가지고 있는게 맞았고
트럼프가 그 낮은 확률을 뚫고 당선된거죠
설사 트럼프가 낮은 확률을 뚫고 재선하더라도 예측모델이 reasonable 하다면 수긍할수 있는것 아닌가요

정치 자영업자들이 결과론가지고 인상비평 풀어놓으며 보따리 장사하는게 디게 꼴보기싫었는데
역시 한국 정치판이 후진거였네요
20/08/14 15:20
수정 아이콘
오히려 트럼프가 당선되고 이분 모델이 재조명받았죠. 트럼프 확률이 그만큼 딴 곳보다 현저히 높았어서..
시린비
20/08/14 15:18
수정 아이콘
트럼프가 당선된 이 우주가 나빠
raindraw
20/08/14 15:28
수정 아이콘
538이 여러 분야(선거, 스포츠 등)의 예측(확률)들을 내놓고 있고
그게 대다수 맞는 걸 보면 대단하다고 봅니다.
피지알그만해
20/08/14 15:33
수정 아이콘
뜬금 없지만 북핵문제를 해결할 찬스가 트럼프가 수세에 몰린 이 때이지 않나 싶네요. 김정은 똥개 훈련 시킬 때의 기세는 없으니..
독수리의습격
20/08/14 15:34
수정 아이콘
근데......처음 트럼프 당선되고 분위기 좋았을 때만 해도 북핵 문제를 해결할 시기는 지금뿐이다라는 얘기가 나왔었.....
크레토스
20/08/14 15:48
수정 아이콘
(수정됨) 별로 좋은 타이밍은 아닌게..외교 문제는 전통적으로 미국인들이 크게 신경 안쓰는 분야인데다 북핵 문제는 그 외교 문제에서도 더욱 관심 밖 영역이라서요..게다가 북한이나 이란 입장에서도 재선 못하면 어그러지니 대선 결과를 봐야 하고요. 뭐 트럼프도 지금이 아니라 재선하고 바로 북한,이란이랑 협상할거라 그랬죠.
피지알그만해
20/08/14 16:44
수정 아이콘
북핵문제는 단순 외교 문제 이상으로 유일무이한 패권국 천조국 미국에 테러단체 제외하고는 유일한 외부적 안보위협입니다. 미국인들이 총기 사건 못지않게 노이로제 시달리는게 부분이 북핵 또는 북한이 테러단체에 핵 팔아먹는거에요. 북핵 문제 해결 되면 앓던 이 뽑은 것 같은 전세 역전이 나올 수도 있습니다. 미국이 최강국 입장에서 CVID만 주구장창 외치고 있는데 그게 사실상 불가능하단걸 뭔가 다른 대안이 필요하단걸 그나마 인정할 수 있는 시기가 지금이 아니면 또 한참을 기다려야 될겁니다.
크레토스
20/08/14 17:03
수정 아이콘
뭐 한국인 입장에서야 그렇게 생각하고 싶지만 실제로
미국인들은 외교에 무관심이에요. 그나마 관심 있는 나라들도 러시아 중국 그정도지 북한은 뭐..
의료보험 문제 총기문제 이민문제 경제문제 인종문제 그 정도가 실제 관심사고 대선에 큰 영향 끼칩니다.
오바마가 이란이랑 핵협상하고 쿠바랑 화해한게 지지율에 영향 끼치지도 못했죠
트럼프가 북한이랑 정상회담 하고 좋게 지낸것도 마찬가지로 지지율에 1%도 변화를 못 이끌어냈습니다.
북핵해결이 표가 진짜 될거 같으면 트럼프 성격에 당장 정상회담하지 뭐하러 재선후에 한다고 하겠습니까
뉴욕커
20/08/14 21:12
수정 아이콘
미국인들이 총기 사건 못지 않게 북핵 노이로제??? 절대 아니고 전혀 아닙니다. 애초에 북한이란 나라에 대해서 잘 알지도 못하는 사람이 반, 핵문제가 있다는걸 아는 사람이 그 중 반, 그래서 뭐? 하는 사람이 대다수일겁니다.
20/08/14 22:50
수정 아이콘
한국인 입장에서 그렇게 생각하길 바라지만, (트럼프를 지지할) 대다수 미국민들은 냉정히 말해 아시아쪽이 어떻게 되든 관심없어요. 한국이 북아프리카 어떻게 되든 신경쓰지도 않고 대선이슈가 안되는거와 비슷합니다
스타더스트
20/08/15 06:42
수정 아이콘
미국 유권자들 생각을 전혀 모르시네요. 미국인들 별 관심 없습니다.
피지알그만해
20/08/15 07:32
수정 아이콘
북핵 문제는 외교 문제 차원을 넘어선 안보문제입니다. 저는 제가 뭘 잘못 알았나 싶어서 검색해봤네요. 트럼프가 대선을 위해서 북핵카드를 꺼낼 가능성에 대한 기사들이 차고 넘칩니다. 내 주변이 관심없다고해서 관심없는게 아닙니다. 사실 한국인들도 북한핵관련해선 서로 얘기 안하고, 그걸로 대통령 지지율에 변화가 있다거나 하진 않죠.
20/08/14 15:55
수정 아이콘
트럼프가 '사장님이 미쳤어요'급 제안 가져오지 않는 이상 북한이 골치아픈 협상에 임할리가 없죠.
바이든 당선되면 어차피 다 엎어질거 뭐하러 하겠어요.
피지알그만해
20/08/14 16:45
수정 아이콘
현실적으로 대선 뒤집을려면 사장님이 미쳤어요가 필요한것 같고 트럼프가 그정도 미친 사람 같거든요..;
Capernaum
20/08/15 13:36
수정 아이콘
트럼프 스스로 이란 핵 협상 날리면서

전임 대통령이 국제 협약을 해도 종이 쪼가리야

라고 보여줬는데 북한이 얼마나 멍청해야

레임덕이랑 협상을 할까요...
밴가드
20/08/14 16:08
수정 아이콘
힐러리 클린턴이 결국 전국득표를 2% 더 많이 받았기 때문에 저 확율 예측이 그나마 수긍되었지만 당시 538 지도를 보면 각 접전지 주들 예측에 비해 최종결과 오차가 상당히 컸죠. 538의 가중치보정된 최종 평균을 보면 위스콘신은 무려 5.3%, 미시간은 4.2% 차로 힐러리 우세로 나왔으니 자신들 방식이 딱히 근접했다고 할수도 없죠. 그에 비해 올해는 접전지주들 여론조사들이 양질적으로 향상이 있었기에 상황이 나아 보이기는 합니다.
이는엠씨투
20/08/14 16:23
수정 아이콘
신호와 소음 저자네요

통계적으로 뭔가 기발한 모델을 쓰는건지 예전부터 여론조사와 선겨결과 예측 정확도가 엄청나게 높기로 유명했죠

시카고대학에서 경제학을 전공한 네이트 실버는 2002년 회계컨설팅회사인 KPMG에 입사했지만 엉뚱한 일을 벌이기 시작했다. 자신이 좋아하는 메이저리그 야구선수의 성적을 예측하는 시스템인 페코타(PECOTA)를 개발한 것이다. 놀라운 적중률로 명성을 얻은 실버는 통계확률기법을 카지노에서 전략적으로 이용해 단번에 1만 5000달러를 따고 회사를 그만뒀다. 이후 포커판에서 수십만 달러를 긁어모았고, 그동안 쌓인 통계학과 예측의 노하우를 활용해, 정치 예측을 하는 블로그인 파이브서티에이트(FiveThirtyEight.com)를 2008년에 개설했다.

《뉴욕타임스》의 자매 블로그가 된 파이브서티에이트는, 2008년 대선에서 미국의 50개 주 중 49개 주의 결과를 정확히 예측했고, 총선에서도 상원 당선자 35명 전원을 맞혔다. 네이트 실버는 엄청난 유명세를 탔고 많은 사람들이 그의 예측에 주목하기 시작했다. 그러다 보니 2012년 미국의 대선에서는 그가 블로그에 글을 올릴 때마다 공화당과 민주당이 비중 있는 논평을 내놓기에 바빴다. 오바마와 롬니가 박빙으로 경쟁하는 와중에 첫 후보 간 토론회가 열렸고 그 뒤엔 여론조사기관 대부분이 롬니의 승리를 예측했다. 그러나 실버는 오바마의 승리를 점쳤고, 결과는 50개 주의 결과를 모두 맞힌 그의 승리로 끝났다.
20/08/14 17:34
수정 아이콘
진짜 비범한 예측률이네요
잠만보
20/08/14 16:26
수정 아이콘
개인적으로는 예상보다 바이든의 우세가 낮게 나왔다는 점에서 아직 트럼프에게 희망이 있는거 같습니다
므라노
20/08/14 16:34
수정 아이콘
사실 뭐 통계라는게 예언이 아니니까요.
힐러리가 90% 우세라면 보통 그냥 힐러리가 이겼다고 생각하겠지만 10%란게 의외로 높죠.
힐러리가 안 됐더라도 틀렸다기 보단 낮은 확률을 뚫은거라 봐야. 물론 모델은 더 개량해야겠지만요.
-안군-
20/08/14 16:44
수정 아이콘
뭐 10%정도면 가챠에서도 혜자로 치죠. 그정도의 예측실패는 어쩔 수 없는듯.
Eulbsyar
20/08/14 16:45
수정 아이콘
28%면 2할 8푼 타자인데 언제든지 안타 칠 수도 있는 타자죠
구밀복검
20/08/14 17:09
수정 아이콘
기실 1:1 2인 구도에서는 1표만 차이나도 당락이 결정되기 떄문에 말이 당선율 72:28이지 실제 득표율은 52:48 51:49 혹은 그 이하로 날 수도 있지요. 근데 그 정도 차이에서 그리 멀지 않은 득표율(46:48)이 나왔음에도 불구하고 미국 대선에서는 간선제의 특성으로 인해 업셋이 나올 수도 있었으며 실제로 나왔다는 게 재미있는 부분이었을 뿐이지요. 굳이 대선이 아니라도 다른 것도 마찬가지입니다. 발롱도르나 NBA MLB MVP 같은 거 배당률이 1.5:3 이렇게 나온다고 실제 득표에서 두 배 받는 게 아니거든요. 득표율 차이 자체는 1~2% 정도로 미세한데 그 미세한 차이가 관철될 확률이 얼마냐 그게 관건인 거죠. 득표율 차이가 뭐 5% 10% 이 정도 되면 배당률은 한 10배 20배 나는 거고요.
포프의대모험
20/08/14 17:10
수정 아이콘
트럼프 당선됐다고 틀린모델이란 소리는
3할타자가 안타쳤는데 삼진에 토토몰빵하고 어케안타쳤누 이러는거랑 똑같죠
20/08/14 17:38
수정 아이콘
오타 있으신 것 같습니다. Incombency > incumbency
쿠키고기
20/08/15 00:35
수정 아이콘
통계학을 모 아니면 도로 생각하시는 분들 계시는데
99.9% 확률이라고 하더라도 .1%가 터질 가능성이 없는 것 아닙니다.
현실에서 그 .1%가 터지는 경우 나오고 그렇다고 저 통계가 잘못 된 것이 아닙니다.
사람의 인지구조가 모 아니면 도로 자꾸 구분하려고 해서 생기는 오류인데
80%로 비가 온다고 하면 100%로 비가 온다라고 착각하는 것이랑 같은 것이죠. 그 20% 가 터지면
어떻게 저렇게 못 "맞추냐"고 얘기하는 것이랑 같은 거죠.
주사위를 던졌는데 10번 1이 나왔다고 1/6의 주사위 확률이 틀린 것이 아닌 것처럼
그 구분을 할 줄 알아야 합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
101288 [역사] 기술 발전이 능사는 아니더라 / 질레트의 역사 [2] Fig.1751 24/04/17 751 4
101287 7800X3D 46.5 딜 떴습니다 토스페이 [26] SAS Tony Parker 3067 24/04/16 3067 1
101286 방금 잠깐 1400찍고 내려온것 [71] 따루라라랑6888 24/04/16 6888 0
101285 마룬 5(Maroon 5) - Sunday Morning 불러보았습니다! [6] Neuromancer2162 24/04/16 2162 1
101284 남들 다가는 일본, 남들 안가는 목적으로 가다. (츠이키 기지 방문)(스압) [39] 한국화약주식회사6198 24/04/16 6198 42
101281 떡볶이는 좋지만 더덕구이는 싫은 사람들을 위하여 [25] Kaestro5959 24/04/15 5959 7
101280 이제 독일에서는 14세 이후 자신의 성별을 마음대로 결정할 수 있습니다. [292] 라이언 덕후18090 24/04/15 18090 2
101278 전기차 1년 타고 난 후 누적 전비 [55] VictoryFood11408 24/04/14 11408 7
101277 '굽시니스트의 본격 한중일세계사 리뷰'를 빙자한 잡담. [37] 14년째도피중7852 24/04/14 7852 8
101276 이란 이스라엘 공격 시작이 되었습니다.. [54] 키토14887 24/04/14 14887 3
101275 <쿵푸팬더4> - 만족스럽지만, 뻥튀기. [8] aDayInTheLife4740 24/04/14 4740 2
101274 [팝송] 리암 갤러거,존 스콰이어 새 앨범 "Liam Gallagher & John Squire" 김치찌개2784 24/04/14 2784 0
101273 위대해지지 못해서 불행한 한국인 [24] 고무닦이6866 24/04/13 6866 8
101272 [강스포] 눈물을 마시는 새 고이(考異) - 카시다 암각문 채우기 meson2650 24/04/13 2650 4
101270 사회경제적비용 : 음주 > 비만 > 흡연 [44] VictoryFood7158 24/04/12 7158 4
101268 북한에서 욕먹는 보여주기식 선전 [49] 隱患9473 24/04/12 9473 3
101267 웹툰 추천 이계 검왕 생존기입니다. [43] 바이바이배드맨7340 24/04/12 7340 4
101266 원인 불명의 고양이 신경·근육병증 다수 발생...동물보호자 관심 및 주의 필요 [62] Pikachu11522 24/04/12 11522 3
101265 [강스포] 눈물을 마시는 새 고이(考異) - 암각문을 고친 여행자는 누구인가 (2) [11] meson3311 24/04/11 3311 4
101264 [강스포] 눈물을 마시는 새 고이(考異) - 암각문을 고친 여행자는 누구인가 (1) [4] meson5308 24/04/11 5308 3
101263 이제는 한반도 통일을 아예 포기해버린듯한 북한 [108] 보리야밥먹자15428 24/04/11 15428 4
101262 창작과 시샘.(잡담) [4] aDayInTheLife3610 24/04/10 3610 1
101261 읽을 신문과 기사를 정하는 기준 [10] 오후2시3820 24/04/10 3820 8
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로