PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2014/05/22 15:21:30
Name 쿨 그레이
Subject [일반] [야구/확률] 어제 한화 대 넥센 9회초 오심 관련 : 0.1%와 베이즈 정리
간만에 쓰면서 퍽 즐거웠던 글을 블로그에 올렸습니다. 글이 길고, 상당히 난잡한데, 제 블로그가 하루 방문자 수가 밸리에 뭐 투고할 때나 500명 남짓인 관계로(...) 더 많은 사람들과 이야기를 공유해 보고자 합니다.

키 포인트는, 한 마디로 말하면, 이거에요. 비디오 판독, 얼마나 믿을 수 있는가.

이하 블로그에 올린 전문입니다. 손 좀 보고 어찌어찌하다보니 수업 10분 전이라(...) 피드백이 늦을 가능성이 좀 있네요. 수업 갔다와서 되는 대로 내용상의 문제에 대한 피드백을 받을 테니, 이 점 양해 부탁드리겠습니다.

대충 글 쓰는 데 한 두어 시간 반 정도 걸렸네요. 아이고 어지러워... 크크크



서문

일단, 링크(http://m.sportsseoul.com/section_view.html?idx=72874)의 기사를 먼저 읽고 오시는 걸 추천합니다.

링크의 기사에 따르면, 어제 9회초 고동진의 아웃판정은 오심이 아니었다고 주장합니다. 이 글은 이 오심이 아니었다는 주장이 사실이라는 가정 하에 쓰여지는 글이며, 또한 설령 오심이었다고 하더라도 이러한 상황(방송으로 비디오 판독을 한 것이 정확하지 않은 것처럼 보여질 가능성)이 벌어질 가능성 또한 없는 것은 아니므로, 그에 대한 이야기를 길게 늘어놓아보고자 합니다.

몇 가지를 먼저 밝히고자 합니다.

이 글은 절대 심판을 옹호하자고 쓰는 글이 아닙니다. 비디오 판독이 가질 수 있는 맹점과, 도입했을 때 이러한 문제(비디오 판독 결과 오히려 잘못된 판정이 나올 수 있을 확률)로 생길 수 있는 확률을 어디까지 잡을 수 있을 것인가에 대한, 다분한 수학적 접근입니다. 그리고 그럼에도 불구하고 우리는 왜 비디오 판독을 도입해야 하는가에 대해서도 이야기하려고 합니다.

또한, 아시다시피 저는 넥센 팬입니다. 어제의 3루 쪽 파울/페어 논란은 오심이라고 생각하지만, 기사를 쓴 기자의 손을 들어주고 싶은 마음이 없을 리가 없기 때문에 어느 정도 보는 관점이 치우쳐 있을 가능성이 분명히 있습니다. 가능한 한 그런 건 최대한 배제하고 싶습니다만, 이게 또 제가 원한다고 되는 일이 아니기 때문에, 그에 대한 것을 미리 밝힘으로써 혹여 제가 편견에 사로잡혀서 주장을 하고 있다면 그에 대한 지적을 부탁드리겠습니다.

글이 워낙 길어서, 일부러 장문을 두 번 강조했어요. 차라도 준비하시는 게 좋겠네요.



목차
 1. O. J. 심슨 사건, 0.1%의 미학
 2. 베이즈 정리
 3.
심판이 오심을 저지를 확률
 4. 비디오 판독에 베이즈 정리를 도입해 보면?
 5. 왜 비디오 판독은 도입되어야 하는가
 6. 결론




O. J. 심슨 사건, 0.1%의 미학

아마 확률이라는 요소가 개입된 여러 가지 법정 관련 사건 중 가장 유명한 것을 꼽으라면, 이 O. J. 심슨 사건을 꼽을 수가 있겠습니다. 엘리트 변호사들의 확률 말장난에 배심원들이 홀랑 넘어가서 생긴 대사건이죠. <정재승의 과학 콘서트>를 읽은 지 하도 오래 되어서 영 기억이 잘 나지 않지만 그 기억을 어렴풋이 더듬어 가면서 이 글을 적어 보자면, 당시 변호사들이 주장하는 게 미국에서는 아내에게 폭력을 행사하는 사람의 0.1%만이 사람을 죽인다는 결과가 있다, 그럼 심슨이 그 0.1%였단 말이냐, 이 말이었을 겁니다. 이 이야기가 있었던 걸로 기억을 해요. 아무튼 뭐 호화로운 스타 변호사들이 총출동한 만큼 유리한 이야기는 이것저것 가져다 썼겠죠. 그러니까 무죄가 떴을 거구요.

이 pdf 파일 11페이지에서는 이 사건과 관련해서 수학과에게만 재미있는 이야기를 하고 있습니다. 이걸 진짜로 확률을 구해서 계산을 해 본 거죠. 잡기를, 다음과 같이 잡았습니다.

S : 그러니까, 일종의 전체집합 같은 건데, 1988년 이래로 아내를 두들겨팬 남편의 집합입니다. 천하의 개쌍놈들이라고 할 수 있겠네요.
H : S 중에서 남편이 아내를 죽인 사람들의 집합입니다. 음, 인간 쓰레기라는 호칭을 붙여 볼까요.
M : S 중에서 1988년 이래로 살해당한 아내가 있는 가정의 집합... 말이 좀 어렵네요. 어쨌든 요점은, 아내가 살해당했다는 거죠. 주의할 것은(저도 처음에 이것 때문에 좀 헤맸습니다), 남편이 아닌 다른 사람에게 아내가 죽었을 수도 있습니다.

우리는 이제, 다음과 같은 확률을 구할 수 있습니다.

P(H) = 0.001. 변호인단의 주장이죠.
P(M|H) = 1. 어쨌든 아내가 남편에게 죽은 사건이 벌어졌으면, 아내는 살해당한 것이니까요.
P(M|!H) = 0.0001. 제가 여집합 표현을 도저히 못 찾겠어서, 전산에서 NOT을 의미하는 느낌표를 앞에다가 붙이는 것으로 대체하고자 합니다(...) 죄송 죄송 거듭 죄송. 아무튼 이 확률이 의미하는 바는, 음, 간단하게 말하면 살인 사건이 발생할 확률 정도로 보시면 될 것 같아요. 당시 미국에서 살인 사건이 일어날 최대의 확률이라는군요.

이제 이걸 바탕으로, P(H|M), 즉 아내가 죽었다, 확실히 타살로 죽었는데 그게 남편이 아내를 죽인 거냐, 아님 다른 놈이 죽인 거냐, 그 확률을 구하고자 하는 겁니다.

여기서 바로 뒤에서 나올 베이즈 정리를 써먹는 겁니다.

P(H|M)
= {P(M|H) * P(H)} / [{P(M|H) * P(H)} + {P(M|!H) * P(!H)}]

식을 좀 띄웠으면 좋겠는데 이놈의 귀차니즘이... 거듭 거듭 거듭 죄송. 음, 이런 점에서는 확실히 한글이 편해요. 아무튼 이제 실제 값을 좀 넣어볼까요? 기왕이면 종이에 써 가면서 하시는 걸 추천해요.

P(H|M) = (1 * 0.001) / {(1 * 0.001) + (0.0001 * 0.999)} = 0.91

즉, 살인율이 저렇고, 아내가 죽었을 때 그 아내가 남편에게 죽었을 확률은 무려 91%가 된다는 겁니다! 이게 이렇게 확률이 뻥튀기가 될 수 있는 거에요. 아내가 남편에게 맞아 죽을 확률은 0.1이지만, 그런데 그것이 실제로 일어났을 경우, 즉 실제로 아내가 죽었을 경우 그 범인이 남편일 가능성이 가장 높다는 이야기가 됩니다. 남편이 아닌 다른 사람에게 죽었을 확률보다 열 배 이상 높다는 거죠. 고로 심슨은 유죄일 가능성이 매우 높습니다. 이것만 해도 충격적인데, 여기에 다른 정황증거가 결합된다면? 그러니까 민사소송에서는 패소했죠.



베이즈 정리

인트로가 지나치게 길어지고 있으므로 이쯤에서 잘라 볼까요. 앞에서 우리는 아주 유용한 베이즈 정리를 어떻게 써먹는가를 실제로 보았습니다. 그럼 그 베이즈 정리라는 것이 뭔지에 대해서 이야기를 해 볼 필요가 있어요.

Bayes' Theorem. 1700년대에 살아계셨던 몹쓸 토마스 베이즈 선생이 고안한 정리인데요, 아마 학창 시절에, 특히 고등학교 때 확률 공부하면서 한 번씩은 들어보셨을 겁니다. 뭐, 수능 끝나고 다 잊어버리셨겠지만(...) 아무튼 이 학자에, 목사에, 철학자 노릇까지 하던 이 양반이 고안한 베이즈 정리라는 건 이거에요. 아, 참고로, 베이즈 선생은 1761년에 돌아가셨는데, 이걸 리처드 프라이스라는 몹쓸 친구가 1763년에 정리하면서 발표한 것이라는군요.

"우리는 사건 A가 일어날 확률과 사건 B가 일어날 확률을 알고 있습니다. 사건 A가 일어난 조건에서 사건 B가 일어났다고 쳐 보죠. 우리는 이걸 조건부 확률로 손쉽게들 구할 수 있죠어딜 봐서 손쉽게???. 자 그러면, 실제로 사건 B가 일어났습니다. 그 사건이 A라는 조건을 배경으로 하고 있을 확률은 얼마나 되겠습니까?" ...라는 게 이 베이즈 정리인 겁니다.

...어렵죠? 좀더 쉽게 실제 예를 들어 가면서 설명해 볼까요. 귀찮으니 위의 예를 들어서 설명해 볼게요.

우리는 남편이 아내를 때려죽일 확률과, 살인이 일어날 확률을 알고 있어요. 남편이 아내를 때려죽였는데 그게 살인일 확률은 사실 조건부 확률을 쓸 것도 없지만 어쨌든 쉽게 구할 수 있죠. 자 그럼, 아내가 죽었습니다. 이거 정황증거를 보니 살인 맞아요. 그 사건이 남편에 의해서 일어날 확률은 얼마나 되겠습니까? - 라고 묻는 것이 바로 베이즈 정리입니다.

어떤 상황에서 또 응용될 수 있는지, 한 가지 예를 더 들어볼게요. 이 예는 라이트 노벨로 배우는 수학... 제목이 <날 보고 첫 눈에 반했을 확률>(...) 책의 139페이지에서 인용을 했어요(의외로, 수학적인 내용은 잘 정리된 편입니다.).

어느 병을 검사하고자 하는데, 검사 정확도가 98%인 검사가 있어요. 즉, 병에 걸렸다고 판정을 했을 때 이게 진짜로 병에 걸렸을 확률이 98%라는 거에요. (이 미묘한 말, 주목하시기 바랍니다.)

이 병에 걸릴 확률은 0.5%라고 합니다. 그러니까, 1000명 중 고작 5명의 운도 지지리도 없는 기구한 팔자의 사람들이 이 병에 걸린다는 겁니다.

자, 내가 왠지 몸이 좀 아파요. 기침이 나오고 콜록콜록하고 머리도 좀 띵한 게 아 아무래도 올 게 왔구나 싶어요. 내가 바로 그 지리 운도 없는 5명에 들어간 건가! 싶어서 검진을 받아보니까 아니나다를까 양성 반응이 떴어요. 자 근데, 검사 결과가 양성이긴 한데 솔직히 확신이 없네요. 내가 진짜로 이 병에 걸린 건지 아님 다른 병이 걸렸는데 이 병에 걸린 것처럼 오인 판정이 나왔는지 그걸 모르겠네요. 죽을 때 죽더라도 정신승리는 하고 죽자는 마인드로 진짜로 내가 병에 걸렸을 확률을 구해 보고자 해요. 이럴 때 베이즈 정리를 쓰는 겁니다.

일단 적용하기 전에, 음, 결과값이 얼마나 나올까? 이걸 한 번 예상해 보시고 들어가세요. 단, 이 때는 좀 조심해서 적용을 할 필요가 있어요. 헷갈리기 딱 좋거든요.

P(A) = 감염되었을 확률. 0.005죠.
P(B) = 검사 결과가 양성일 확률. 이렇게 두어야 검사 결과가 양성일 때 내가 감염되었을 확률을 구할 수 있어요. 이거 진짜 조심해야 합니다. 무심코 이걸 0.98로 놓으면 진짜 큰일나요. 수능에서 한 문제가 날아갑니...
P(B|A) = 내가 감염되었고 검사 결과가 양성일 확률. 이게 0.98이겠죠.
P(B|!A) = 내가 감염되지 않았는데도 검사 결과가 양성일 확률. 이건 0.02죠.

우리가 구하고 싶은 건 P(A|B)입니다. 검사 결과가 양성인데 실제로 감염이 되었을 확률인 거죠.

베이즈 정리를 적용해 보면...

P(A|B) = {P(A) * P(B|A)} / [{P(A) * P(B|A)} + {P(!A) * P(B|!A)}] = (0.005 * 0.98) / {(0.005 * 0.98) + (0.995 * 0.02)} = 0.197

다시 말해, 어이없게도, 검사 결과가 양성으로 뜬 사람 중 실제 병에 걸린 사람의 비율은 고작 20%도 안 된다는 충격적인 결론이 나옵니다(...)

말의 미묘함에 주의하세요. 확률은 기본적으로 수학 싸움에 국어 싸움이 곁들여져 있습니다. 무엇을 보고 확률을 잡는지 그것을 명확하게 할 필요가 있어요. 제가 굳이 일일이 하나하나 길게 이야기하는 것은 바로 이런 때문입니다.

여담인데, 이거 사실 대학교에서도 확률론 시간에 또 배웁니다. 제가 화학/수학 이중전공하고 나왔지만 솔직히 수학과 학점은 영 아니올시다였고 확률론도 마찬가지였는데, 메인 토픽감으로 좋은 글거리를 던져주니 이렇게라도 써먹는구나 싶네요(...)



심판이 오심을 저지를 확률

자 이제, 이론적 배경은 다 끝났으니, 적용하는 일만 남았네요. 야구만 보는 분들에게는 지금까지 참으로 지루한 이야기가 아니고 또 아닐 수 없겠군요(...) 일단 죄송.

뜨거운 감자, 오심, 뭐 이게 하루이틀 일입니까? 2014 시즌의 야구는 정말 오심으로 불타오르고 있죠. 하루에 한 건은 기본이고, 아예 경기마다 하나씩 나온다고 해도 이상하지 않을 수준입니다. 원래 이 글은... 사실, 어제 오심 논란만 아니었으면 심판의 오심율을 한 번 구해봅시다 하고 달려드는 글이 될 것이었습니다. 맨 위의 기사가 사실이라는 전제 하에, 문승원 주심이 옳았다고 가정했을 때, 오히려 비디오 판독이 실수를 할 가능성이 얼마나 되느냐를 따지기 위해 지금까지 장황하게 O. J. 심슨 사건이니 베이즈 정리니 하며 주저리주저리 길~게 늘어놓은 겁니다.

보시다시피, 베이즈 정리 자체는 가치판단을 하지 않지만, 그 결과 자체는 굉~장히 양면적이에요. 실제로 O. J. 심슨 사건에서 적용된 베이즈 정리는 이 자식은 천하의 개쌍놈이다! 그 증거가 여기 있어! 하는 식으로 일이 진행되지만, 뒤에서 소개한 감염률 논란의 경우는 이거이거 검사가 이게 말이나 되냐? 이거 완전 헛다리 아냐? 하는 식으로 이야기가 진행되죠.

그래서, 가장 중요한 것은 확률을 어떻게 잡느냐입니다. 저는 이 글에서 제가 지금까지 보아 왔던 야구의 체감 확률을 가지고 확률을 세워 보고(솔직히 오심을 일일이 세고 있을 시간도 없네요. 글 쓸 시간은 있고?), 직접 비디오판독이 옳을/틀릴 확률을 한 번 계산해보고자 합니다. 이게 이 글의 메인 포인트가 되겠네요.

식은 그대로 따라가면 될 거고, 여러분들은 각자 여러분들이 체감하는 확률에 따라서 비디오판독이 과연 심판의 오심률에 비해서 얼마나 믿을 만한가를 직접 계산해 보시기 바랍니다.

자, 이제 확률을 세워야겠죠... 솔직히 쓰면서 겁나네요. 틀릴까봐. 그래서 저는, 제가 생각하는 확률을 직접 최대한 rational하게... 그러니까 이유를 대 가면서 적겠지만, 그래도 이건 어디까지나 개인적인 시선이 들어가는 것이기 때문에, 그러한 확률에 대해서는 파란색 굵은 글씨로 표시하겠습니다. 그 숫자를 여러분들이 아 이건 좀 아닌데 싶으시면 그때그때 바꿔서 계산하시면 돼요. 여담인데 돼요/되요 맨날 헷갈리네요. 해요/하요니까 돼요가 맞는데 왜 되요라고 쓰고 싶은 거지?

일단, 먼저 심판이 오심을 저지를 확률을 이야기해 봅시다. 스트라이크 같은 판정이 아니라, 타자의 타구가 인 플레이가 되었는데 그것이 페어냐 파울이냐 하는 걸로 한 번 따져볼게요. 그러자면, 타자가 일단 타석에 들어서고, 삼진을 안 당해야 하잖아요? 볼넷도 걸어나가는 거니까 여기에는 판정에 이의가... 아 물론 있을 수는 있죠. 하지만 저는 일단, 타자의 타구가 인 플레이로 된 상태에서 오심이 벌어지는 경우를 보고 싶기 때문에, 삼진과 볼넷을 제외하고, 희생번트나 희생플라이 같은 건 다 집어넣은 후에 계산을 해 보고자 합니다.

Daum의 프로야구 기록실을 볼게요. 이 모든 데이터는 이 자료를 참고로 해서 계산했음을 먼저 밝혀야겠네요. 엄연한 저작권 문제니까.

이 글을 쓰고 있는 5월 22일 현재, 타석에 가장 많이 선 선수 60명으로 뽑아 봤어요. 엥, 언제 강민호가 삼진 1위가 되고 툭하면 귀병 귀삼나오는 이 게레... 아니, 강정호가 4위까지 밀려났지?

아무튼 이 정도를 가지고 표본을 구해도, 타석수의 합이 무려 9430이에요. 세이버메트리션 사이에서는 보통 3천 타석 정도는 써야 의미있는 결과가 나온다고 하니까, 이 정도 표본 수라면 선수별 편차를 감안해도 적은 건 아니겠죠?

이제 타석수에서 삼진과 사사구를 빼면, 홈런이건 뭐건 타격으로 인 플레이가 나온 타석의 수가 나오겠죠. 그렇게 해서 빼서 더했더니 무려 6947이 나오네요. 그러니까, 타자가 타석에서 볼넷이나 삼진을 당하지 않고 타격을 해서 그게 땅볼이건 플라이건 병살이건 안타건 요시 그란도 시즌이건 인 플레이로 연결될 확률은 6947/9430 = 어바웃 0.73669141... 정도가 되겠네요. 계산의 편의를 위해서 0.75라고 할게요. (너무 그렇게 초반부터 벌써부터 반올림 장난질이냐고 하지는 말아 주세요. 어차피 뒤로 가면 갈수록 의미없을지도 모르는 데이터가 나올 테니까.) 아, 처음에는 삼진 상위 40명으로 구했는데, 그 때는 대략 0.69 정도가 나왔어요. 그러니까 못 치는 타자들이 많이 나올수록 볼넷이 적어지고 타격으로 이어질 가능성이 높으니까, 확률을 올리는 방향으로 가는 게 틀린 건 아니겠죠. 뭐 물론 틀릴 수도 있지만...

자 이제, 전 경기 타석수를 구해야 하는데... 아이고 머리야. 이걸 어떻게 다 구하죠? 이걸 구하기 위해서, 한 가지 꾀를 내 보네요. 아웃을 당하지 않으려면, 볼넷으로 나가던지, 안타를 치던지가 되겠죠? 그러니까 (볼넷 + 안타) / (전체 타석 수)가 가장 적합하겠네요. 출루율하고 똑같지 않냐고요? 출루율에는 희번이 들어가지 않잖아요.

그러니까 그냥 출루율 평균 내는 것도 좋지만 보다 정확한 계산을 위해서 (볼넷 + 안타) / (전체 타석 수)로 계산하면, 이게 곧 타자가 살아나갈 확률이 되겠죠. 모집단 전체를 일일이 다 구할 수는 없는 노릇이니까(뭐, 스탯 구하는 사이트라면 그렇게 해야겠지만요) 그래서 일부만 뽑은 거죠. 아무튼 그래서 한 번 계산해 보니까, 0.377이 되네요. 자, 여기서 뭐가 빠졌는지 아시겠어요? 바로 실책성 출루가 빠졌죠! 한 경기 몇 개씩 벌어지는 실책, 이걸 생각해 보면 0.377에다가 좀더 가중치를 둬야 할 것만 같은 느낌이에요. 음, 근데 실책성 출루는 경기당 한두 개 정도니까, 막 그렇게 확률을 팍팍 올릴 것 같지는 않고, 적당히 저 할푼리의 리를 반올림하는 정도로 보정해 주면 될 것 같아요. 그러니까 한 경기에서 타자가 실책이든 안타든 볼넷이든 어쨌든 살아서 1루를 밟을 확률은 0.38이 되겠네요.

이걸 왜 계산했는지 좀 의아해하실 것 같아서, 설명을 해 볼게요. 물론 기록지 일일이 확인해 가면서 전 경기에 타석이 몇 개나 나왔나를 보면 그게 베스트겠죠. 하지만 저는 안타깝게도 대학원생이고, 당장 계산 결과를 바쳐야 하는 입장이라(...) 그리 오래 글을 쓸 처지는 못 되네요. 다시 이야기하는데 글 쓸 시간은 있고? 아무튼 그래서 대략적으로 한 경기에 얼마나 많은 타자들이 평균적으로 살아나가는가를 본 다음, 그걸 이용해서 평균적으로 한 경기에 얼마나 많은 타석이 나오는가를 구해 보고자 하는 거에요. 그 다음에 그걸 경기수로 곱하면 이제 전 경기 타석수가 되겠죠?

앞서도 구했듯이 대충 한 40%의 확률로 타자가 살아나가네요. 야구라는 게 9회말이 있을 때도 있고, 없을 때도 있고 이렇긴 한데, 연장 가는 경기도 심심찮게 나오니까, 계산하기 편하게 양쪽 모두 26아웃씩 - 원래대로라면 25.5아웃씩을 배정해야겠지만 아무래도 연장이 있는 만큼 아웃카운트를 좀더 올려 주는 쪽으로 보정해 주는 게 맞겠죠? - 배정할게요. 26아웃을 모두 삼진 범타 플라이 이런 걸로 처리해 버리면 되겠지만, 안타깝게도 투수는 언젠가는 얻어맞아요. 아까 타자가 평균적으로 살아서 1루를 밟을 확률이 0.38이라고 했죠? 그러면 전체 타석 수는 몇 개나 될까요? 26아웃 곱하기 (1 + 0.38)이 되겠죠? (아웃은 높은 확률로 타자가 살아나가지 못하니까요. 일단 여기까지는 편의상 주루사는 제외했어요. 흔히 일어나는 일까지는 아니니까.)

그러면 실제로 타석 수는 35.88, 약 36타석인데, 아까 저는 실책 출루에는 보정을 해 줬고, 견제사나 주루사, 그리고 병살타는 보정을 하지 않았잖아요? 그러니까 이번에는 거기에 보정을 해서, 이번에는 타석 수를 좀 깎아보고자 해요. 그래도 주루사가 실책보다는 일어날 확률이 높아 보이니까(병살이야 뭐 두말할 것도 없죠), 아예 소수점 이하를 버리는 것으로 하는 게 좋을 것 같네요. 연장 갈 확률이 그리 높지 않다는 점도 전혀 고려를 하지 않았으니까... 그렇게 해서, 한 경기당 평균적으로 35번 타석에 설 수 있다, 이렇게 결론을 내릴게요.

그러면, 이제 우리는 전 경기 타석이 대략 몇 개 정도 될 것인가를 예측해볼 수 있어요. 경기 수를 세는 건 쉬워요. 일단 모든 팀의 경기 수를 더하고, 한 경기당 두 팀이 등장하니까세 팀이 야구하진 않잖아요? 오오 삼색싸움? 그걸 반으로 나누면 되네요. 5월 22일 PM 2시 현재, 총 178경기를 했어요.

이제 우리는 길고 길었던 과정을 통해서 타자가 얼마나 많이 타격을 해서 인 플레이로 얼마나 많이 연결되었는가에 대한 결과를 얻을 수 있어요. 178경기 곱하기 35타석 곱하기 인 플레이로 갈 확률 0.75를 해 주면 대략 4672.5번의 타격이 일어난 셈이네요. 음, 이건 좀 계산하기 복잡하고, 편의상 4500번으로 할게요. 신인의 경우는 아무래도 땅볼보다는 삼진을 많이 당할 것 같고, 덜 기용된 선수가 더 기용된 선수들보다 선구안이 좋을 경우는 좀처럼 드물 테니까. 너무 많이 줄였나요? 하지만 경기수는 178경기로 꽤 많으니까, 한 경기당 인 플레이 한 번 정도를 뺀 정도인걸요.

자 이제, 심판이 오심을 얼마나 했는지를 계산해 봐야겠죠? 근데, 솔직히 거의 매일 오심이 났다고는 하는데, 기사를 제가 일일이 뒤져 가면서 아 이거 오심 아 이건 오심 아님 이럴 수는 없어요. 맨 위의 링크도 오심이 아닌 것으로 결론을 내리는데 이걸 제가 일일이 다 확인할 수는 없잖아요? 그래서 또 잔꾀를 부려 보네요.

매일마다 오심 시비가 벌어진 건 확실해요. 지금까지 야구를 며칠 동안이나 했는지 정도는 셀 수 있겠네요. 마침 46일이네요. 근데 개막전 때 한화와 롯데가 하루 밀린 거 포함해서 46일이니까, 운 좋게 딱 계산하기 편하게 45일이네요. 하루에 오심이 뭐 한두 개도 아니고 굉장히 여러 개 났었죠? 그래도 시즌 초에는 5월 들어 하루에 몇 개씩 발생하는 정도까지 막장은 아니었으니까, 그걸 감안해서 하루에 1.5개 정도의 오심이 전 구장에서 벌어졌다, 이렇게 가정을 할게요. 솔직히 제가 생각해도 지나치게 적어 보여요. 그래도 초반에는 하루에 한 건 혹은 그 이하 정도로 오심이 벌어졌으니 거기에 대한 가중치를 둔 거라고 이해해 주세요. 뭣하시면 레이즈 치셔도 좋고...

4500번의 인 플레이 중에서, 심판이 오심일 일으킬 확률은 45 * 1.5 / 4500 = 1.5% 정도가 되겠네요. 너무 낮아 보인다구요? 하지만 심판이 제대로 판정하고 있는 게 훨~씬 많을 수밖에 없는 건 당연하잖아요.



비디오 판독에 베이즈 정리를 도입해 보면?

자, 여기까지 읽느라 수고 많으셨는데, 앞으로 1/4 정도는 더 가야 하니까어쩌면 더 갈 수도 있구요 몸이라도 좀 풀고 오시는 게 어떨까요?

어쨌든, 이제 비디오 판독을 했는데 그게 옳을 확률과 틀렸을 확률을 계산해야겠죠? 일단 그렇게 하자면, 심판이 오심을 일으키는 사건의 수로부터 좀 따져볼 필요가 있어요.

이번 시즌에서 심판은 제가 생각했을 때 총 67.5개의 오심이 벌어졌다, 이렇게 볼 수 있어요. 표현이 좀 이상하죠? 0.5개의 오심이라니? 하지만 이건 어디까지나 계산 과정에서 나오는 것이고, 당연히 오차는 있을 수밖에 없으니까 이건 이해해 주세요.

근데 비디오 판독이라는 게, 거의 정확하다가 어쩌다 오늘 같은 날에 하나 틀리는 거잖아요. 무슨 소리를 하고 싶은 거냐면, 작년에 비디오 판독이 틀리고 심판이 맞았다, 이 말은 없었단 말이에요. 즉 작년에는 비디오 판독이 문자 그대로 100% 팬들에게 올바른 방향으로 인도하는 역할을 했다는 거죠.

음, 100%라고 하니까, 막상 쓰고 보니까 조금 그렇네요? 비디오로 봐도 애매~한 결과는 충분히 있을 수가 있어요. 그거에 대한 보정을 좀 하고자 해요.

자... 그럼 작년에 일단 오심이 몇 개나 벌어졌을까, 그것부터 구해야겠죠? 오심논란에 비디오 판독이 빠지는 경우는 아예 없으니까요. 그리고 작년은 솔직히 작년도 막장이었지만 올해만큼 심한 건 아니었으니까, 하루 1개 정도로 가정할게요. 음, 128경기를 128일에 하지는 않았지만, 우천취소나 강우콜드 같은 것도 있었으니까, 그냥 계산하기 편하게 128개의 오심이 작년에 벌어졌다고 생각할게요.

이 중에서, 한 개 정도는 비디오 판독으로 따져보니까 워낙 애매해서 심판 재량에 맡길 수도 있는 걸 오심으로 판정했다, 이렇게 볼 수 있을 것 같아요.

작년에 하나, 그리고 올해에 하나. 총 두 개의 잘못된 비디오 판독이 벌어졌다고 가정해 볼게요. 전체 오심은 195.5개니까, 계산하기 편하게 그냥 200개로 할게요. 그러면 비디오 판독이 잘못될 확률은 1% 정도가 되겠네요. 너무 큰가요? 하지만 표본이 워낙 작은걸요.

어쨌든 비디오 판독이 맞을 확률 99%, 비디오 판독이 틀릴 확률을 1%라고 놓고 베이즈 정리를 도입해 볼게요. 쓰면서 정말 불안하네요. 틀렸을까봐. 혹시 제가 틀렸으면 지체없이 댓글로 남겨주세요.

P(A) : 오심이 일어날 확률. 1.5%.
P(!A) : 오심이 일어나지 않을 확률. 98.5%.
P(B) : 비디오 판독을 통해 오심으로 판정할 확률.
P(A|B) : 오심으로 판정했을 때 실제로 오심이 일어났을 확률.
P(B|A) : 오심이었고 비디오 판독을 했을 때 오심이었을 확률. 99%.
P(B|!A) : 오심이 아니었는데 비디오 판독을 하니까 오심일 확률. 1%.

검사 결과가 오심이었는데 실제로 오심일 확률
= (0.015 * 0.99) / {(0.015 * 0.99) + (0.985 * 0.01)} = 약 60%!

놀라셨나요? 저도 계산 결과 보고 깜짝 놀랐네요. 비디오 판독 들어갔는데 실제로 비디오 판독이 헛다리 짚을 가능성이 무려 40%라니요! 물론, 비디오 판독의 정확성을 너무 낮게 잡아서 그랬을 수 있어요. 그래서, 이번에는 다른 거 제쳐두고, 체감상 비디오 판독 확률의 정확도를 보고 한 번 이야기를 해 볼게요.

P(A) : 오심이 일어날 확률. 1.5%.
P(!A) : 오심이 일어나지 않을 확률. 98.5%.
P(B) : 비디오 판독을 통해 오심으로 판정할 확률.
P(A|B) : 오심으로 판정했을 때 실제로 오심이 일어났을 확률.
P(B|A) : 오심이었고 비디오 판독을 했을 때 오심이었을 확률. 99.7%.
P(B|!A) : 오심이 아니었는데 비디오 판독을 하니까 오심일 확률. 0.3%.

저 수치는 DNA 검사의 1995년 당시 정확도에서 따 온 거에요.

아무튼, 이런 식으로 되었을 때 검사 결과가 오심이었는데 실제로 오심일 확률
= (0.015 * 0.997) / {(0.015 * 0.997) + (0.985 * 0.003)} = 83.5%.

이제 좀 납득이 가는 수치가 나오나요? 근데, 사실 여전히 낮은 수치에요. 왜냐면, 저건 뒤집어 말하면 비디오 판독의 정확도가 99.7%라고 해도 여섯 번 중 한 번은 실수한다는 이야기가 되거든요. 심지어 비디오 판독의 정확도를 99.9%로 올려도, 열다섯 번 중 한 번은 실수한다는 결론이 나와요.



왜 비디오 판독은 도입되어야 하는가

그럼에도 불구하고, 저는 비디오 판독 도입에 찬성하는 입장입니다.

가장 큰 이유는, 유효한, 믿을 만한 분석이기 때문이에요. 왜 기껏 60%라고 구해 놓고 믿을 만하다고 이야기를 하냐구요? 체감상 느낌이라는 게 있고, 또 야구팬이 가장 납득하기 쉬운 게 비디오 판독이잖아요? 이걸 놓칠 수는 없다고 생각했어요.

근래에 들어서 야구 안 본다는 사람이 점점 늘어나가고 있어요. 오심도 오심이지만, 심판의 저 엿 같은 권위주의 때문이 더 크죠. 다들 오심은 일어날 수 있다고 이야기를 하고 또 이해하잖아요. 그러면, 그렇게 이해를 해 주면, 오심이 벌어지면 아 내가 잘못했다, 팬 분들 선수분들 죄송합니다 하면서 사과하고, 징계도 좀 강하게 주고(솔직히 50만원 벌금에 엄중 경고면 누가 그걸 강한 징계라고 생각하겠어요?), 심판들이 오심을 벌이지 않도록, 다시 말해 오심률을 낮추기 위해서 우리는 이렇게 노력한다는 모습을 보여야지, 맨 기사들은 하나같이 심판들도 한 가정의 아버지다, 이런 감성팔이만 하고 있잖아요?

거기에 대한 반감 때문에라도, 그간 심판이 쓸데없이 권위주의를 내세웠던 것 때문에라도, KBO에 대한 전체적인 징계적 차원에서 저는 비디오 판독이 도입되어야 하며, 일차적으로 심판이 판정하겠지만 비디오 판독 역시 믿을 만한 자료니까 충분히 참고계(械, 기계 계에요. 비디오 판독기가 사람은 아니니까.) 같은 걸 도입해 가면서 심판의 권위도 세우고 KBO의 흥행 저해요소도 줄이고 팬들도 납득하면서 경기를 보고. 얼마나 좋아요?

돈 문제가 걸려 있는 건 알고 있어요. 하지만 저는, 장기적으로 보았을 때, 비디오 판독기를 설치하고 감독하는 데 들어가는 돈이, KBO가 계속해서 무리성 운영을 하면서 팬들 다 떨어져나가게 하는 그 손실보다는 훨씬 적게 먹힐 거라고 생각해요. 100억 원이 들어간다고요? 한 경기에 입장료 만 원이라 치고 1만 관중이 들어가도 1억 원이고, 한 해 경기가 128 곱하기 4.5 해서 576경기니까 적어도 흥행수익으로 576억 원을 벌 수 있으니 이 중에서 세금 관리료 임대료 빼도 길게 잡아서 한 2~3년 모으면 충분히 비디오 판독기를 설치할 수 있고, 일단 설치하면 관리비는 설치비보다는 줄어들 테니까 충분할 거라고 생각하는 건 저뿐인가요?

오히려, 장기적으로 누적 총 50만 관중이 판정시비 때문에 야구판을 떠난다 치면, 당장 2~3년만 해도 손해액이 100억이 넘어가는데, 이걸 그대로 보고 있는 게 더 넌센스 아닐까요? 어차피 야구 볼 사람은 본다구요? 그럼 1년 누적 관중의 꾸준한 하락세는 어떻게 설명해야 할까요?

비디오 판독 분석이 사실 그렇게까지 믿을 만하지 못하다는 결론이 나왔는데도 비디오 판독을 도입해야 한다는 주장은 그래서 나오는 거에요.



결론

비디오 판독에는 분명 허점이 있어요. 생각보다 그 허점은 커요. 무작정 비디오 판독이 옳다 이렇게 이야기하기도 어려워요. 하지만 적어도 심판의 눈보다는 분명히 정확하고, 또 못 본 장면을 리와인드한다는 점에서 비디오 판독은 아주 좋은 판독기이며, 다른 거 제쳐두고 떠나는 팬을 잡기 위해서라도 큰 돈 들여 가면서 비디오 판독기를 설치할 가치는 분명히 있다고 생각해요. 단, 비디오 판독을 어디까지나 참고용으로 쓸 것이지, 비디오 판독이 길이요 진리요 생명이요 뭐 이런 식으로 비디오 판독만 찬양하는 것은 지양해야 할 것 같아요.

글이 많이 난잡했네요. 한 방에 들어 있는 걸 다 풀어 써 보려고 발악을 하다 보니 이렇게 되었네요. 여기까지 시간 들여서 공들여 읽어 주신 분들께 감사드리고, 피드백은, 혹시 댓글 달아주시는 분이 계시다면, 시간을 어떻게든 내 보겠지만 조금 시간이 걸릴 수는 있다, 그렇게 말씀드리고 싶네요. 전 대학원생이고, 당장 30분 후면 수업이라서요.
  

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
찬공기
14/05/22 15:33
수정 아이콘
[비디오 판독이 잘못될 확률은 1% 정도...] 이 추산 자체가 전혀 근거가 없는 가정이기 때문에 이후의 계산은 전혀 의미가 없다고 봅니다.
[이 중에서, 한 개 정도는 비디오 판독으로 따져보니까 워낙 애매해서 심판 재량에 맡길 수도 있는 걸 오심으로 판정했다, 이렇게 볼 수 있을 것 같아요.] 또한 전혀 근거 없는 추정이구요.

대체 비디오 판독이 잘못될 확률이란게 뭔가요? 그런게 존재합니까? 카메라를 왜곡하면서 공이 휘어져 날아가나요?
물론 비디오 판독으로도 "애매한" 경우라면 존재할 수 있겠죠. 근데 그건 카메라 대수를 늘림으로써 커버 가능한 부분이에요.
쿨 그레이
14/05/22 16:54
수정 아이콘
네. 정확한 지적이십니다. 근거 없는 추정이죠. 하지만 나름대로 그렇게 추정을 했던 이유가, "오심 논란이 벌어졌고 실제로 방송 장비를 통해서 오심인 것 같아 보였으나, 초슬로우 비디오 카메라로 보니까 알고 보니 오심이 아니었더라"라는 데서 출발하거든요. 이런 일이 일어날 가능성이 일 년에 한 번 있을까말까한데, 그래서 값을 저렇게 잡은 겁니다. 그리고 근거 없는 추정인 것도 맞죠.

비디오 판독이 잘못될 확률이라는 건, 심판들이 비디오를 보고, 판독을 했을 때, 그 판독이 잘못될 확률이라고 보시면 될 것 같네요. 결국 비디오 판독을 통해도 판단은 심판진이 내리지 않나요? 그런 의미입니다.
Rorschach
14/05/22 15:35
수정 아이콘
[비디오 판독이 잘못 될 확률] 이라는 것 자체가 의미가 없는 개념이라고 봅니다. 배구를 예로들면-V리그의 경우 중계화면을 통한 판독을 하긴 합니다만-비디오 판독으로도 확실하게 판별할 수 없을 경우 [판단할 수 없음]으로 결론을 내립니다. 제 기억이 확실친 않지만 아마도 이 경우 처음의 심판 재량의 판정으로 결정될거예요.

즉, 비디오 판독 요청이 들어왔고, 비디오로 봐도 애매할 경우에는 심판의 판정대로 가면 되는겁니다.
쿨 그레이
14/05/22 16:55
수정 아이콘
이게 맞죠. 다만 비디오 판독을 통해 심판진이 내린 결론을 어디까지 인정할 수 있을 것이냐, 혹은 어디까지 신뢰할 수 있을 것이냐, 그걸 이야기한 겁니다. 위의 댓글에도 달았듯이, 비디오 판독이 잘못될 확률은, 풀어서 쓰면 심판진이 비디오 판독까지 동원했는데도 잘못된 판단을 내렸을 확률을 의미하는 거거든요. 물론... 비디오로 봐도 애매한, 어제 3루 페어/파울 논란 같은 경우는 심판의 판정대로 가면 되겠죠.
Rorschach
14/05/22 17:00
수정 아이콘
말씀하시고자 하는 바는 잘 이해했습니다.

그런데 말씀하신 것 처럼 [비디오 판독까지 동원했는데도 잘못된 판단을 내리는 경우] 정도의 상황이 잦아서 지금 비디오 판독에 대한 요구가 커지는 것은 아니거든요. 선수포함 관계자들 및 팬들이 '와 비디오 판독 정말 필요하네' 라는 생각이 들 정도의 상황은 비디오 판독의 시행만 제대로 되면 100% 제대로 된 판정을 내릴 수 있다고 봅니다.
쿨 그레이
14/05/22 17:54
수정 아이콘
동의합니다. 사실 우리가 보고 싶은 건 정확한 판정이고 깔끔한 경기진행이지 비디오 판독까지 동원했는데도 잘못된 판단을 내릴 만한 애매~한 타구에서의 정확도까지 요구하는 건 아니니까요. 그리고 그 정도로 애매한 건 보통 심판 재량으로 인정을 해 주죠. 어제 김 감독님이 선수단 철수시킨 건 아무래도 그간 하도 쌓인 게 있는 탓이었구요.
위원장
14/05/22 15:35
수정 아이콘
흠 근데 애초에 비디오판독이 틀리는 경우는 비디오로 봐도 알 수 없는 경우라 당연히 틀릴 가능성이 있죠. 지금 계산해서 나온 결과는 비디오판독 오심 확률이라기보다는 비디오 판독으로도 판단하기 어려운 상황이 나올 확률이라고 보는게 맞을 거 같은데요?
쿨 그레이
14/05/22 16:57
수정 아이콘
음, 이건 제가 생각을 못 했는데, 결국 판단하기 어려워도 판단을 "내려야" 하는 건 심판이잖아요. 그 심판이 비디오 판독을 통해서 얼마나 정확한 판단을 내릴 수 있을 것이냐... 이거를 논해 보고자 한 건데 제가 중간에 제대로 무리수를 두면서 글이 산으로 간 거죠.
내려올
14/05/22 15:37
수정 아이콘
우선 읽어달라고 하신 기사 링크가 기입이 안되어 있네요.
수정 부탁 드립니다.
쿨 그레이
14/05/22 16:58
수정 아이콘
a href 태그가 안 먹힌 것 같네요. 수정했습니다.
1일3똥
14/05/22 15:39
수정 아이콘
이런계산은 확률이 아니라 총량으로 봐야하는것 아닌가 싶네요
쿨 그레이
14/05/22 16:59
수정 아이콘
물론 총량이 중요하죠. 다만 앞으로 이러한 상황이 발생했을 때 어느 정도까지 문제가 될 만한 상황이 나올 수 있느냐에 대한 확률을 안다면, 거기에 대한 대처도 좀더 좋은 방향으로 나아갈 수 있지 않을까 싶어서 무리하게 계산을 해 본 겁니다.
14/05/22 15:42
수정 아이콘
논리적으로 쭉 잘 전개하시다가 '비디오 판독에 베이즈 정리를 도입해 보면?' 부터 무리한 가정이 보이는 것 같습니다.
비디오 판독의 정확성이 99%라는 가정은 현실성이 전혀 없습니다.
비디오 판독을 통해서도 [애매해서 확인을 못 하는 경우]는 있을 수 있지만, [명백한 오심]이 비디오 판독을 통해 나오는 경우가 있나요? 제가 알기로는 없습니다.
우리가 일반적으로 오심이라고 하는 건, [아주아주 애매한데 잘못 판정하는 경우]가 아니라 [명백하게 잘못 판정하는 경우]이죠. 이 기준에 따르면 비디오 판독의 정확성은 100%라고 봐야 할 겁니다.
쿨 그레이
14/05/22 17:01
수정 아이콘
저는 오심의 정의를, 가장 간단하게, 잘못 판정하는 경우라고 정의를 했습니다. [아주아주 애매한데 잘못 판정하는 경우까지 오심으로 친 거죠.] 어쨌든 잘못(誤) 판정한 것이니까요. 명백하게 잘못 판정하는 경우만 놓고 보면 당연히 비디오 판독이 백 프로 옳습니다.

다만 앞서 인정했듯이, 비디오 판독의 정확성을 논한 부분에서는 많은 무리수가 있었습니다.
14/05/22 15:42
수정 아이콘
이 글과 무관하게 어제 한화경기의 오심이라 주장하는 두가지 사안은 모두 사실은 심판의 매의눈급
아이러니 크크크크
쿨 그레이
14/05/22 17:02
수정 아이콘
엥, 어제 3루 그것도 파울이 아니라 페어였나요?
14/05/22 15:44
수정 아이콘
[비디오 판독이 잘못될 확률은 0%] 입니다.
왜냐면

[비디오 판독으로도 '판단이 안되는 경우' 일 경우엔.. '어떤 판단을 내리더라도 오심이 아니거든요' ]

즉, 비디오 판독으로도 구분할 수 없다면. 애초에 오심이라고 불리지 않기 때문에 어떤 결론을 내리더라도 오심으로 처리되지 않습니다.
그러니 비디오 판독이 잘못되서 나올 오심은, 현실에선 없다고 봐도 됩니다.
스웨트
14/05/22 15:49
수정 아이콘
222222222222
최근에 논란중인 오심논란이 진짜 애매하다.. 누구 손을 들어줄수 없다. 그래서 비디오 판정을 해야겠다. 라고 해서 하는게 아니죠.
왜냐면 그럴경우엔 오심 얘기도 안나와요. 그럴수도 있다. 뭐.. 이런식으로 가지.
오재원 너 천천히 뛰었자나, 넥센vs한화 그림자분신술 홈밟기 같은건 누가봐도 말도 안되는걸 심판이 어거지 쓰는거고 이런거 잡자는거죠.
14/05/22 15:55
수정 아이콘
바로 이거죠.
민머리요정
14/05/22 16:11
수정 아이콘
저도 이 의견에 동의합니다.
애초에 애매한 상황이 나왔기 때문에 요청하는 것이 비디오 판독이고,
비디오 판독을 해서 수차례 돌려봤음에도 4심이 판단할 수 없는 상황이라면,
그건 어떤 것도 오심이 아닌게 맞죠.
쿨 그레이
14/05/22 17:03
수정 아이콘
음... 비디오 판독이 잘못될 확률이 왜 0이 아니냐라고 생각을 했냐면, 어제 같은 케이스가 있어서였습니다. 9회초를 못 봐서 그렇긴 한데, 어제 제가 알기로는 방송카메라의 슬로우 화면상으로는 마치 마정길의 발이 떨어진 것처럼 보였고, 그래서 만일 이 상황에 대해서 비디오 판독이 들어갔다면 심판이 잘못 판단하고 세이프로 정정했을 가능성이 있다, 그렇다면 비디오 판독이 잘못될 확률은 0이 아니지 않느냐, 이거였습니다.

뭐, 어차피 99%에서 현실성 없기는 매한가지가 되어버렸습니다만.
Je ne sais quoi
14/05/22 15:48
수정 아이콘
재밋게 읽었습니다. 베이즈로 이런 걸 할 생각을 하시다니 ^^;
쿨 그레이
14/05/22 17:04
수정 아이콘
사실 쓰면서 아, 나는 역시 수학에 약하구나, 이 생각은 정말 많이 했습니다. 크크
걸스데이 덕후
14/05/22 15:49
수정 아이콘
[비디오 판독이 잘못될 확률은 1%]라는 건 추상적이다 못해 어리석어 보이네요

99%라고 말하면 높아보이지만 이런 종류 확률에서 99%는 대책없이 낮은 확률입니다.

예를 들어 어떤 회사의 컴퓨터를 사는 데 1%정도는 전원을 키면 폭발해서 교체해야 한다. 라고 한다면

얼마나 1%가 큰 확률인지 알 수 있죠
쿨 그레이
14/05/22 17:04
수정 아이콘
사실 1%가 어마어마하게 큰 확률이죠. 그래서 저도 아 이건 좀 아닌데? 이렇게 생각을 했습니다. 그래서 그 확률을 0.1%로 낮춰서 다시 계산을 했는데도 열다섯 번 중에 한 번쯤은 심판이 비디오 판독을 보는데도 잘못 판정할 수 있다, 이렇게 결론이 나와버린 겁니다. 1%로 가정한 것은 확실히 무리수였고, 어리석은 생각이었습니다.
감모여재
14/05/22 15:51
수정 아이콘
윗 분들 의견에 더하자면 계산과정에서도 비디오판정에 들어가는 경우의 특이성에 대한 고려가 없네요. 오심 가능성이 있는 경우에 한해 비디오 판독이 들어가므로 1.5퍼센트와 98.5퍼센트가 저기에 적용되어서는 안 될겁니다. 베이즈공식을 이런 식으로 사용하면 문제가 발생하죠. 전수조사가 아니니까요.
참고로 메이저리그의 비디오판독을 통한 번복률은 45.7%입니다. 즉, 비디오판독 신청이 들어간 판정은 적어도 40%정도 확률로 오심이라고 잡고 계산하셨어야 된다는거죠.
그렇다면
P(A) : 비디오판독 신청 된 판정이 실제 오심일 확률 40%
P(!A) : 오심이 아닐 확률 60%.
P(B) : 비디오 판독을 통해 오심으로 판정할 확률.
P(A|B) : 오심으로 판정했을 때 실제로 오심이 일어났을 확률.
P(B|A) : 오심이었고 비디오 판독을 했을 때 오심이었을 확률. 99.7%.
P(B|!A) : 오심이 아니었는데 비디오 판독을 하니까 오심일 확률. 0.3%.
로 계산을 해야 합니다. 그렇게 하면
= (0.4 * 0.997) / {(0.4 * 0.997) + (0.6 * 0.003)} = 99.5%가 됩니다. 비디오 판독에서도 오심이 발생할 수 있다는 글쓴분의 가정이 맞다고 해도 정확도는 이 정도 보장 된다는 겁니다.
azurespace
14/05/22 16:38
수정 아이콘
명쾌하네요. 메이저 사례를 가져올 생각을 못 했네요
쿨 그레이
14/05/22 17:06
수정 아이콘
이 점은 제가 전혀 생각을 못 했습니다. 마침 블로그에서도 같은 지적을 하신 분이 계시더군요. 음... 여기에 대해서는 좀더 제가 생각을 정리할 필요가 있을 것 같습니다. 그리고 정확도가 보장이 되면 도입하지 않을 이유가 전혀 없죠.
귀연태연
14/05/22 17:10
수정 아이콘
댓글을 달았는데 이미 여기 명쾌한 해답이 있었네요.
쿨 그레이
14/05/22 17:52
수정 아이콘
아랫 글에도 댓글을 달았는데, 제가 실수한 부분은 비디오판독과 오심의 여부를 독립으로 놓고 계산한 부분이었습니다. 그렇기 때문에 현격한 차이가 드러났던 것이겠죠. 쭉 한 번 돌고 나니까 이제서야 이해가 가네요. 좋은 지적 감사드립니다.
14/05/22 15:52
수정 아이콘
99프로에서 문제....
쿨 그레이
14/05/22 17:07
수정 아이콘
예. 그래서 파란색 부분은 독자분들께서 임의로 바꿀 수 있다, 값이 타당하지 못하다고 생각하신다면 바꾸셔도 좋다, 이렇게 이야기를 한 겁니다. 거듭 말하지만 확실히 무리수였구요.
14/05/22 15:52
수정 아이콘
'가장 중요한 것은 확률을 어떻게 잡느냐'인데
'이 중에서, 한 개 정도는 비디오 판독으로 따져보니까 워낙 애매해서 심판 재량에 맡길 수도 있는 걸 오심으로 판정했다, 이렇게 볼 수 있을 것 같아요.'
라고 되어버리면
결국 이글은
'비디오 판독에는 분명 허점이 있어요. 생각보다 그 허점은 커요'
'비디오 판독이 길이요 진리요 생명이요 뭐 이런 식으로 비디오 판독만 찬양하는 것은 지양해야 할 것 같아요.'라는
주장을 하기위한 글 밖에 안되는것 같네요
쿨 그레이
14/05/22 17:08
수정 아이콘
음, 역시 이 부분에 대한 태클이 많이 들어오네요. 어쩔 수 없는 논리상의 허점이었고, 그 때문에 사실 제가 이야기했던 것은 사상누각에 지나지 않게 되었습니다만... 결론에서 제가 중요한 걸 빼먹었네요. [제가 말한 것이 사실이라면]이라는 가정이죠. 그러면 조금 납득이 가실까 모르겠네요.
SugarRay
14/05/22 15:54
수정 아이콘
교수님에 의해 강제로 베이지안으로 개종(저는 세례라고 표현하고 싶습니다만...) 된 입장에서 재미있게 읽었습니다. 순간 제 졸업논문으로 쓰고 싶을 뻔 했네요. 문제가 되는 부분은 베이즈 정리를 쓸 때 심판이 잘 보고 비디오는 잘못 본 사건 A나 심판이 못 보고 비디오는 잘 본 사건 B가 동시에 존재할 수 있느냐인데 여기서 A가 없고 B는 있기 때문에 비디오는 심판을 온전히 포함하고 따라서 그렇게 식을 전개할 수 있는가가 될 텐데요.

모바일이라서 조건부를 /로 표시하면 P(X)=sigma all y P(X/y)*P(y) 식이 될 텐데요. 저기서 계산해보시면 어디가 문제되는지 결정될 것 같습니다.
쿨 그레이
14/05/22 17:09
수정 아이콘
이 부분도 제가 전혀 생각하지 못한 부분이네요. 고려해 봐야겠습니다.
겨울나기
14/05/22 16:00
수정 아이콘
삭제(벌점 2점), 표현을 주의해 주시기 바랍니다
포도씨
14/05/22 16:43
수정 아이콘
왜 이렇게 무례하게 댓글을 다시는지요?
정성껏 공들여 쓰신글인데 잘못된 부분이 있다해도 이런 댓글은 아니죠.
무슨 이런 글러먹은 댓글이 있나요? 하면 기분이 좋으실리가 없죠?
겨울나기
14/05/22 22:14
수정 아이콘
불행인지 다행인지 알 길은 없습니다만, 글러먹은 기분으로 쓴 글러먹은 댓글 맞으니 '무슨 이런 글러먹은 댓글이 있냐' 고 하셔도 좋아지거나 나빠질 기분같은 건 없네요.
쿨 그레이
14/05/22 17:09
수정 아이콘
뭐 사실 글러먹은 상수인 건 확실해서(...) 의미는 없어요. 다만 방법론을 제시할 수 있으면 그걸로 만족할 뿐입니다.
레몬커피
14/05/22 16:15
수정 아이콘
전혀....결론에 의미가 하나도 없는 거 같은데요
비디오 판독 도입의 근본적인 핀트를 아예 잘못 잡으신 듯..
쿨 그레이
14/05/22 17:12
수정 아이콘
음... 결론은 좀 괜히 달은 느낌이 되었네요.

비디오 판독을 도입하는 건, 물론, 오심을 줄이기 위해서죠. 그 점에 대해서 누구도 이의를 제기할 사람은 없어요. 그런데 도입을 한다면 그 비디오 판독을 통해서 내려진 심판의 판단을 얼마나 믿을 수 있느냐, 거기에 대한 이야기였거든요. 그리고 가정이 워낙 무리한 가정이었기 때문에 망한 계산이 되었지만 생각보다는 어 이거 비디오 판독이 부정확하잖아? 아 근데 이렇게 이야기가 되면 나는 비디오 판독을 도입하자고 주장하고 싶은데 명백하게 앞뒤가 안 맞는 글이 되어버려. 그러니까 좀더 사족을 달더라도 당위성을 좀더 설명해 보고 끝을 맺자... 이런 식으로 생각이 진행이 된 겁니다.

글의 핀트는... 뭐 시작부터 잘못 잡은 격이 되어서 할 말은 없습니다만, 베이즈 정리로 신뢰도를 검증해 보면 어떨까 하는 방향이었어요.
포도씨
14/05/22 16:20
수정 아이콘
뭔가 계산이 근본적으로 잘못된것이 아닌가 하는 생각입니다.
왜냐하면 오심이라는 것은 스트라이크 볼판정에서도 나오는 거거든요. 또 진루해있는 선수가 도루를 하거나 플라이볼에 태그업을 하거나 여튼 모든 상황에서 심판의 판정이 필요하기때문에 단순히 타석에서 인플레이상황만을 고려하는건 말도 안되는 기준이죠. 또한 오심이 발생할 확률을 미리 정하는것도 무리가 있습니다. 오심확률을 계산하려면 적어도 수십경기의 모든 인플레이 상황을 낱낱이 분석해서 표본을 내야겠죠.
야구에서 오심이라는것은 그 특성상 하루에도 수 십번 많으면 수 백번을 발생할수 있는겁니다. 괜히 선수, 감독들이 오심도 [경기의 일부다]라고 말하는게 아니에요. 오심을 '거의' 없애려면 심판이 존재하는 모든 스포츠에서 인간을 배제해야 할겁니다.
다만 사람이기때문에 실수할 수 있는 부분이되 경기의 승패에 [크게 영향을 끼칠 수 있는 오심]은 막아야 하겠다는게 공통된 의견이라 볼 수 있겠네요.
쿨 그레이
14/05/22 17:17
수정 아이콘
도루는 제가 까먹고 빼먹었고... 플라이볼에 태그업은 어쨌든 타격이 이루어진 후에 판정이 일어나는 것이니까, 결과적으로 지나치게 단순화된 감이 없잖아 있지만 계산하기 쉬운 인 플레이 상황을 먼저 고려해 보고 이걸 확장시켜 나가는 식으로 이야기를 해 보자, 이런 생각에서 일부러 인풀레이 타구 때마다 한 번의 판정이 내려진다고 가정하고 계산을 한 거에요. 무리수죠. 오컴의 면도날만 해도 가정이 적어야 좋은 가설인데 이건 가설에 조건이 한두 개가 들어가는 게 아니니까요. 그런 점에서, 근본적으로 계산이 잘못되었다는 지적은 타당합니다. 다만 방법론을 이런 식으로도 적용해 볼 수 있지 않을까 싶은 생각에 글을 적은 거죠.
14/05/22 16:24
수정 아이콘
이런쪽을 잘 몰라서 그런지 뭔가 이해가 안 되는 글입니다. 예를 들면 아래와 같은 건데 제가 뭘 잘못 생각하고 있는지, 그런 게 맞다면 누구라도 알려주시면 좋겠어요. 재미있어 보이는데 이해가 안 가서 진도가 안 나가고 있습니다.

[P(B|A) = 내가 감염되었고 검사 결과가 양성일 확률. 이게 0.98이겠죠.]
0.98은 검사 정확도를 의미하는 것이겠죠? 그런데 제가 아는 정확도라는 의미는, 검사했을 때 결과가 사실과 일치하느냐 아니냐의 의미라고 생각하는데 아닌가요? 양성이든 음성이든 판정이 나면 그 판정은 98% 정확하다. 즉, 양성으로 판정이 난 100명 중 98명은 (확률상)해당 병에 걸렸다. 라는 거라고 이해가 됩니다. 이렇게 이해를 하자면 ‘결과가 양성/음성인데 그게 사실일 확률 = 98%’가 되고 결과적으로 P(B|A)는 의미없는 수가 되버립니다. 전체 검사 결과 중 검사 결과가 양성일 확률을 의미하는 P(B)는 본문에 주어진 수치가 아니거든요.
그렇게 되면 결과적으로 구한 약 20%에 해당하는 숫자도 의미가 없어지는데....
포도씨
14/05/22 16:37
수정 아이콘
98%에 촛점을 맞추지 마시고 2%에 맞추시면 조금더 이해가 쉽습니다.
예를들어 100만명을 검사하면 2만명은 틀릴 수 있다거든요. 그런데 실제 발병률이 0.5%라면 간단히 계산해도 2만명중에 나머지 1만 5천명은 잘못된 검사결과를 받았다는 의미가 되죠.
14/05/22 16:39
수정 아이콘
98%가 정확도로 이해하신 것도 맞지만 양성으로 판정난 100명 중에 98명은 해당 병에 걸렸다는 틀렸습니다.

그냥 간단하게 정확도가 1% 밖에 안되는 검사 방법이고 병에 걸릴 확률이 100% 라고 하면 당연히 양성 판정된 100명은
다 병에 걸려 있었겠지만 배려님 말씀대로라면 100명 중 1명만 병에 걸렸다는 거겠죠?

양성으로 판정된 100명에는 (병에 걸렸지만 98% 정확도로 맞춘 사람 + 병에 안 걸렸지만 2% 확률로 틀린 사람) 이 같이
포함되어있기 때문에 위 계산 식에서도 병에 걸릴 확률 5% 가지고 같이 계산해서

양성으로 판정된 100명 중에는 19~20명이 실제로 병에 걸렸다는 결론이 나옵니다.
지구사랑
14/05/22 16:44
수정 아이콘
1000명 중에 실제로 병에 걸린 사람은 0.5%인 5명입니다. 즉, 995명의 정상 + 5명의 환자죠.
98%의 정확성을 가진 검사로 위의 대상을 검사하면 995*2%, 대략 20명은 정상인데도 오진으로 환자로 나오고, 5명의 환자는 (98%의 정확도이므로) 거의 그대로 환자로 나오겠죠.
따라서 (계산의 편의상 정수로 반올림해서 쓰면) 검사로 확인한 모든 환자의 수는 25명인데 실제 환자는 5명이므로,
검사상 양성자가 진짜 병에 걸려 있을 확률은 5/25 = 20%죠.

물론 본문은 비디오 판독이 틀렸을 가능성을 이야기하는데, 정당성이 결여된 가정이므로, 그 다음의 논리 전개가 의미가 없죠.

PS) 경우를 나누어 본다면 세 가지 정도가 됩니다.
1. 비디오 판정 결과 애매 -> 심판의 재량에 맡깁니다. 비디오로도 애매한 경우에 대해서 사람들이 분노하지는 않죠.
2. 비디오 판정이 옳고 심판 판정이 잘못된 경우 -> 바로 비디오 판정을 해야 하는 경우죠.
3. 심판 판정이 옳고 비디오 판정이 잘못된 경우 -> 본문은 이런 경우가 있다고 주장을 하는데, 이런 경우가 있다는 것이 증명이 안 됩니다. 앞에서 비디오 판정이 애매한 경우를 제외했으므로, 자신의 판정이 맞다고 정신 승리를 주장하는 심판이라면 모를까, 원론적으로 이런 경우는 배제할 수 있습니다. 물론 열악한 장비로 비디오 판정을 했더니 잘못된 판정이더라... 라는 경우가 없는 것은 아니겠습니다만, 그것은 (일단은 좋은 장비를 써야 하는 것이고, 적어도) 1.의 애매한 경우에 가까워 사람들이 그렇게까지 분노하지는 않겠죠.
14/05/22 17:16
수정 아이콘
어렵네요. 어려워. 이해가 갈 것 같기도 하고 아니기도 하고....
그래도 도움이 많이 되었습니다. 좀 더 고민해볼께요. 감사합니다.
포토씨님 Dixit님께도 감사드립니다.
쿨 그레이
14/05/22 17:20
수정 아이콘
음, 저는 경우를 두 가지로 나눈 겁니다.

비디오 판정이 들어간다는 것은, 뭔가 오심 시비가 붙었으니까 비디오 판정이 들어갔겠죠? 이 판정 결과 뭐 명백한 오심이라면 되돌리면 되고, 명백한 심판 승이라면 그냥 속개하면 됩니다. 문제는, 이 판정 결과가 애매할 때 발생하는 거죠. 판정 결과가 애매할 때 실제로는 세이프였는데 심판이 아웃을 선언한다면? 판정 결과가 애매할 때 실제로는 파울타구였는데 심판이 페어볼을 선언한다면? 그렇다면 비디오 판독을 도입해도 어느 정도 오류가 나는 건 피할 수 없지 않을까? 이런 식으로 생각하고 논지를 전개한 겁니다.

정리하면, 2와 3은 확실하니 그렇다치고, 1의 경우 시비가 생길 수 있기 때문에, 1의 경우에 비디오 판독을 도입한다면 과연 얼마나 많은 오심이 비디오 판독을 통해서 판별될지를 본 겁니다.
Siriuslee
14/05/22 16:29
수정 아이콘
어제 넥센 화나 경기의 애매한 판정 2개는
오심이라고 하지 않습니다. 그냥 화나의 판정 불만이 있었다 정도입니다.

그 정도의 접전 애매한 상황은 대부분 심판 판정쪽에 손을 들어줍니다.

그런데 어제 화나 벤치가 폭발한것은 2일전 오심으로 인한 심판진에 대한 불신 표시였다고 볼 수 있지요.
(거기에 대항하는 심판진의 [감독 퇴장] 으로 더욱더 감정이 격해진것이고..)

비디오판정이 진리는 아니라는 것은 잘 알고 있습니다만,
현재의 한번 내려진 판정은 [결코 번복이 되지 않는 상황]
비디오판정 도입으로 인해서 경기당 1~2번은 [판정이 번복 될 수 있는 기회]를 얻는 건 매우 크다고 볼 수 있습니다.

MLB에서도 퍼팩트게임을 오심으로 날린 경기를 계기로 비디오 판정의 도입논의가 진행되었고, 올해부터 확대 시행되고 있는것이지요.
쿨 그레이
14/05/22 17:21
수정 아이콘
네. 이 점 아주 중요하죠. 판정이 번복될 수 있는 기회를 얻는 것은 비디오 판독 도입의 또다른 장점입니다. 저는 글에도 적어놓았지만 확률이 저렇게 나와도 비디오 판독을 도입해야 한다는 입장인 것이구요.
azurespace
14/05/22 16:32
수정 아이콘
쓰느라 고생 많이 하셨을 것 같은데 죄송하지만 태클 좀 걸게요.

P(A) : 오심이 일어날 확률. 1.5%.
P(!A) : 오심이 일어나지 않을 확률. 98.5%.
P(B) : 비디오 판독을 통해 오심으로 판정할 확률.
P(A|B) : 오심으로 판정했을 때 실제로 오심이 일어났을 확률.
P(B|A) : 오심이었고 비디오 판독을 했을 때 오심이었을 확률. 99%.
P(B|!A) : 오심이 아니었는데 비디오 판독을 하니까 오심일 확률. 1%.

이거 다 검은색으로 쓰셨는데, 글을 읽어 보니까 전부 하늘색으로 표기해야 할 수치들입니다.

애초에 오심논란이 벌어지는 건 대부분의 경우 비디오 카메라를 돌려봐도 잘 모르겠다 하는 경우가 아니라,
누가 봐도 명백한 아웃인데 세이프로 판정하는 등의 상황에 발생합니다.
그리고 이런 경우 비디오 판독의 정확성은 100%로 봐야 할 겁니다.

그렇기 때문에 '오심논란이 매일 발생했으니 경기당 1.5개로 잡으신' P(A)는 너무 낮습니다. 논란은 일어나지 않았지만 실제로는 오심인 경우도 포함해야 할 것이고요.

그리고 비디오 판정이란 게 모든 판정에 적용되는 게 아니라, 오심으로 의심되는 판정 발생 시에 팀의 요청을 받아 적용되는 것임을 감안하면 A,B 외에 다른 확률은 하나 더 도입해야겠네요.
쿨 그레이
14/05/22 17:24
수정 아이콘
아... 제가 색 태그를 빼먹었나봅니다.

제가 판단하고 싶었던 것은, 비디오 판단으로도 좀처럼 판단하기 어려운 애매한 결과가 나왔을 때(+ 비디오로 보니까 이상한데 심판이 정확했다 - 어제 9회초 고동진 아웃 선언 같은 것이라면 이런 것도 비디오 판독을 통한 오심에 넣을 수 있겠다 싶어서) 심판진의 판단이 얼마나 정확할 것인가를 중점적으로 계산을 해 보고자 무리하게 수를 둔 거죠.

글에서도 말씀드렸지만, 저는 그 확률을 잡을 때 제 나름대로의 생각을 가지고 판단을 하겠지만 그 부분에 있어서는 자유롭게 고무줄 늘이듯이 독자분께서 조절할 수 있을 것이다, 이렇게 이야기를 했죠. 그렇게 해서 얻은 결과가 독자 여러분이 납득할 만한 수준인가는 그 때 가서 따져보자, 방법론은 이렇다, 이런 이야기를 하고 싶었던 거구요.
iAndroid
14/05/22 16:51
수정 아이콘
왜 저렇게 확률이 커지는가는 아래의 블로그 링크를 참조하면 될 것 같습니다.
http://hanmaths.tistory.com/25

얼핏 보면 본문의 감염 예와 똑같은 내용을 설명하고 있는 듯 보입니다. 근데 중요한 차이가 하나 있는데요.
링크는 '어떤 사람이 병원에 가서 테스트를 받았는데' 입니다.
반면 본문에서는 (좀 요약을 해서 쓰자면) '증상이 나타나서 병원에 가서 테스트를 받았는데' 입니다.
링크와 본문의 큰 차이가 뭐냐면, 전자는 증상 그런거 없이 [무조건] 병원에 찾아가서 테스트를 받는 겁니다.
하지만 본문의 설명은 [증상을 확인했다]는 큰 전제조건이 있죠.

본문의 비디오 판독 오심 확률 계산도 마찬가지라고 봅니다.
본문의 베이즈 정리 설명은 오심인지 아닌지 그런거 없이 무조건 비디오 판독으로 올리는 전제조건 하에서 계산한 것이라고 보여지는데요.
그런데 실제로는 한번 걸러집니다. 누가 봐도 오심이 아닐 것 같은 판정을 비디오 판독으로 올리진 않죠.
이 점을 고려하지 않은 것 때문에 본문의 확률이 급격히 떨어지는 것이라고 보여집니다.
쿨 그레이
14/05/22 17:28
수정 아이콘
아, 이 점은 제가 놓친 부분입니다. 좋은 지적 감사합니다.
많은 분들이 위에서 모집단을 잘못 설정한 거 아니냐라고 하신 게 이 의견과 일맥상통하는 것 같군요.
쿨 그레이
14/05/22 17:47
수정 아이콘
음, 다시 한 번 정리해 볼게요. 제가 그 비디오 판독이라고 하는 거 있잖아요. 그건 사실 제가 글 쓰면서 혼동했던 부분이긴 한데, 중계카메라의 그것과 똑같은 것이거든요. 중계는 하면서 늘 리플레이를 다시 보여주지 않습니까? 타격이 어디로 가서 어떻게 블라블라... 하다가 엇 이건 심판이 판정을 잘못 내렸는데! 싶은 게 있으면 귀신같이 달려들겠죠. 근데 그 정도는 현장에서도 분명히 오심여부로 오고 갈 것이고, 그렇다면 제가 주장한 것도 아주 일고의 가치도 없는 것은 아니지 않을까요? 요컨대, 누가 봐도 오심이 아닐 것 같은 판정을 비디오 판독으로 올리진 않지만, 어쨌든 심판은 판정을 하고, 거기에 대해서는 비디오 카메라 역시 옳은 판정을 한다는 겁니다. 일단 무조건 타격의 결과는 보고(본문에서 타격으로 제한했으니 타격으로 생각합시다), 거기에 대해서 심판은 무조건 판단을 내려야 하고, 중계차 역시 비디오를 보면서 판단을 내리는 거죠.

이렇게 놓고 보니 제 실수가 보이는데, 심판의 판독과 비디오의 판독을 독립적인 사건으로 놓고 보았기 때문에 저런 결과가 일어나는 것 같군요. 말씀하시고자 한 내용이 혹시 이 내용인가요?
원시제
14/05/22 16:51
수정 아이콘
비디오판독은 심판의 잘못된 판정을 바로잡을 기회를 주는겁니다.
그리고, 무엇보다 심판의 절대적 권한을 견제하는 방법이라는 측면에서도 매우 긍정적이지요.

글쓴 분의 의도는 아니겠지만
이런 잘못된 수치화가 비디오판독의 무용성을 주장하는 근거로 작용하지는 않을까 걱정되네요.
쿨 그레이
14/05/22 17:29
수정 아이콘
저도 그래서 무리해서 한 계산 결과라 무리해서 사족을 단 거죠.

비디오판독을 도입하지 말자는 게 아니라, 비디오 판독을 도입했을 때 잠재적으로 생길 분명한 오심의 가능성 - 말이 또 한 번 이상해지는데, 애매한 경우에는 심판 재량이라지만 그게 정말 심판이 정확하게 판정을 내리는 것일까 하는 - 그런 의문으로부터 글은 출발합니다. 그리고 각종 무리수를 써 가면서 계산을 던진 결과가 저렇게 나온 것일 뿐이죠.
쿨 그레이
14/05/22 16:52
수정 아이콘
음, 예상대로 많은 분들이 지적을 해 주시고 계시네요.

먼저 접근 방향에 대한 변을 좀 달자면, 어제 경기는 아마도 비디오 판독으로 들어가면 정당한 아웃을 오심으로 판정하지 않았을까? -> 그렇다면 비디오 판독이라는 게 믿을 만한 것이긴 할까? -> 이걸 확률론에 적용을 시켜보면 어떨까? 이런 식으로 생각이 진행된 겁니다. 그래서 비디오 판독을 100% 신뢰하기는 어렵지 않을까라는 게 발단이었구요.

99%에 대한 변을 조금 달자면, 사실 쓰면서도 아 이건 의미없는 값인 것 같다, 그런데 이걸 내가 미리 의미없는 값이기 때문에 다른 사람들이 내가 세운 식에 숫자를 바꿔서 넣어보도록 유도해 보는 건 어떨까?라는 생각에서 버리지 않고 들고 갔습니다. 결과적으로 역효과가 났죠.

한 분 한 분 코멘트에 대해 답변을 드리기 전에 아무래도 이 점에 대해서는 이야기를 해야 할 것 같아서 미리 달아둡니다.
원시제
14/05/22 17:10
수정 아이콘
"어제 경기는 아마도 비디오 판독으로 들어가면 정당한 아웃을 오심으로 판정하지 않았을까?"

비디오 판독에서 오심판정이 났는데; 정당한 아웃이라는건 무슨 의미인지 잘 모르겠습니다.
비디오 판독을 통해 느린 장면으로 돌려 보았을때 심판이 세잎으로 판정할만한 장면이
실시간으로 현장에서 심판이 판정하면 아웃이 되고, 그 아웃이 정당하다는건가요?
쿨 그레이
14/05/22 17:14
수정 아이콘
제 말은, 그 9회초 그 사건, 그러니까 고동진이었나요? 그걸 말한 겁니다. 아마도 비디오 판독을 들어갔다면, 음, 심판진이 초슬로우 비디오 카메라를 볼 수 있을 확률이 적으니까, 아마 방송장비와 비슷하게 영상이 나갔을 거고, 그렇다면 아웃이 아니라 세이프로 잘못 판정할 가능성이 있지 않았을까? 이런 생각이었던 겁니다. 그렇다면 비디오 판독을 통해서 내려지는 판정에도 심판이 잘못 판단해서 잘못된 판정을 내릴 가능성 또한 얼마든지 존재하는 것 아닐까? 하는 생각이었던 거죠. 제가 설명이 영 짧아서, 이해가 가시려나 모르겠네요.
원시제
14/05/22 17:21
수정 아이콘
뭐랄까... '고동진의 아웃판정은 오심이 아니었다' 라는 기사를 제시하시면서, 고동진의 아웃판정은 오심이 아니었음을 전제로
글을 전개하셨는데,

그 기사에서 고동진의 아웃판정은 오심이 아니었음을 입증한 자료는 다름아닌 '비디오판독' 입니다;;;
그러니, 쿨 그레이님의 논리대로라면
[고동진의 아웃판정은 비디오판독을 통해 보니 오심이 아니었다.
그런데 아마도 비디오 판독을 들어갔다면 세이프로 잘못 판정할 가능성이 있지 않았을까?]

가 되어버립니다. 그게 좀 이상하다는겁니다.
쿨 그레이
14/05/22 17:26
수정 아이콘
아...

어제 중계화면상으로는 아웃이 아니라 세이프였던 것처럼 보였죠. 유머게시판에 스크린 샷으로 올라왔던 것에도 그렇게 보였구요. 심판이 그걸 가지고 판단을 했으면, 잘못된 판단을 내렸을 것이구요.

음... 놓고 보니 제가 말을 좀 이상하게 했네요. 비디오 둘을 지금 구분해서 생각할 필요가 있는데, 판정에 이용되는 일반적인 중계카메라 수준의 비디오와, 실제로 진짜 이게 오심이었는지 아니었는지에 동원된 초슬로우 비디오 카메라를 구분해서 생각하시면 조금 나을 것 같습니다. 심판진이 초슬로우 비디오 카메라를 일일이 화면 다 찍어 가면서 볼 리는 없고, 그렇다면 아마 중계화면 카메라만 놓고 오심여부를 판단하지 않았을까? 그렇다면 심판은 초슬로우 카메라까지 동원했으면 분명히 아웃으로 판정했겠지만 만일 실제 비디오판독에 들어갔을 경우 조금이라도 잘못된 판단을 내릴 가능성이 있지 않았을까? 이런 가정이 깔려 있는 것이죠.
원시제
14/05/22 17:32
수정 아이콘
지금 비디오 판독이 활성화된 메이저리그를 기준으로 생각해보자면,

[구장마다 12대의 카메라를 같은 자리에 배치해 영상 시스템을 구축한 뒤 본부에서 4명의 심판조가 판독한 결과를 현장 심판진에게 전달]합니다. 링크해주신 기사의 동영상 중의 사진들이 초슬로우 비디오 카메라인지는 잘 모르겠습니다만,
비디오 판독이 공식적으로 시작된다면, 당연히 영상기기는 확보하는걸 전제하겠지요. 실제로 비디오 판독 도입의 어려움을
이야기하는 원인 중에는 설비의 문제도 상당수 있습니다.
쿨 그레이
14/05/22 17:34
수정 아이콘
음, 그렇죠. 영상기기를 확보하는 것은 참으로 어려운 문제니까요. 이 설비를 통해서 판단하는 것조차 오심이 있어서는 곤란하지 않겠느냐, 그런 생각이 발단이 되었던 거구요.
귀연태연
14/05/22 17:04
수정 아이콘
결국 20퍼센트라는 건 통계적으로 전수 검사를 해서 양성 반응이 나온 사람중에 실제 병에 걸린 사람이 2/10 이라는 거죠. 이 같은 경우에도 검사 정확도는 98%그대로 정확한 겁니다. 베이즈 정리는 획률보다는 통계의 의미에서 봐야합니다. 마찬가지로 비디오 판독도 적어놓으신 식대로라면 전체 판정을 대상으로 오심이 아닌데 비디오 판독의 실수로 오심인 것도 표본에 들어가는 것으로 계산하시니 저런 결과가 나오죠. 하지만 현실은 누가봐도 오심이 아닌 건 비디오 판독 자체를 할리가 없으니 표본에 들어가선 안되죠. 위의 병 검사와 마찬가지 상황이죠.
쿨 그레이
14/05/22 17:30
수정 아이콘
음, 그러면, 확률을 다시 잡아보면 오심시비가 일어난 것들 중 실제로 오심이었을 확률로 계산했어야 했겠군요. 윗분들이 말씀하셨지만 이 경우 가장 정확한 확률값은 메이저리그의 확률이 되었을 것이구요.
14/05/22 17:23
수정 아이콘
Gold standard를 따로 잡을 수 없는 문제가 있긴 있군요. 이거 자체가 비디오 판독 이상의 기법이 개발되지 않는 바에야.
지구사랑
14/05/22 17:26
수정 아이콘
사람들이 원하는 것은 명백한 오심을 번복하자는 것이지, 애매한 경우의 심판 재량을 거부하는 것은 아니리라고 생각합니다.
쿨 그레이
14/05/22 17:31
수정 아이콘
맞는 말씀입니다. 그리고 사실 그렇기 때문에 비디오 판독은 도입되어야 하는 거구요.
쿨 그레이
14/05/22 17:36
수정 아이콘
댓글을 쭉 달고 나니까, 역시 많은 분들이 제 논리상의 허점을 지적해 주고 계시네요. 좋은 공부가 되었습니다. 다음에는 좀더 세심하게 이야기를 해 볼 수도 있을 것 같네요. 사실 PGR에 글을 올렸을 때 이 부분을 노렸는데, 예상대로 많은 분들 덕분에 제가 생각하지 못했던 허점이나 제가 저지른 실수에 대해서 제가 다시 한 번 생각해 볼 수 있는 기회를 갖게 되어서 큰 기쁨이네요.
14/05/22 17:36
수정 아이콘
정말 진지를 깊게 먹자면 비디오카메라를 통한 오심 검증이라는 시행의 특성상 '100번 중 1번 틀린다' 같은 이야기는 귀연태연님 말씀처럼 통계의 의미에서 봐야지 확률의 의미에서 볼 수 없을 겁니다. 1%가 크냐 작냐를 떠나서 베이즈 공식에 대입할 수 없다는 거지요.
쿨 그레이
14/05/22 17:41
수정 아이콘
아니 뭐 더 드셔도 됩니다...는 농담이구요.

음, 그렇죠. 통계의 의미로 봐야 맞죠. "이 판정은 50%의 확률로 틀렸어! 그러니까 나는 이 판정을 믿을 수 없어!"라고 주장한다면 그것이야말로 어리석은 일이 될 것입니다. "수만 번의 판정이 일어나는 야구판에서 실제로 비디오판독이 도입되었을 때 그 비디오 판독이 정녕 틀렸을 경우는 얼마나 될 것인가?" 쪽으로 접근하는 게 더 좋은 접근이 되겠죠. 하지만 그럼에도 굳이, 굳이 확률이야기를 도입을 한 것은, 앞으로 일어날 법한 일을 일을 얼마나 효과적으로 잘 막아주느냐, 거기에 대한 고려를 해야 비디오 판독을 도입하는 이점을 수치상으로 계량한다고 했을 때(계량이 되는지에 대한 문제는 별개로) 도움이 되지 않을까, 그런 관점에서 시작해 본 겁니다.
14/05/22 17:59
수정 아이콘
우리가 서로 같은 얘기를 하고 있는 건 아닐까 하는 불안감도 들지만, 일단 제 얘기가 완전히 전달되지 않은 것 같아 첨언해봅니다. ㅠ.ㅠ 뭐 저 역시 통계를 전공하고 있고 통계를 상당히 좋아하기 때문에 PGR에서 통계 얘기 할 기회가 오니까 기쁘네요 흐흐.

제가 '비디오카메라를 통한 오심 검증은 베이즈 공식에 대입할 수 없다'라고 한 것은 그 결과가 무의미하거나 실제 값보다 크게 나타나기 때문이라기보다는 시행의 특성 상 공식을 통해 결과를 얻는 것이 불가능하다고 생각하기 때문이었습니다.

오심이 아닐 확률 98.5% * 비디오카메라가 잘못된 관측을 행할 확률 1% = 0.985 * 0.01이라는 계산결과가 깔끔하게 나올 수가 없다는 거지요. 예컨대, 한 시즌의 프로야구 경기가 전부 아주 깔끔하게 진행된다고 생각해봅시다. 플라이볼은 깔끔하게 잡히고, 파울은 딱 봐도 파울이며 베이스에서의 접전 사태는 단 한번도 일어나지 않은 무난한 경기가 시즌 내내 일어났습니다. 이렇다면 이전의 통계와는 무관하게 비디오카메라는 단 한 번도 잘못된 관측을 행하지 않을 것입니다.(물론 심판도요. 라고 말씀드리고는 싶었지만, 최근엔 정말로 말도 안되는 판정들이 일어나서 그렇게 말하지는 못하겠네요. ㅠㅠ) 비디오카메라의 관측이 부정확하다면, 그것은 상황이 애매할 때뿐일 것입니다. 결국 전체 표본공간을 '심판이 오심을 했다/안했다'로 나누기에는 무리가 있다는 것이 제가 드리고 싶은 말인데, 퇴근시간이라서 미처 생각못한 부분이나 오류가 생긴 부분은 집에 가서 수정하도록 하겠습니다 ㅠ.ㅠ
쿨 그레이
14/05/22 18:04
수정 아이콘
결국에는 표본공간을 어떻게 잡느냐에 대한 문제가 되겠죠. 이에 대한 것은 많은 분들이 지적을 해 주신 사항이구요. 같은 이야기를 한 건 아닌 것 같습니다.

심판의 판정이 옳다/심판의 판정이 그르다/애매~하다 이렇게 셋으로 나눠야 하느냐 딱 옳다/그르다 둘로 나눠야 하느냐에 대한 논쟁은 얼마든지 일어날 가능성이 있습니다. 이 점에 대해서는 윗분이 지적을 해 주셨죠. 저는 그 판정이 옳다/그르다 딱 둘로 나눴구요. 애매한 경우에는, 심판의 재량이고, 이 경우에는 [일반적으로 오심이라고 하지는 않습니다.] 하지만 제 글에서 제가 정의한 오심은 [애매한 경우를 모두 포함해서 심판의 판정이 잘못 내려진 경우를 모두 오심이라고 하기 때문에] 일반적인 오심에 대한 인식과는 다분히 차이가 있고, 이에 따라서 졸지에 서로 이야기하고자 하는 바가 명확하게 전달되지 못한 것으로 보여집니다. 어디까지나 이건 제 실책입니다. 정의를 정확하게 딱딱 내리지 않고 제가 글을 굉장히 모호하게 쓴 탓이죠.

게다가 저는 비디오카메라 판독을 중계차의 판독과 동일시하는 실수까지 저지르고 있었습니다. 바로 그렇기 때문에 비디오카메라 판독을 심판의 판정과 독립적인 사건으로 놓았던 것이죠.
쭈구리
14/05/22 17:47
수정 아이콘
취소선과 말줄임표((...))를 자주 쓰시는 걸로 봐서 리그베다 위키의 편집에도 자주 참여하고 계시지 않을까 싶네요. 피지알에서 재미를 위해 드립을 치고 취소선 긋는 건 상관없는데 리그베다 위키에서 이게 너무 남발된 문서를 보면 글을 읽는데 방해가 되더군요. 아무리 재미를 위한 위키라지만 '백괴사전'처럼 드립으로 재미를 추구하는 위키는 아니죠.

특히 말줄임표는 아예 없는게 낫다는 생각이 들어요. 대부분 사족으로 느껴질 뿐더러 사전이라는 매체에서 드러나지 말아야 할 필자의 감정상태(소심함이랄지 멋적음이랄지)를 독자에게 자꾸 전달하려는 것 같아서 좀 짜증이 나더군요. 쿨 그레이님에게 해야할 지적은 아닌데 혹시 리그베다 위키의 편집에 관여하고 계시다면 글을 쓰실 때 한 번쯤은 생각해 주십사하고 말씀드려 봅니다.
쿨 그레이
14/05/22 17:50
수정 아이콘
저는 보통 말줄임표를 쓰는 상황이, 문자 그대로 헐 하고 어이없거나 기가 찬 생각인 경우에 많이 쓰는데... 이 글을 면면히 되짚어봐야 할 필요성은 있겠네요. 어쨌든 리그베다 위키의 편집에 이래저래 관여는 꽤 했습니다. 사실 사족 맞죠. 소심한 감정상태를 전달하려는 의도로 말줄임표를 쓴다는 것의 예시가 잘 떠오르지 않아서 제가 함부로 왈가왈부할 수는 없겠지만, 이 점에 대해서는 아마 리그베다 위키의 위키페어리들 역시 어느 정도는 알고 계실 겁니다.

물론, 저도 철저하게 진지하게 나간다면 말줄임표 같은 건 가능한 한 자제합니다.
쿨 그레이
14/05/22 18:12
수정 아이콘
어, 정리를 한 번 해 볼게요. 일단 여러 분들께서 지적하신 문제를 크게 보면, 다음과 같이 크게 두 가지로 볼 수 있겠네요.

1. 모사건을 잘못 잡은 거 아니냐.
2. 상수를 잘못 잡은 거 아니냐.

1.
이 점에 있어서는 아무래도 제가 잘못 생각한 것 같습니다. 댓글을 일일이 달고 나니까 제가 어떤 식으로 어떤 가정을 통해서 논지를 전개했는지를 제 스스로 좀더 명확하게 알 수 있었습니다. 저는 오심의 정의를 이렇게 내렸습니다. [오심이란, 심판이 어떤 플레이에 대해서 잘못된 판단을 내리면 그것이 오심이다.] 즉, 애매한 타구에서 심판이 잘못 판단을 내리는 것까지 오심으로 쳤습니다. 반면 야구를 보통 볼 때 애매한 판정은 오심이라고 하는 일은 드물죠. 그래도 여기까지는 다들 납득하실 수 있으리라 생각합니다.

그런데, 저는 비디오 판독의 정의를 이렇게 내렸습니다. [매 타구마다 방송중계를 통해서 화면으로 플레이가 나갈 때 그 플레이를 검증해서 얘가 제대로 된 판정이면 1이요 아니면 0이다.] 이런 생각으로 글을 전개하다 보니, 자동으로 심판의 판정과 비디오 판독의 정의가 졸지에 독립시행이 되어버렸죠. 이게 제가 저지른 가장 큰 실수입니다. 여러 분들께서 지적하신 사항이 바로 이 사항입니다. 실제 비디오 판독이라는 것의 정의가 다르기 때문에, 둘이 독립시행이라고 보기는 어렵다, 이거죠. 독립시행이 아니라면, 모집단이 바뀌어야 하는 큰 문제가 발생합니다.

2.
이 점에 대해서는 제가 본문에도 적었지만, 사실 글을 쓰면서 앞으로 의미없는 데이터가 분명히 나오겠구나 하는 예감은 들었습니다. 그렇기 때문에 의미없는 상수가 튀어나온 것이고, 또 그렇기 때문에 잘못된 계산결과를 얻었다, 그렇게 이야기를 할 수 있을 것 같아요. 그런데 굳이, 굳이 이런 잘못된 상수를 동원해 가면서 계산을 벌인 것은, 그런 식으로라도 비디오 판독의 신뢰도에 대한 접근을 해 볼 수 있다면 좋지 않을까, 하는 방법론에 가까운 이야기를 하고자 굳이 말도 안 되는 이야기인 걸 느껴 가면서도 계산을 했던 겁니다. 물론, 결론 때문에 결과적으로 이건 글 전체를 흔들어버리는 치명적인 마이너스 요소로 되돌아왔죠.

이 정도라면 어느 정도 정리가 되지 않을까 싶네요.
14/05/22 19:51
수정 아이콘
저는 조금 다르게 생각합니다. 그러니까 쿨그레이님은 심판의 판정에 대한 정의를 실제의 물리적 상황과 정합한지 여부를 기준으로 두셨지만, 일반적으로 생각할 때 그것보다는 관계자들의 심리를 만족시킬 수 있는 효용에 가깝지 않나 합니다. 즉, 오심은 불복을 할 만한 상황이 발생하는 것이죠. 반면에 사람의 인지 능력에 대한 한계를 인정하고 애매한 경계 영역에 대해서는 심판의 재량권을 인정하는 경향도 존재합니다. 이러한 성향이 잘 드러나는 것이 스트라이크와 볼을 가르는 존입니다. 따라서, 어떠한 확률적 모델로 계산을 하려면 이러한 애매한 경계 영역을 어떠한 기준을 사용하여 구분하는 작업이 선행되야 한다고 보는데, 오심의 상황과 심판의 재량권을 인정하는 애매한 상황을 두부 자르듯이 나누는 것은 솔직히 힘들다고 봅니다. 또한, 모든 상황이 동일한 중요도를 가지고 있지 않습니다. 야구에서 득점권인 상황과 그렇지 않은 상황은 다르기 때문입니다. 예를 들어, 주자가 없는 상황에서 평범한 내야 땅볼로 1루에서 아웃이 확실하게 됐는가를 따지는 상황과 2사 만루에서 홈 경합에서 세이프 판정 여부를 위에서 말한 효용 가치를 기준으로 했을 때 동일선으로 놓고 계산할 수는 없겠죠.
쿨 그레이
14/05/22 21:08
수정 아이콘
바로 이 점이, 많은 분들이 또 지적을 해 주신 점입니다. 그래서 케이스를 둘로 나눌 것이 아니라 셋으로 나누어야 하지 않겠냐고들 이야기를 해 주셨는데, 상당히 재미있는 생각을 떠올려 주셨네요. 상황에 대한 가중치라는 것이 세이버메트릭스라는 것에 또 어느 정도 영향을 준다는 점을 가정해 보면, 이 팩터에 대한 고려 또한 충분히 가치가 있다는 생각이 듭니다.
2막3장
14/05/23 00:27
수정 아이콘
글쓴님은 베이즈 정리(및 재미있는 점)를 소개하고자 야구의 오심을 소재로 쓰신 것 같은데,
여러여러 댓글 단 님들께서 꽤 많이 가치판단을 하고서 글을 읽으시는 것 같은 느낌이 드네요.(이것도 제 가치판단일지도..)
제 전공에 툭하면 베이즈 룰을 중간중간에 끼워넣는 논문들이 있어서 (거의 뭐 약방의 감초.. 특히 서양에 사는 양반들.. 좀!!) 이해하느라 애먹은 기억이 많은데,
아무튼 재미있게 쓰셨네요.
쿨 그레이
14/05/23 01:04
수정 아이콘
중간쯤 됩니다. 베이즈 정리를 통해 판정이 제대로 이루어질 확률을 계산해 보자는 것이 이 글의 목적이었고, 그런 패러다임의 제시와 피지알러 분들의 많은 논의 끝에 결론을 얻는 소기의 목적까지 달성한 거죠. 동시에 제가 가진 생각의 오류도 고칠 기회를 얻었구요.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
54876 [일반] "오늘 밤 수많은 수험생 가정이 눈물과 좌절, 고통에 잠길 수밖에 없다는 것" [54] 콩콩지8883 14/11/13 8883 0
54820 [일반] 코스프레계의 도적 창궐 [130] 연의하늘11923 14/11/11 11923 2
54367 [일반] HOT가 작곡편곡을 할수있었던 이유는 현진영덕분이죠. [47] 카랑카13844 14/10/18 13844 3
54350 [일반] 안다고 생각하는 단어도 다시 보자... [24] Neandertal5138 14/10/17 5138 1
54177 [일반] "사용료 내놔" MS-한컴 무차별 소송에 중소기업 '날벼락' [92] 요정 칼괴기13591 14/10/07 13591 2
54104 [일반] [세월호] 박민규 - 눈먼 자들의 국가 [53] 쌈등마잉8573 14/10/02 8573 19
54083 [일반] [일본방송] 일본에서 방영된 세월호 침몰 관련 방송 [13] BetterThanYesterday4972 14/10/01 4972 0
54006 [일반] 스티븐 킹의 'The Long Walk' [14] Snow Child6800 14/09/27 6800 1
53961 [일반] 삼성의 음원서비스. 밀크가 한국에 오픈했습니다. [90] Leeka9178 14/09/25 9178 0
53945 [일반] 과연 나는 하루에 몇 개의 유튜브 영상을 볼까? [20] 뀨뀨7331 14/09/23 7331 0
53809 [일반] 이 만화가 굉장해 2006~2014년 [56] Duvet13212 14/09/16 13212 1
53109 [일반] 들어도 들어도 질리지 않는 (일본)노래들 [119] 하늘깃10174 14/08/07 10174 4
53090 [일반] 일본에서 저작권 침해 관련 대박 사건이 터졌습니다. [53] ㈜스틸야드11676 14/08/06 11676 1
52909 [일반] 미드 자막제작자 처벌관련글 [175] 하정우12344 14/07/25 12344 1
52856 [일반] 내가 좋아하는 김민종 노래 Best 10 [18] 리콜한방19098 14/07/22 19098 2
51883 [일반] [야구/확률] 어제 한화 대 넥센 9회초 오심 관련 : 0.1%와 베이즈 정리 [83] 쿨 그레이8660 14/05/22 8660 2
51296 [일반] 진도에서 케밥을 나눠주던 터키인들이 쫓겨났다고 합니다. [235] Realise12328 14/04/24 12328 1
51248 [일반] SM은 정말로 노예계약을 강요한 기획사인가? [51] 카랑카13865 14/04/22 13865 11
50898 [일반] 표절과 오마쥬와 패러디의 차이는..? [27] Duvet7932 14/04/05 7932 0
50876 [일반] [연예] 신대철이 페이스북에 쓴 우리나라 음악시장의 문제점.txt [84] 오블리비아떼8416 14/04/04 8416 6
50746 [일반] 체조 도마 명연기 10선 [7] 살앙하는차6023 14/03/29 6023 2
50719 [일반] 디스패치, 네티즌 무더기 고소…"사진 한 장에 200만 원" [84] Duvet11969 14/03/28 11969 0
50702 [일반] 재미로 계산해본 2013년 소녀시대 수익 [6] 카랑카13838 14/03/27 13838 0
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로