PGR21.com
- 스포츠/연예 관련글을 올리는 게시판입니다.
Date 2022/04/01 15:00:55
Name 예루리
Link #1 스탯티즈 자료를 바탕으로 직접 계산
Subject [스포츠] 정규분포를 이용한 외국인 야구선수의 등급 분류와 성적 예상 방법 (수정됨)
1. 들어가며
세이버 매트릭스는 타율, 출루율 같은 야구 기록을 회귀 분석해서 각각이 득점/실점에 어떤 영향을 미쳤는지 알아보고자 하는 통계 모음집 입니다. 세이버 매트릭스가 대중화 되기 전에도 대략 10점 정도 더 얻으면 연간 승수가 1승 늘어난다는 것이 야구인들 사이에 알려져 있었고, 머니볼에서 빌리 빈 단장이 이 선수를 우리가 트레이드 하면 연간 몇 점을 얻으니 승수가 어떻게 변할 것이라고 예측하는 내용이 나옵니다.

통계를 내보면 리그, 시즌마다 다소간의 차이는 있으나 보통 득/실점 9~11점 당 1승을 얻거나 잃게 됩니다. 따라서 세이버 매트릭스 관점에서 보더라도 10점당 1승으로 보는 데 문제가 없습니다. 만약 어떤 선수가 WAR 10을 기록했다면 마이너 또는 2군 선수 중에 급하게 콜업해서 쓰는 대체선수 수준 대비 연간 팀에 100점의 점수를 더했다는 의미가 됩니다. KBO기준으로는 상위권 팀이 풀 시즌 기즌 700점 중반, 하위권 팀이 600점 이하를 얻으니 한 명의 선수가 100점을 팀에 더해준다는 건 하위권 팀을 가을야구로 올려보낼만한 영향력이 있다는 이야기가 되죠.

2. 한국에서 뛰어본 적이 없는 외국인 선수의 기대 WAR를 어떻게 구할 것인가
매년 해외 스카우트들이 자기 밥줄을 걸고 외국인 선수를 선발합니다. 그러나 나이저 모건같이 메이저에서 통산 2200타석 wRC+ 93을 기록했을 뿐만 아니라 직전 해에도 스몰 샘플이지만 52타석 wRC+ 150을 기록한 선수가 한국에 왔더니 KBO 2군에서 2할 초반을 치는 사단이 날 수도 있고 로맥처럼 NPB 요코하마 베이스타즈에서 30경기 71타수 8안타(.113) 0홈런 2타점을 기록하고 쫓겨나듯 한국에 대체용병으로 영입된 선수가 적응 완료 후 국내에서 대박을 내는 경우도 있습니다.

또한 MLB에서 괜찮은 커리어를 가지고 있는 선수는 MLB에 남거나 NPB 상급 선수로 일본에 가기 때문에 직전해까지 가능성이 있었지만 향후 기량 하락이 우려되는 선수인 경우도 많죠.  따라서 직전해 성적을 기반으로 한국에서의 WAR를 예측하는 것은 쉽지 않은 일입니다.

이럴 때 예측 적중률을 높일 수 있는 방법이 정규 분포를 이용한 표준화입니다. 이를 자세히 설명하려면 여백이 부족하므로 적지 어렵습니다만, 수능 등급제나 IQ 점수에 사용되는 방식이라고 보면 됩니다. KBO에서 뛰었던 선수들의 WAR 수치를 매 년 단위로 분리해서 (ex. 더스틴 니퍼트라면 2011 ~ 2018 까지의 8가지 값이 나옵니다) 자료를 모은 뒤 이를 정규 분포를 적용해서 1등급부터 9등급까지 나눈 뒤, 각각의 등급별로 WAR가 어느 정도인지 보면 된다는 것이지요.

이를테면 대입 수험생의 수능 점수를 정확하게 맞추는 것은 어렵지만, 그 전에 봤던 모의고사 등급을 기준으로 3등급 정도 받았던 학생이라면 본 수능에서도 2~4등급 정도 받을 것이라 예측하면 적중할 가능성이 높은 것과 같은 맥락입니다. 기존에 한국에서 뛰었던 용병이라면 직전 해 성적을 기반으로 생각하면 되고, 신규 영입된 용병이라면 한국에 들어오기 전의 수준 (메이저리거였는지, AAAA급이었는지, AAA 상급이었는지, AAA에서 평범한 수준이었는지)을 기반으로 적당히 3~6등급 정도의 초기 기대치를 가지고 성적을 예측한다면 이 선수는 발도 빠르고 컨택도 괜찮으니 WAR 3 정도는 할 것이라는 예상보다는 신뢰도가 높지 않을까요?

3. 표준화 통계의 범위는 어디까지로 할 것인가
외국인 선수의 기대 WAR 등급은 부진이나 부상으로 조기 퇴출된 선수를 제외할지, 포함시킬지 여부에 따라서  결과가 달라지게 됩니다. 퇴출된 외국인 선수를 다 포함시켜서 생각할 경우엔 이레귤러가 문제가 되는데, 멕시칸 리그에서 체력 방전된 상태로 시즌을 맞이한 결과 LG에서 9경기 선발 무승 6패 평균자책점 7.68을 찍고 방출된 에드가 곤잘레스는 이후 메이저리그에서 자리를 찾아서 3년을 더 던졌습니다. 그의 경우 적응과 준비 과정이 정상적이었다면 KBO에서도 활약할 만한 기량은 충분히 갖췄었다는 이야기죠.

따라서 정상적으로 시즌을 소화한다는 전제를 두고 통계를 구하는 편이 낫겠다 싶어, 외국인 선수 자유계약 제도가 도입된 2000년 이후 시점부터 타자는 300타석, 투수는 100이닝 이상 던진 선수들을 대상으로 표준 정규 분포를 이용한 통계 처리를 진행 했습니다. 또한 144경기 환산치를 적용했기 때문에 8구단 체제에서 뛰었던 선수들은 알고 계신 것보다 다소 WAR가 높아졌습니다.

4. 그래서 외국인 선수 등급은 어떻게 나왔는가
외국인 선수들의 등급을 대입 성적 구분 %에 맞춰서 분류해봤습니다.

q22Xizp.png

일정 실력을 갖춘 선수들을 대상으로 (풀타임 소화, AAA에서 중상급 이상 성적) 한 풀이기 때문에 3등급만 되더라도 상당히 우수한 수준입니다. 대략 3.9정도가 300타석 이상 소화한 외국인 타자의 평균치가 됩니다. 그리고 8, 9등급 이라면 보통 선수를 구하기 힘든 사정때문에 어쩔 수 없이 쓰는 수준이며 7등급은 나이가 어려서 성장 가능성이 있거나, 수비가 예술인 경우를 제외하면 보통은 이듬해 다른 선수로 바뀌는 커트라인 역할을 합니다.

제가 사용하는 기준은 직전 해에 메이저리그에서 200타석 wRC+ 90 이상을 보여준 선수거나 NPB 에서 규정타석 wRC+ 110 정도 되는 선수라면 3~5등급, AAAA 리거이거나 이름값 있는 메이저리거인데 나이를 먹어 쇠퇴 중이거나 AAA에서 상급인데 자리를 못 구한 경우에는 4~6등급, AAA에서도 뛰어난 수준은 아니었는데 팀 사정때문에 급히 뽑힌 선수는 5~7등급 정도의 성적을 거둘 것으로 예상합니다. 1~3등급, 특히 2등급 위로는 10개 구단 전체에서 한 명도 안 나오는 경우도 있을 정도로 아웃라이어 이므로 예상의 의미가 없는 수준이구요. (로하스나 테임즈가 뽑혔을 때 이 선수들이 리그 파괴자가 될 것으로 생각하신분 손들어 보세요)

163u71h.png

투수의 경우에는 야수와는 경향이 다른 것이, 야수보다 숫자가 많은 데다가 포지션 제한 없이 공만 던질 줄 알면 되기 때문에 뽑히는 선수도 대체되는 선수도 많아서 중간층의 편차가 적은 편입니다. 외인 선발 탑이었던 리오스는 빼려고 고민했으나 일단은 상징적인 의미로 남겨 놓았습니다. 투수는 야수보다도 풀이 넓다 보니 6등급만 되더라도 교체하자는 여론이 다수 나오게 됩니다.

5. 마치며
엄밀히 외국인 선수의 성적을 예측하자면, 중도탈락 및 대체선수 까지 풀에 넣어서 망할 확률도 계산하는것이 맞습니다. 이를 언젠가 도전해보고 싶은 마음이 있으나 이번 글을 쓰는데도 기력이 쇠할 지경이라 풀 시즌을 살아남은 걸 전제로 글을 써 보았습니다. 내년 스토브 리그 시기에 기회가 있다면, 자료를 보강해서 이를 적어보도록 하겠습니다.


통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
무적LG오지환
22/04/01 15:03
수정 아이콘
플럿코는 잘 할 것 같은데 루이즈 5등급만 해줬으면 합니다 크크크

우리는 다른팀 외국인 타자처럼 홈런왕, mvp 이런건 바라지도 않는다 중간만 가줘라 좀!
더치커피
22/04/01 16:23
수정 아이콘
20년 동안 원기옥 모았으니 이제는 외국인타자 mvp 한번쯤 기대해도 되는 거 아닙니까 ㅠㅠ
무적LG오지환
22/04/01 17:20
수정 아이콘
그거슨 중간에 페타신이 끊고 가서 몇년 더 모아야합니다(...)
더치커피
22/04/01 21:42
수정 아이콘
풀타임 못 뛰셨으니 안 끊긴걸로 하죠 ㅠ
초보롱미
22/04/01 22:33
수정 아이콘
올해 우승할겁니다.
한번 믿어보세요.



매년 믿었던 게 함정;;
무적LG오지환
22/04/01 22:49
수정 아이콘
저도 매년 믿긴 합니다?
설마 작년처럼 빠따들이 다 같이 손 잡고 커리어 로우 갱신하겠어요?ㅠㅠ
22/04/01 15:06
수정 아이콘
잘 봤습니다. 근데 전망은 어디에 있나요?
예루리
22/04/01 15:09
수정 아이콘
앗, 기아 타이거즈 전망만 썼다가 이건 아니다 싶어서 뺐는데 일단은 제목을 수정하겠습니다. 제목 낚시가 되어 죄송합니다 ㅠㅠ
22/04/01 15:15
수정 아이콘
전망도 있으면 더 재밌었을텐데 ㅠ 잘 봤습니다!!
22/04/01 15:09
수정 아이콘
테임즈는 왜 얘가 벌써 왔지라는 생각을 하긴했고 잘 할 거라고 생각했어요. 그 전에 토론토에 있을 때 판타지리그에서 줍줍해서 워낙 잘 써먹은 선수라...논텐더로 풀리면 오클이 긁을만하다고 생각했는데 NC에 왔고 올해에서야 한 번 긁어볼 듯
시나브로
22/04/01 15:35
수정 아이콘
와 아는 선수들 많아서 재밌네요. 특히 1, 2등급 S급 선수들 부분이 재밌고 스트레일리 대단한 건 알았는데 저 정도였나 싶고요 완전 라이트팬이라서요.

왜냐하면 2등급 니퍼트, 린드블럼, 밴덴헐크 정말 엄청난 선수들이었기에. 가르시아도 잘 치고 송구 어깨 엄청났던 기억인데 4등급에 머물렀네요.

초반에 못해서 질타의 대상이었던 삼성 러프가 그 뒤로 잘해서 3등급으로 반등한 게 재미ㅎㅎ

그레이싱어는 처음 보는 선수인데 특이하네요 75년생인데 메이저리그 있다 2005~2007 기아, 이후 NPB 07, 08 다승왕.

21세기 선수인데 덜 유명한 편인 기아 홈런왕 외국인 선수 있었는데 그 선수 생각도 나네요.

추억의 선수들도 많고 재미있고 좋은 글 잘 봤습니다~
손금불산입
22/04/01 15:43
수정 아이콘
이야 잘 봤습니다 중도퇴출 고려하면 못해도 WAR 3 이상은 찍어야 평작이네 마네 이야기를 할 수 있겠네요
22/04/01 16:22
수정 아이콘
메릴 켈리도 4년간 SK에서 1~2선발로 활약했는데도 5등급이군요 드드
10년 가까이는 준수한 성적을 쌓거나 테임즈처럼 리그 폭격을 해야 3등급 이상을 받을 수 있는 거네요
올해는다르다
22/04/01 16:31
수정 아이콘
용병을 잘뽑는 편인데도 하위권을 맴도는 롯데의 순수실력은 ..
시나브로
22/04/01 16:45
수정 아이콘
SK에서 2년 뛴 좋은 투수 앙헬 산체스 안 보여서 찾아 보니까 2018시즌 WAR 1.88, 2019시즌 5.93이네요.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
66999 [연예] 연예계 싸움 순위에 대해 말하는 전진 [49] 한화생명우승하자6059 22/04/02 6059 0
66998 [스포츠] [오피셜] 시간대 좋다!...카타르 월드컵 한국, 조별 리그 경기 시간대 확정 [39] 대단하다대단해5471 22/04/02 5471 0
66997 [월드컵] 또 만났네 또 만났어 [34] 손금불산입6558 22/04/02 6558 0
66996 [월드컵] 월드컵에서 만나게 된 같은 클럽 팀메이트들 [3] 손금불산입3593 22/04/02 3593 0
66995 [연예] 겨울 옷이 잘 어울리는 우주소녀 보나(고유림).jpgif [6] 길가메시3179 22/04/02 3179 0
66994 [올림픽] E조에 독일을 꽂아넣은 마테우스의 미소 [12] Croove8201 22/04/02 8201 0
66993 [스포츠] 영국 베팅업체 래드브록스로 살펴보는 2022 월드컵 조별 예선 [11] BTS3721 22/04/02 3721 0
66992 [스포츠] Elo 레이팅으로 보는 각 조 난이도. [27] 구라쳐서미안6793 22/04/02 6793 0
66991 [월드컵] 가나가 뽑힌게 운이 좋은 이유 [33] 삭제됨9514 22/04/02 9514 0
66990 [월드컵] H조 3국 최근 대표팀 전적.jpg [41] Silver Scrapes8053 22/04/02 8053 0
66989 [월드컵] ?? : 일본아 그정도로 너무 불만 갖지마 [6] Croove8614 22/04/02 8614 0
66988 [월드컵] 20년만에 재회기념 이건 보고 가야죠 [4] SKY926901 22/04/02 6901 0
66987 [월드컵] 재미로 했던 가상 월드컵 조추첨 결과 [3] 달리와4079 22/04/02 4079 0
66986 [스포츠] 2022 FIFA 월드컵 카타르 최종 조편성 [123] SKY9210450 22/04/02 10450 0
66985 [연예] 올해 뮤직뱅크 방송 최고점 기록 [5] TWICE쯔위4645 22/04/02 4645 0
66984 [스포츠] [KBO/LG] 개막전을 앞두고 주절주절 [24] 무적LG오지환2285 22/04/01 2285 0
66983 [월드컵] 2022 FIFA 월드컵 카타르 조추첨식 중계 안내 [22] Croove4898 22/04/01 4898 0
66982 [연예] 임영웅 앨범 구성 & 전국투어 일정 [5] theboys05072593 22/04/01 2593 0
66981 [연예] 장국영 19주기 [10] 제3지대3465 22/04/01 3465 0
66980 [스포츠] K리그 복귀 결심 마친 황인범, FC서울행 임박 [18] 及時雨4104 22/04/01 4104 0
66979 [연예] [성시경 먹을텐데] 아저씨 프렌치 하신다면서요..? [56] 삭제됨5303 22/04/01 5303 0
66978 [스포츠] [배구] 감독교체의 칼을 빼어든 KGC 인삼공사 [10] 우주전쟁3046 22/04/01 3046 0
66977 [스포츠] 기아 타이거즈 2022년 성적 예상 [14] 예루리3407 22/04/01 3407 0
목록 이전 다음
댓글

+ : 최근 6시간내에 달린 댓글
+ : 최근 12시간내에 달린 댓글
맨 위로