PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2014/09/30 19:01:18
Name 선형대수세이지
Subject [일반] [스포츠] FIP 란 무엇인가? BABIP 란 무엇인가?
얼마 전 SBS 뉴스에서 류현진이 평균자책점으로 본다면 메이저리그에서 특출나지 않은 편이지만, FIP 로 본다면 상위권이라는 사실을 보도하며 FIP 에 대한 설명을 한 적이 있습니다. 소소하긴 하지만 세이버메트릭스에 우호적인 국내 야구 커뮤니티에서는 나름 화제거리였는데요, 이를 단지 '류느님이 FIP 상위권이기 때문에 한 국뽕짓' 이라며 싫어하는 사람들과 '어떻게든 알려지는 게 좋은 거' 라면서 좋아하는 사람들로 나뉘어 키배가 벌어지기도 했습니다.

그리고 전 후자에 속합니다. 국뽕이 사실을 왜곡한다면 큰일이지만, 류현진이 실제로 FIP 가 낮은 것, 그리고 잘 던지고 있다는 건 부정할 수 없는 사실이거든요. 그런 '사실을 바탕으로' 세이버 스탯이 퍼진다면 그건 긍정적인 일이라고 생각합니다. 애초에 국내 야구는 세이버메트릭스 적극적으로 사용하는 인물이 장석꾼밖에 없는 마당이고 이제서야 세이버메트릭스 부서가 설치되기 시작하는 걸음마 단계이기에 더더욱이요.

이곳 피지알에도 세이버메트릭스에 일가견이 있는 야덕분들이 꽤 많이 계십니다. FIP 에 대해 기본적으로 언급하고 넘어가는 글들도 많고요. 그런데 자게 글을 뒤져봐도 FIP 가 무엇인지에 대해 본격적으로 설명해 놓은 글은 없더군요. 물론 제가 못 보고 넘어간 것일 수도 있지만.

SBS 에서 언급되기도 했고, 최근 네이버 기사 등지에도 언급되는 등 아무래도 류현진이 FIP 가 낮아서 그런 것이겠지만 FIP 는 자주 거론 되기 시작하는 편입니다. '수비 무관 평균자책' 이라는 번역도 뜻을 확실히 이해할 수 있게 되어 있고요. 하지만 '왜' 그런 지 설명해 놓은 곳은 별로 없습니다. 세상일 다 그렇듯 야덕인 분들은 그냥 본인이 찾아서 이해하고, 아닌 분들은 포기하는 현상이 벌어집니다. 그래서 본격적으로 세이버에 대한 이해도를 높이기 위해, 그리고 개인적으로 2000년대 만들어진 세이버 스탯 중 그 개념과 완성도 면에서 가장 혁신적이고 아름답다 생각하는 FIP 에 대한 설명을 해 보고자 합니다.

물론 FIP 가 완벽한 스탯이라는 건 절대 아닙니다. 이미 태어난 지 십 수년이 지난 스탯이기 때문에 단점도 생각보다 굉장히 많이 발견되었고, 이를 보완하는 스탯들도 많이 튀어나왔습니다. 국내에서는 일부 코어 팬들을 제외하면 메이저리그 붐을 타고 2013년 이후 메이저리그의 발전된 세이버메트릭스를 접한 팬들이 대부분이라 십 수년 전의 연구 결과를 이제야 접하고 그걸 따라가는 중이기에 그렇지, 미국에서는 이미 FIP 의 문제에 대한 지적과 분석만 수두룩하게 쏟아져 나왔죠.

하지만 이 스탯이 개발됨으로써 본격적으로 2000 년대 투수의 능력을 평가하는 기준이 잡힌 것은 누구도 부정할 수 없습니다. 거기에 FIP 는 매우 간단하죠. 또한 아주 세세한 투수 평가의 척도로 들어가자면 고려할 게 많아지지만, 그냥 일반 팬 입장에서는 FIP 만으로도 크게 무리는 없습니다. 본격적인 세이버메트리션도 아니며 걸음마 단계를 걷는 야덕일 뿐인 제가 이해를 하는 데에 무리가 없을 정도로 간단하면서도 기존의 인식을 크게 뒤엎어 버린 이 스탯을 설명하고 싶다는 덕후 특유의 본능을 억누를 수가 없네요 크크.

진성 야덕분들이 보기에는 모자란 설명이겠지만, 모자란 부분은 지적해 주세요 크크.


1. 투수의 BABIP - 보로스 맥크라켄 가라사대, 난 놈이 던진 공이든 못 난 놈이 던진 공이든 빳다에 맞고 난 뒤에는 그 공이 그 공이다.


FIP 에 대해 설명을 하려면 이 이론의 기본적인 골자가 되는 투수의 피 BABIP 에 대한 설명을 필수적으로 하고 넘어가야 합니다. 이는 보로스 맥크라켄이 1999 년 발표한 내용입니다. 아주 간단하게 설명하자면,

'리그 최고의 투수가 던진 공이나 그저 그런 투수가 던진 공이나 일단 배트에 맞고, 후속 플레이로 이어졌다면 안타가 될 확률은 동일하다'

는 논리입니다. 이는 박사장님께서 했던 말인 '땅볼을 유도했는데 안타가 되는 건 나로써는 어쩔 수 없는 일이다' 와 일맥상통하는 발언입니다. 그래서 농담삼아 박사장님을 대한민국 최초의 세이버메트리션이라고도 합니다 크크.

어쨌든 맥크라켄의 연구결과를 조금 더 이해하기 쉽게 예시를 들어 설명하겠습니다.

리그 최고의 투수인 A 와 그저 그런 투수인 B 는 같은 시즌 동일한 800 명의 타자를 상대했습니다. 이 중 A 는 상대한 타자의 30 % 인 240 명을 삼진으로 처리했습니다. B 는 이의 3분의 1인 10%, 즉 80 명의 타자만을 삼진으로 처리했고요. 볼넷과 힛 바이 피치로 내 보낸 타자의 비중은 5% , 40 명으로 동일합니다. 또한 A 는 20 명에게 홈런을 맞았지만 B 는 30 명에게 홈런을 맞았습니다.

결국 에러를 배제하고 보았을 때, A 의 공을 타격해서 홈런을 제외한 후속 플레이로 이은 타자는, 그게 안타이든 땅볼 아웃이든 플라이 아웃이든,  800-240-40-20 = 500 명이며, B 의 공을 타격한 경우는 800-80-40-30 = 650 명입니다. 그렇다면 A 에게서 안타를 뽑아낸 타자를 500 명으로 나누고, B 에게서 안타를 뽑아낸 타자를 650 으로 나누면 그 비중은 어느 정도 차이가 날까요? 다르게 말하면 A 의 공을 쳐 낸 500 명 중 안타를 때린 타자의 비중과 B 의 공을 쳐 낸 650 명 중 안타를 때린 타자의 비중은 어느 정도 차이가 날 까요?

본래 통념은 '더 잘 던지는 투수의 공은 방망이에 맞춘다 해도 안타로 만들기가 더 어렵다' 는 게 정설이었습니다. 따라서 통념상 A 는 한 50 명 정도에게만 안타를 내 주며 그 공을 때린 다 해도 10 % 정도의 타자들만 안타로 만들어 내고, B 의 경우는 한 200 명은 안타를 때려내며 30% 넘는 타자들이 안타를 만들어 낼 것만 같습니다.

하지만 보로스 맥크라켄의 연구결과, 이 비중은 잘 던지는 투수나 못 던지는 투수나 동일했습니다. 약간의 차이는 있었지만 29%~30% 사이에서 왔다갔다 했지요.

한 마디로 A 의 공을 때린 500 명의 타자 중 안타를 쳐 낸 타자는 150 명 정도로 30%, B 의 공을 때린 650 명의 타자 중 안타를 쳐 낸 타자는 195 명 정도로 역시나 30% 의 비중을 가진다는 이야기입니다.

즉 잘 던지는 투수나 못 던지는 투수나

1. 일단 공을 때렸고
2. 그게 파울이 안 되고
3. 홈런이 아니었다면
4. 안타가 될 확률은 동일하다.

라는 연구 결과입니다. 바꿔 말하면 투수가 안타를 맞는 것에 있어서 투수는 아무런 힘이 없고, 오로지 타자와 수비수에 의해 결정된다는, 그 중에서도 타자에 의해서만 결정된다는 이론입니다.

후술하겠지만, 사실 보로스 맥크라켄은 데이터를 약간 왜곡했습니다. 거기에 후속 연구가 진행되며 투수의 역할이 제로라는 건 아니라는 것 역시 밝혀졌고요. 하지만 '쳐 낸 공이 안타가 되느냐 아니냐'의 여부에 투수보다도 타자가 끼치는 영향이 압도적이라는 사실은 변하지 않았습니다.

그리고 이 '타자가 공을 때려내어 후속 플레이로 이어졌을 때, 그 공이 홈런을 제외한 안타로 이어질 확률' 을 말하는 스탯은 BABIP, Batting Average on Balls In Play 라 일컬어 집니다.




2. 검증의 시간 - "아, 안돼!" "돼!"

보로스 맥크라켄이 자기의 이론을 더 완벽하게 보이도록 데이터를 손봤다는 건 곧 들통났지만, 어쨌든 이 투수의 BABIP 가 ERA 로 보이는 투수들의 성적이 크게 차이나는 것과 달리 생각보다 큰 차이가 없거나 오히려 ERA 가 더 낮은 투수들이 높은 투수들보다 높은 경우도 있다는 건 사실이었고 금세 이슈가 되었습니다.

예를 들어 1999년의 스탯을 한 번 살펴보도록 합시다. 1999년 메이저리그 최고의 투수는 누가 뭐라 해도 페드로 마르티네즈 입니다. 대 약물 시대에 2.07 이라는 평균자책점을 찍으며 약물 복용자들을 응징했던 페드로의 BABIP 는 32.3% 였습니다. 자, 그리고 그 시기 투수 중 브라이언 메도우즈라는, 페드로와 달리 5.60 이라는, 지금 보면 처참하지만 그 당시에는 그럭저럭 중하급 투구를 했던 투수의 BABIP 를 봅시다. 어느 정도로 나왔을까요?

답은 29% 입니다. 오히려 페드로보다도 낮습니다. 만약 '잘 던지는 투수의 공은 때린다 하더라도 안타로 만들기 어렵다' 는 통념이 맞다면, 절대 있을 수 없는 결과였죠.

1999 년 모든 선발 투수의 BABIP 는 29.9 % 였습니다. 페드로는 살짝 높긴 하지만 평균에서 크게 벗어나진 않았고, 메도우즈 역시 마찬가지죠. 결국 맥크라켄의 주장, 잘 던지는 투수나 못 던지는 투수나 BABIP 는 동일하며 리그 평균에서 벗어나지 않는다는 주장이 약간의 오차는 있어도 틀린 이야기는 아닌 셈입니다.

물론 이 세상에는 양 극단이라는 케이스가 언제나 존재합니다. 당장 1999년의 선발투수 BABIP 평균은 29.9% 인데 당 해 가장 높은 BABIP 를 가진 선발 투수는 아론 셀리로 35.3% 에 달했으며 가장 낮은 BABIP 를 가진 선발 투수 케빈 밀우드는 23.5% 에 지나지 않습니다.

하지만 이들이 이런 BABIP 를 꾸준히 유지했을까요? 유독 셀리는 높은 BABIP 를 꾸준히 가진 투수였고 케빈 밀우드는 꾸준히 BABIP 가 낮은 투수였을까요?

셀리의 통산 BABIP 는 31.3% 이며, 밀우드의 BABIP 는 29.7% 입니다. 1999년에는 약 13% 라는 차이를 보이던 둘의 BABIP 차이는 둘의 통산 기록을 살펴보면 1.6% 로 어마어마하게 줄어듭니다. 그리고 밀우드가 활동한 시기인 93년~2007년 사이의 리그 전체 선발 투수 BABIP 평균은 29.5% 이며, 밀우드가 활동한 시기인 97년부터 2012 년까지의 BABIP 평균도 29.5% 입니다.

보시다시피 아론 셀리의 경우는 자신이 활동한 시기의 평균 BABIP 보다 1.8% 가량 높은 BABIP 를 기록한게 전부고, 밀우드의 경우는 0.2% 정도 높은 게 다입니다. 투수의 BABIP 는 한 해 정도 운이 좋을 수 있습니다. 하지만 그 운이 평생을 따라 주진 않습니다.




3. 그러면 투수의 능력은 무엇으로 평가해야 하나요? - 삼진, 볼넷, 피홈런, FIP 의 탄생


바로 여기에서 FIP 가 탄생합니다. 투수의 피안타가 많은 영향을 끼치는 ERA 의 경우는 한 해 투수의 성적을 평가하기에 적절치 않다는 이야기가 되니까요. 그렇다면 투수의 성적과 실력은 무엇을 바탕으로 평가해야 할까요?

모든 투수는 타자를 상대하여 타석이 완료되었을 때에 다음과 같은 결과값만을 배출합니다.

1. 삼진
2. 볼넷, 사구
3. 홈런
4. 안타
5. 땅볼 아웃이든 플라이볼 아웃이든 라인드라이브 아웃이든 후속 플레이 후 아웃
6. 에러

6 은 희귀한 경우에 명백히 수비의 실수이므로 제외. 4 와 5는 위의 투수 BABIP 는 투수가 제어할 수 없다는 이론에 의하면 또 제외됩니다. 결국 보로스 맥크라켄의 주장에서 도출되는, 투수의 성적을 평가하는 척도로 사용할 수 있는 스탯은 단 세개 뿐입니다.

삼진, 볼넷, 홈런.

FIP 는 이 세 가지가 실제로 점수를 내는 데에 있어 가지는 비중을 통계와 분석을 이용해 분석한 뒤 각 결과값의 게임 내 중요도를 구하고, 이를 통해 이 세가지 스탯으로 평균자책점 스케일의 스탯을 만들어 낸 것입니다. 각각의 중요도는 매 시즌 소숫점 단위에서 달라지긴 하지만 대략 홈런이 13, 볼넷이 3, 삼진이 -2 정도입니다. 이를 이용해 도출한 수식은 뭐 사실 세이버메트릭스를 본격적으로 파 보실 게 아니라면 적는 것 자체가 - 이미 상당히 흥미를 잃으셨겠지만 크크 - 피곤해지고 흥미를 잃게 만드는 일이므로 과감하게 적지 않겠습니다 크크.




4. 완벽하진 않아요.

중요한 건 FIP 는 절대 완벽한 스탯이 아니라는 점입니다. 위에서도 말했지만 투수가 BABIP 에 미치는 영향은 절대 제로가 아닙니다. 아론 셀리의 통산 BABIP 가 31.3% 였고 밀우드의 통산 BABIP 가 29.7% 로 1999 년의 한해만 놓고 본 것 보다 줄긴 했지만, 두 투수 모두 2000 이닝이 넘는 이닝을 소화한 걸 생각하면 이 차이는 아주 작다고만은 할 수 없습니다.

후속 연구에 의하면, 안타에 대해 타자가 끼치는 영향은 쳐 낸 공이 라인 드라이브인지, 땅볼인지, 뜬공인지에 따라 다르지만 대개 40~47%, 투수는 26~28%, 10% 내외의 운, 그리고 나머지가 수비의 영역입니다. 투수는 아주 제로라고 주장했던 보로스 맥크라켄의 초기 이론에 비해 생각보다 투수의 영향력 역시 꽤 되는 편입니다.

실제로 높은 공, 낮은 공의 BABIP 는 다르고 바깥쪽, 안쪽의 BABIP 는 다릅니다. 명백히 낮고 바깥쪽 공의 BABIP 는 한 가운데로 오는 공에 비해 BABIP 가 떨어지죠. 이게 투수의 영역입니다. 구속에 따른 BABIP 차이도 존재합니다.

또 투수 본인이 가지는 수비 능력의 영향 역시 무시할 순 없습니다. 커쇼, 매덕스, 글래빈 같이 커리어 내내 쩌는 수비 능력을 보여주는 투수들은 BABIP 를 낮추고 이로써 자신의 실점을 본인이 줄이는 능력을 가지고 있는데 FIP 는 이걸 무시하죠.

또 홈런은 생각보다 투수의 능력 외적인, 운이 많이 끼어 있으며 변동도 심한 스탯입니다.

또 FIP 는 투수의 땅볼 유도 능력, 논쟁이 있긴 하지만 내야 플라이 유도 능력을 완벽히 반영하진 못합니다. 땅볼 유도 능력이 높은 투수들은 홈런을 덜 맞는데 이는 피홈런으로 측정한다 해도, 땅볼 비율이 높아질 수록 높아지는 병살타를 반영하지 못하죠. 내야 플라이 유도 능력은 이게 과연 투수의 능력인지 아닌 지 논쟁이 있긴 하나, 분명히 커리어 내내 이것을 리그 평균보다 꾸준히 높게 유지하는 투수들이 있으니 이들의 능력을 FIP 는 완벽히 잡아내지 못합니다.

이 때문에 이를 보완하는 여러 스탯들이 나왔습니다. 투수의 홈런 개수가 아닌 리그 평균 홈런/플라이볼 비중을 적용하는 xFIP, 땅볼 유도 능력과 그 외 요소들을 첨가해 투수 스탯 중 복잡도로 따지면 끝판왕이라 불리우는 SIERA, 내야 뜬공을 삼진으로 치는 IFFIP 등등 많기도 합니다.

그리고 의외로 구관이 명관이기도 합니다. ERA 가 단 시즌 투수의 성적을 평가하는 잣대로 부적절한 것은 지나치게 운, 수비 등 불순물이 많이 껴 있다는 게 그 이유인데 이 불순물은 결국 시간이 오래 흐르면 평준화 되기 마련이니까요. 실제로 커리어가 5~7년 이상 지속된 선수의 성적은 FIP 보다 ERA 가 좀 더 정확하게 나타낸다는 결과가 있고, FIP 가 최적의 신뢰도를 자랑하는 구간은 의외로 400~500 이닝 정도로 꽤 한정적이라는 연구 결과도 있습니다.




5. 하지만 계속 쓰일 거에요.


하지만 FIP 의 최대 장점은 역시 무엇보다도 간단하다는 점입니다. ERA 의 경우는 5~7년이 지나면 정확해 진다지만 당장 A 선수의 내년 성적을 예측하고 싶어하는 구단에게 '5~7년만 기다리면...' 이라는 옵션은 받아들여 질리 없습니다. xFIP, SIERA 가 정확하다지만 사실 이마저도 일정 부분에서 그렇다는 이야기이고 FIP 가 더 높은 정확도를 자랑하는 구간과 기간이 있고, 400~500 이닝 정도로 한정적이라는 이야기와 달리 '더 많은 투수에게 적용가능하다' 라는 연구결과도 있습니다. 특히 SIERA 의 경우는 '잘하는 애들은 FIP 가 SIERA 의 예측력이 더 높다' 는 연구 결과도 있었죠. 아니 애초에 이 스탯을 발표할 때 부터 발표자 본인이 그 사실을 인정하고 들어갔습니다. 이후 개량을 거치며 이젠 차이 없다는 갑론을박도 있지만.

거기에 FIP 가 나온 이후로 그 어떤 스탯도 FIP 의 간단함이 가지는 편리함을 따라잡은 스탯은 없습니다. SIERA 는 수식을 보면 '아...' 소리가 나오고, xFIP 도 예측력이 뛰어나다는 주장이 있지만 분명히 커리어 내내, 혹은 전성기 장기간에 걸쳐 피홈런을 평균보다 낮게 억제하는 투수들이 있는만큼 그 부분에 있어서는 작위적입니다.

FIP 의 골자를 예로 들면 결국 이겁니다. 조난을 당해 탈수가 극에 달한 사람이 1 리터의 물을 찾아냈습니다. 그런데 여기 100ml 의 불순물이 끼어 있습니다. 당장 이 물을 마시는 건 미친 짓을 겁니다. 그렇다고 불순물이 모두 가라앉기를 기다린 뒤에 윗부분만 살짝살짝 정성스레 떠 내길 기다리기에는 자신이 버티지 못할 것 같습니다.

그렇기 때문에 10 분을 기다립니다. 그러자 병의 아랫 부분에 불순물이 껴 있는 부분 100 ml 가 확실히 형성되고, 긴가민가 싶은 부분 100 ml 가 그 위에 형성됩니다. FIP 는 여기에서 맨 아래의 100 ml 뿐만 아니라 긴가민가 싶은 부분 100 ml 도 버려버리는 방법론입니다. 그렇게 되면 원래 얻을 수 있는 순수한 물 900 ml 보다 적은 800 ml 를 얻을 뿐이지만, 불순물이 섞인 1L 의 물을 그대로 마시는 것 보다는 나은 일일 뿐 더러 900 ml 의 물을 얻는 데에 걸리는 시간보다 시간도 적게 걸리니까요.




6. FIP 의 주요한 용도 중 하나 - 미래 예측


사실 FIP 를 비롯한 모든 스탯들은 미래를 예측하기 위한 것이 아닌, 과거에 벌어진 일을 평가하기 위해 만들어 진 것입니다. 하지만 그 스탯이 해당 선수 본연의 능력을 얼마나 반영하고 있느냐에 따라 미래 예측 능력이 존재하는 것은 사실이고, FIP 는 그 미래 예측 력이 상당한 편입니다. 물론 SIERA 와 xFIP 등이 특정 구간에서는 더 정확한 미래 예측을 보장하고, ERA 나 RA/9 의 경우가 표본 크기가 더 커지면 미래 예측력이 더 정확해 지지만 단일 시즌에 한해서, 그리고 일반적인 경우에 FIP 는 ERA 보다, 그리고 더 섬세한 계산을 가한 SIERA 나 xFIP 보다도 나은 미래 예측력을 보여줍니다.

댓글의 지적을 들어 KBO 로 예를 들어 보겠습니다. 바로 세이버메트리션들 사이에서 FIP 의 교과서로 불리우는 09 유동훈의 호성적입니다.

2009 년 유동훈은 67 과 3분의 1 이닝을 던져 0.53 이라는 괴물같은 ERA 를 기록했습니다. 많은 팬들은 '유동훈이 각성했다' 라면서 좋아했죠. 하지만 이에 대해 세이버메트리션들은 의구심을, 아니 대 놓고 '운이 좋았다' 는 평가를 내렸습니다. 왜 그럴까요?

그건 2009년 유동훈의 BABIP 가 18.1% 로 KBO 역사를 통틀어서도 독보적으로 낮았기 때문입니다. 삼진의 증가, 볼넷의 감소, 홈런의 감소는 두드러지지 않았고 오직 BABIP 만 크게 줄었습니다. 당연히 BABIP 에 의한 피안타의 증감, 그리고 그에 따른 평균자책점을 고려하지 않는 FIP 는 0.53 인 ERA 에 비해 높아서 3.30 을 기록했습니다. 그리고 이 때문에 세이버메트리션들은 유동훈의 2010년 성적은 0.53 보다 3.30 에 가까울 것이라 예측했습니다.

그리고 2010년, 유동훈의 성적은 2.85 를 기록합니다. 그리고 그 해의 FIP 는 2.95 였죠.

물론 FIP 가 언제나 완벽하게 미래를 예측하는 건 절대 아닙니다. 극단적인 하락세를 겪는, 역량 자체가 무너지며 삼진과 볼넷이 나빠지는 선수의 몰락은 FIP 도 예측하지 못합니다. 유동훈의 2010년 만 보더라도 FIP 가 2.95 로 어느 정도 준수하긴 했지만 그 다음 해에는 FIP 자체도 4.22 로 높아지고 방어율도 3.94 였죠.

또는 갑작스러운 각성 또한 예측하지 못합니다. 피칭의 질 자체가 현격이 높아지는 경우도 분명히 존재합니다. 이는 세이버메트릭스가 기를 쓰고 포착하려 해도 찾아낼 수 없는, 스카우터들의 방법론 적 영역에서만 미래 예측이 가능한 경우가 존재한다는 이야기입니다.

하지만 FIP 는 최소한 '이 선수가 올해 성적이 갑자기 (좋아졌는데/안 좋아졌는데) 이게 과연 운이 (좋아서 일까/나빠서 일까) 를 판단하는 데에 대한 기준점을 제공해 줍니다. 이는 ERA 만으로는 해 내기 어려운 부분이죠.




7. 어디서 보나요?


일단 메이저리그 선수들의 FIP 를 확인할 수 있는 사이트는 수두룩하지만, 그 중에서도

http://www.fangraphs.com

을 추천합니다. 베이스볼 레퍼런스도 좋긴 한데 거긴 인터페이스가 좀 난잡한 감이 있어서...

한국 선수들의 FIP는

http://www.kbreport.com

에서 확인하실 수 있습니다.

둘 다 FIP 를 위한 사이트가 아니고 - 일단 그런 건 존재할 수가 없죠 - 본격적인 세이버 사이트인만큼 여타 스탯들도 같이 찾아보실 수 있으며 본격적인 덕질과 순위 놀이를 하실 수 있습니다.

이걸로 많은 분들이 FIP 에 대한 이해에 조금이라도 도움이 되었으면 하네요. 써 놓고 보니 아는 척만 하고 혼란만 가중시켜 드린 것 같은 글이 되긴 했지만...

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
14/09/30 19:06
수정 아이콘
좋은글 잘봤습니다. 뭐니뭐니해도 fip, babip의 교본이라면 크보의 유동훈이죠. 이 부문만 있으면 크보팬들은 완벽 이해가 가능한데..
김연우
14/09/30 19:14
수정 아이콘
2009년이 왜 플로크인지를 너무나도 완벽하게 해소해주죠.
선형대수세이지
14/09/30 19:29
수정 아이콘
지적 감사합니다 크크
자갈치토스
14/09/30 19:51
수정 아이콘
제가 리그베다 위키 dips fip 항목 작성할때 예시로 유동훈 넣으면서 별 생각없이 교과서 얘기를 했는데 그걸 재밌게 보셨던 분들이 많았는지 유동훈 플루크 얘기만 나오면 교과서 말씀하시는 분들이 많더군요. 반대로 타자 babip 교과서는 이현곤이 있죠.
선형대수세이지
14/09/30 19:55
수정 아이콘
오오...
Legend0fProToss
14/09/30 20:24
수정 아이콘
작년과 올해
채태인도 눈여겨 볼만하죠 크크
함순이는함순함순
14/09/30 20:27
수정 아이콘
올시즌 중반쯤에
"채태인의 babip이 내려가지 않아!"
류의 내용을 본거 같은데, 결국 이번시즌은 정상범위로 내려왔나요? 크크
영원이란
14/09/30 21:36
수정 아이콘
채태인은 라인드라이브 히터로 거듭나고 있어서 바빕이 쉽게 내려가진 않을듯 합니다.
Legend0fProToss
14/09/30 22:31
수정 아이콘
작년 바빕이 역대급으로 높아서
올시즌은 정상범위로 돌아온걸로
알고있어요
14/09/30 19:11
수정 아이콘
잘봤습니다. 쉽게 설명해주셔서 잘 이해가 되네요.
선형대수세이지
14/09/30 19:55
수정 아이콘
쉽게 받아들여 주셨다니 정말 감사합니다.
14/09/30 19:14
수정 아이콘
제가 보통 FIP를 모르는 사람에게 설명할 때 가장 간단하게 하는 말은 "일단 맞으면 끝"이라는 표현을 씁니다.
즉, 투수는 안 맞추고 안 내보내는게 가장 잘 하는 것이고 항상 맞춰 잡는 것은 이론상 어렵다.라는 것이죠.
저는 이 것을 야구에 속설에 맞춰 이렇게 이해합니다. 타자는 3할을 치면 대타자고 가장 타구가 갈 확률에 높은 곳에 수비수가 있는 것이 야구기 때문에...

저도 사이버 매트릭스를 전문적으로 공부한 적도 없고 FIP나 BABIP의 개념 정도만 아는 것이지 이를 완벽하게 이해하고 있지는 않지만
이런 연구를 하는 수학자들 덕분에 확률의 스포츠라고 불리는 야구가 더 발전한다고 봅니다.

그리고 2번의 7번째 문단에 애런 실리와 케빈 밀우드를 비교하는 부분에 밀우드가 두 번 나오네요. 오타이신듯...
선형대수세이지
14/09/30 19:48
수정 아이콘
으잌 오타 지적 감사합니다
14/09/30 19:21
수정 아이콘
세이버메트릭스가 대중적으로 잘 받아들여지지 않는 것은 역시 숫자를 다룰 줄 알아야 한다는 점과 그것이 인간을 평가한다는 점 때문이겠죠. 개인적으로는 이것을 어떻게 대중적으로 풀어내느냐의 과제라고 생각합니다.
선형대수세이지
14/09/30 19:55
수정 아이콘
사실 세이버메트릭스는 '그냥 야구가 좋은 팬' 입장에서는 접할 필요가 없다고 봐요. 그냥 '난 홈런 칠 때 들리는 소리, 야구장의 너른 벌판, 응원하는 앰프가 좋아' 하는 사람에게는 필요없죠. 그런데 야구 팬은 대부분 이런 입장인지라, 세이버메트릭스는 대중적이 되긴 힘든 분야라고 봅니다.

물론 구단을 운영하는 구단주나 단장, 코칭 스태프, 선수 본인 입장에서는 다르죠. 게임 내의 방법론적인 면에 집중해야 하는 선수라면 몰라도, 구단주나 단장 입장에서 승리를 위한 합리적인 방법론을 제시하는 세이버메트릭스를 모르거나 거부하는 건 직무 태만이니까요.
구밀복검
14/09/30 19:21
수정 아이콘
FIP 같은 지표야말로 칭찬 받아야 마땅하죠. 결국 통계, 그리고 세부 지표란 드러난 결과로부터 드러나 있지 않은 실재를 추산해낼 때 의미가 있는 것일 텐데, 이에 FIP만큼 부합하는 것이 없으니까요. '이러니저러니 해봐야 진 것/실점한 것 아니냐' '성적과 별개의 실제 실력 같은 것은 없다' '운도 실력이다'는 류의 일련의 반지성주의적 태도에 대한 반박으로 굉장히 적절하죠.
선형대수세이지
14/09/30 19:58
수정 아이콘
구밀복검님이 바라시는 축구의 합리적인 세부스탯 개발도 뭔가 혁신적인 게 딱 나와주면 재미있어 질텐데요 크크.
구밀복검
14/09/30 20:04
수정 아이콘
일단 그쪽은 로우 데이터부터 축적하고 와야..답이 없죠 참. 제 생각으로는 만약 단시간 내에 혁신이 발생한다면 그것은 골키퍼 관련 통계가 아닐까 합니다. 축구의 난점은 경기가 공간적, 시간적, 역할적으로 분절이 안 된다는 것인데, 골키퍼는 이런 측면에서 분절성이 강하니까요.
선형대수세이지
14/09/30 20:49
수정 아이콘
다른 야덕 분들을 자극할 지도 모르는 발언이지만, 게임으로써의 구조적인 완벽함은 축구 쪽이 우위에 있다고 생각하긴 하는데, 그게 스탯 놀이에서는 또 난점으로 작용하니까요. 직관적이고 연속적이며 외울 룰도 적으며 선천적인 조건에 의한 배제나 포지션 배분이 타 스포츠에 비해 상대적으로 관대하고 좋긴 한데...

개인적으로 축구에서 합리적인 세부 스탯 개발이 진행된다면 말씀하신대로 골키퍼 쪽에서 일이 터지거나, 로우 데이터를 수집하는 수단 자체가 지금과 비교할 수 없을 정도로 섬세해지고 발전해야 할 것 같습니다. 그런데 그게 언제쯤일지...
김연우
14/09/30 19:21
수정 아이콘
그런면에서 김광현의 진출은 좀 부정적이죠. 엄청난 볼넷 때문에.

보면 볼수록 류현진은 거의 소년만화스러운 투수입니다. 세이버메트릭스로 보면 2006년 이후 매년 발전하니까요.
선형대수세이지
14/09/30 19:59
수정 아이콘
2014 김광현은 볼넷도 볼넷이지만 삼진도 못 잡아서...류현진은 정말 난놈이라는 표현 밖에 안 나오죠. 메이저리그에 가서도 성장하고 있으니. 이런 성장은 세이버가 잡아내거나 예측할 수 없는 부분이기도 하고요.
고윤하
14/09/30 19:22
수정 아이콘
이글엔 그분이 댓글좀 안달았으면 좋겠네요
선형대수세이지
14/09/30 19:59
수정 아이콘
뭐...다저스 빳다 글에서도 좀 논쟁이 붙긴 했는데 그냥 그러려니 합니다. 그래도 그 뒤에 다저스 빳다가 후반기에 대폭발하며 어느 정도 제 변호에 힘을 실어줘서 좋았네요 크크
전투코알라
14/09/30 21:21
수정 아이콘
저두요 크크크
느낌으로 야구 보시는분
키스도사
14/09/30 19:24
수정 아이콘
간단 요약

1. 가장 많이 쓰는 평균자책점(ERA)은 투수가 제어할수 없는 능력을 너무 많이 포함하고 있어서 정확도가 떨어진다.

2. 투수가 던진 공을 타자가 방망이에 맞춘 후 벌어지는 일은 투수가 컨트롤 할수가 없다. 그래서 나온게 BABIP.
3. 예외는 있지만 S급 투수나 B급 투수나 BABIP는 리그 평균 BABIP에 수렴한다.(물론 예외는 있지만 드물다.)

4. FIP가 완벽한 스탯은 아니다. 그러나 투수가 컨트롤 할수 없는 스탯들을 제거한 지표이기에 많이 쓰이고 있고, 앞으로도 많이 쓰일것이다.
5. FIP는 투수가 제어할수 있는 스탯인 "삼진율 / 볼넷율 / 피홈런율"을 가지고 계산하는 방식이다.
선형대수세이지
14/09/30 20:00
수정 아이콘
오오 간단하네요.
헤나투
14/09/30 19:25
수정 아이콘
진짜 야구는 기록을 위한 스포츠네요 크크.
세이버에 대해서 과하게 신봉하는분들은 4번 내용을 좀 생각했으면 좋겠구요.

갠적으로 국내야구계에서는 얼마나 활용되고 있는지가 궁금하네요.
선형대수세이지
14/09/30 19:33
수정 아이콘
뭐 세상 모든 덕후들이 다 입문 시기에는 비슷하죠, 락덕후는 초창기에는 '락이 짱이야!' 로 대동단결하고 힙찔이는 초창기에 '힙합만이 음악! 언더만이 신!' 으로 뭉치고 에바 덕은 '에반게리온은 성전' 이라 하고 달빠는 '페이트는 에로게가 아니다' 로 뭉치고...크크크

사실 스탯이라는 게 다 상호보완적인데에 그걸 간과한다는 것 부터가 입문자라는 이야기이고, 우리나라 야구 팬들 자체가 세이버메트릭스를 서서히 익혀나가고 있는 상황이기에 발생하는 어쩔 수 없는 부작용이라 생각합니다. 그래도 일단 이런 부작용이 발생하고 있다는 것 자체가 세이버메트릭스가 퍼져나가고 있다는 이야기이기에 나름 긍정적으로 받아들이려 하고요.

국내 야구계에서 이장석은 확실히 적극적으로 활용하고, 두산과 다른 한 구단이 기억나지는 않는데, 여하튼 연중 세이버메트릭스 관련 인원을 모집하고 있다는 글을 본 적이 있습니다. kbreport 의 등장도 있고 하니 확실히 성장은 하고 있어요. 현장에서야 꼰대기질 발휘하겠지만 그건 아직까지도 메이저리그 역시 그런 파가 많으니 어쩔 수 없고요.
Arkhipelag
14/09/30 19:34
수정 아이콘
4번 내용에 관해 부차적으로 설명을 드리자면, 세이버매트리션들 역시 FIP나 OPS 등으로 대표되는 현재의 세이버매트릭스가 아직 완벽하지 않다는 것은 잘 알고 있습니다. 다만 클래식 스탯에 비해 좀더 잘 설명한다는 거죠.
오히려 클래식 스탯을 신봉하고 세이버매트릭스를 숫자놀이라 폄하하는 반지성적인 사람들이 일으키는 분란이 많으면 많았지, 더 적다는 생각은 안 듭니다.

더불어, 국내야구계에서라면 넥센이나 NC 정도는 분명 세이버매트릭스를 잘 활용하고 있는 중이라 보지만서도, 타 구단들은 아직까지는 좀 회의적인 듯 보이네요.
레지엔
14/09/30 19:39
수정 아이콘
세이버매트릭스에 관해서라면, 과도한 신봉보다 과도한 폄하가 훨씬 더 문제일 겁니다. 애초에 '전통 야구관'이 반 세이버적이며, 실제로 반지성주의적 접근을 했었고 그 영향이 아직도 작지 않으니까요.
헤나투
14/09/30 19:57
수정 아이콘
저 역시 세이버빠에 가깝습니다. 다만 세이버뽕 과다하게 맞은분들때문에 오히려 역풍을 자주 맞기떄문에 얘기해봤습니다.
세이버를 받아들이지 않는분들의 무시야 어쩔수없다고 보는 입장이거든요. 아직까지 세이버는 어쩔수없는 비주류니깐요... 세월이 흐르면 달라질거라 봅니다.
14/09/30 20:09
수정 아이콘
일리 없는 이야기는 아니시고 저도 그런 사람들 꽤 봤지만..
그건 온라인 그것도 야구관련 커뮤니티중에서도 일부에 한정된 이야기이지요..
현실은 아직도 전통적인 야구관이 지배하고 있으면서..
이제 겨우 변화의 싹이 나는 과도기에 진입하고 있을뿐이라서요..

그런 걸로 세이버 역풍을 만드려고 하는 사람들은 세이버뽕탓보다는 결국 스스로들의 수준탓을 해야겠죠
당장 일베류인간들이 남탓하는 것도 생각나고 참 별로에요
노련한곰탱이
14/09/30 19:29
수정 아이콘
가끔 BABIP에 '땅볼/라인드라이브/뜬공' 통계가 대입되면 더 정확해지지 않을까 하는 생각을 해봅니다. 상대적으로 라인드라이브 타구가 땅볼이나 팝플라이에 비하면 안타가 될 확률이 훨씬 높으니 말이죠.
14/09/30 19:34
수정 아이콘
그 스탯이 BABIP의 개량형이라 할 수 있는 xBABIP입니다.

http://www.smartfantasybaseball.com/2013/01/xbabip/
선형대수세이지
14/09/30 20:02
수정 아이콘
사장 님이 쓰셨듯이 xBABIP 가 그거긴 한데, 사실 세이버 스탯 중 무시할 수 없는 게 간편함과 용이함이니까요. OPS 가 FIP 보다 개념 자체는 부정확하지만 심플함 때문에 널리 퍼졌고, FIP 이후의 개량형 스탯들도 FIP의 심플함을 이길 수가 없어 FIP 만큼 널리 퍼지지 않는 게 사실이니 BABIP 역시 그 자리를 잃진 않을 겁니다.
김연우
14/09/30 19:31
수정 아이콘
한가지 잘 모르겠는건 기록이 쌓이면 era가 더 정확하다는 이야기인데 그 기준이 뭔지 모르겠습니다
투수의 퍼포먼스에 대한 지표가 있을때 뭐가 더 해당 지표와 오차가 적다, 라면 그 투수의 퍼포먼스를 뭘로 측정했는지를 모르겠거든요
(모른다는건 인정못한다가 아니라 배움이 부족하니 알려주세요,입니다)
선형대수세이지
14/09/30 19:42
수정 아이콘
더 정확히 말하면, FIP 는 투수의 수비 능력, 견제 능력, 스트라이크 존의 세부를 뛰어난 제구력으로 활용하여 BABIP 을 낮추는 능력 등을 배제합니다. 제구력 부분은 위에서도 말했듯이 아주 큰 차이는 아니지만 존 한 가운데와 높은 공에 비해 존의 바깥쪽, 아래쪽 공이 안타가 될 확률이, 즉 BABIP 가 낮습니다. 하지만 그 차이가 단기간을 봤을 때에는 미미하다고 평가하기에 제외해 버리는 거죠.

문제는 투수의 수비 능력도, 견제 능력도, 뛰어난 제구력도 분명히 존재하는 부분이며 ERA 를 낮추는 데에 사용되는 투수 본인의 능력이라는 점이죠. 단기간을 놓고 보면 미미한 차이지만, 이게 시즌이 거듭되고 표본이 쌓이면 무시할 수 없는 차이가 됩니다. 이런 걸 FIP 는 반영하지 못해서 1000 이닝 이상 투구한 투수의 투구를 평가할 때에는 ERA 가 더 정확하다는 말이 나오곤 합니다.

쉽게 말해, 1이 나오면 이기는 주사위 도박을 한다고 가정해 봅니다. 그리고 1% 의 확률로 1 을 나오게 하는 데에 성공하는 능력을 가진 사람 A 가 있고 평범한 사람 B 가 있습니다. A 와 B 의 차이는 백 번을 던지면 1 이 한 번쯤 더 나온다는 차이입니다. FIP 는 A 의 이 능력에 대해 '고작해야 승률을 1% 늘릴 뿐이므로 단판 승부 내지는 열 판 승부에서는 별 의미 없다' 라 치부하고 둘의 승률을 그냥 엄대 엄으로 맞춥니다.

하지만 판 수가 천 판, 만판, 십판만으로 늘어나면 이야기는 달라지죠. 노이즈는 제거되고 A 능력은 분명한 능력으로 작용해 A 의 승률을 높여줍니다.

ERA 가 기간이 길어지고 누적되면 더 정확하다는 이야기는 이런 이야기라고 보시면 될 것 같습니다. 한 시즌에 한해서는 BABIP 에 노이즈가 잔뜩 끼며 낮아질 수 있지만 시즌이 길어지면 평준화 되는 것과 마찬가지로, ERA 역시 한 시즌 정도는 투수의 능력에 비해 더 좋거나 나쁠 수 있지만 시즌이 누적되면 노이즈가 평준화되고 제거되며 투수 본연의 능력이 나타나는 거죠. 여기에는 FIP 가 잡아내지 못하는 투수의 수비 능력, 견제 능력, 제구력 등이 포함됩니다. FIP 는 그 시간을 기다려 줄 수 없다! 라고 하며 보다 짧은 기간에 한해서 이들보다 확실히 투수의 실력이라 인정할 수 있는 요소들만을 통해 그의 실적을 평가 혹은 미래를 예측하는 거고요.
김연우
14/09/30 20:10
수정 아이콘
제가 도식화한건
Fip=비babip투수능력
Era=비babio투수능력+babip적투수능력+야수수비능력+타자능력
인데
Babip적투수능력보다 야수수비능력+타자능력가 주는 오류가 더 크다고 생각했거든요 각자 소속하는 팀이 다르니까요
선형대수세이지
14/09/30 20:38
수정 아이콘
으익 알림이 안 떠서...답이 늦었습니다 크크크 일단 그 점은 죄송하고...

최근 연구 결과에 따르면, 직선타/플라이볼/땅볼이냐에 따라 달라지지만 대개 수비수의 BABIP 에 대한 비중은 13~21 % 로 여겨집니다. 기억은 안나지만 아마 플라이볼이 높은 플라이볼에 대한 수비수의 주력 및 타구 예측이 극적으로 영향을 끼쳐 21 % 고, 나머지는 모두 13 % 대일 겁니다.

반면 투수의 비중은 모두 26~28 % 정도로 균일하며, 아무리 뛰어난 수비진과 커리어를 보낸 투수고 못난 수비진과 커리어를 보낸 투수라 하더라도 저 13% 가량의 비중은 투수의 비중에 비해 중요도가 낮으니 시즌이 누적되면 결국 스탯에 있어서 투수의 능력이 수비수 비중을 압도하고 두각을 나타낸다...정도로 받아들이실 수 있겠네요.

물론 분명히 이득을 보는 부분이 존재는 합니다. 톰 글래빈은 개인적으로 통산 FIP 와 ERA 의 큰 괴리가 분명 FIP 가 잡아내지 못하는 글래빈의 능력에 기인함을 인정하나, 앤드루 존스라는 역대급 중견수를 두고 플라이볼 피칭을 투수 구장에서 펼친 덕도 아주 조금은 있다고 보거든요. 하지만 그 비중이라고 해 봐야 13% 정도이니 결국 글래빈의 능력 26~28% 가 더 공이 크다고 보는 거죠.
함순이는함순함순
14/09/30 20:21
수정 아이콘
으으 길게 썼다 날아가서 간단하게 쓰겠습니다.
최근 1시즌정도의 단기간에는 fwar가, 대략 5시즌/1000이닝 정도의 데이터가 누적된 장기간에는 bwar가 정확하다는 통계적 결과가 현지 칼럼니스트들로부터 나오고 있습니다.
fwar는 fip로, bwar는 RA/9으로 퍼포먼스를 측정하기에, 이 또한 세이지님 말씀대로 장기간의 과정에서 노이즈는 걸러진다는 명제의 연장선상이라 볼 수 있습니다.
김연우
14/09/30 20:30
수정 아이콘
아아 bwar와 fwar라면 알겠습니다
Legend0fProToss
14/10/01 02:24
수정 아이콘
fip이 ra9나 era보다 좋은 통계량이라고 보는데도 fwar보단 bwar을 선호하게 되네요
대체선수대비 얼마나 승을 벌어왔냐는
실적이라는 생각이 들어서 일까요
실력이든 운이든 그해에 해낸건
인정을 해줘야 될거같다는 생각이 좀 듭니다
거믄별
14/09/30 19:34
수정 아이콘
투수를 평가하는데 완벽하지는 않지만 좋은 수치임은 분명합니다.

올 시즌 류현진의 FIP가 좋아졌죠.
그런데 웃긴 것은 작년 시즌 류현진의 FIP(3.24)는 ERA(3.00)보다 높았습니다.
작년에는 언론을 비롯해서 류현진을 응원하는 대부분의 사람들이 FIP에 대해서 의도적이었는지는 모르겠지만 무시한 수치였다는 겁니다.

올 시즌 FIP가 ERA보다 낮아지면서 관련 뉴스며 기사며 야구 커뮤니티에서 많이들 이야기하고 있습니다.
분명 류현진이 작년보다 좋아진 것은 맞고 그에 대해서 칭찬을 해야하는 것은 맞는데
작년에는 무시하던 수치가 올해는 좋아졌고 선발투수 중에서 상당히 괜찮은 수치를 보이자 여기저기서 보도를 하고있습니다.
이런 모습이 그닥 좋게만은 느껴지지 않네요.
선형대수세이지
14/09/30 19:47
수정 아이콘
뭐 그걸로 MLBNATION 에서도 이야기가 많았고...다른 커뮤니티 이야기지만 개인적으로 얼마 전 네이션에 불어닥친 폭풍도 그 때에 벌어진 논쟁으로 그 분이 반감을 사게 된 것도 없지 않다고 보긴 합니다.

분명히 양적인 면만 있는 현상은 아닐 겁니다. 하지만 전 일단 지금 세이버는 널리 알려지는 게 여러 모로 좋은 상태라고 생각해요. 그리고 FIP 에 대해서는 작년에는 무시했다기 보다는 그런 게 있다는 걸 찾아볼 필요를 못 느꼈다는 게 더 옳은 표현이라고 생각합니다. 올해에는 ERA 보다 FIP 가 좋으니 필요해서 언급을 하는 거라 생각하고요.

좋은 건 한 번 언급하면 그 뒤에는 말을 무르기가 어렵다는 거죠. 올해 FIP 에 대한 주목도가 높아진 상태에서 언론에서 그 다음부터 언급을 안 할 수는 있어도, 손바닥 뒤집듯 'FIP 아무런 소용없어' 라고 보도하진 않을 겁니다. 잃을 건 없거나 적은 도박이죠, 그래서. 허구연 같은 인물은 다르겠지만...
자갈치토스
14/09/30 20:02
수정 아이콘
추신수가 war로 리그 최상위권을 찍을때는 세이버메트리션이 애국자였는데
류현진의 메이저 진출 초기에는 세이버메트리션이 1년만에 매국노가 되더라구요.
선형대수세이지
14/09/30 20:05
수정 아이콘
그건 세이버메트리션이라기보다 세이버 얼치기들이 어그로를 끈 것도 크다고 봅니다. 샘플 케이스가 그렇게 작은 투수를 상대로 세이버메트리션들은 이렇다 저렇다 말 함부로 안하죠, 아니 못하죠. 물론 반대로 어그로를 끌거나 공격한 케이스가 더 많긴 하지만...지금에 와서는 엠팍도 어느 정도 세이버 파가 주류를 점해서 옛날처럼 FIP 가 두들겨 맞는 일은 벌어지지 않을 것 같습니다.
김연우
14/09/30 20:34
수정 아이콘
Fwar로 봐도 1년차 류현진은 대단한거 아닌가요?
선형대수세이지
14/09/30 20:40
수정 아이콘
그게 진출 초기 FIP 는 좋지 못했습니다. 대략 3 점 대 중반 정도인 걸로 아는데...아래 타임트래블 님의 글에도 있지만 샘플 케이스가 1 시즌 정도라 해도 FIP 와 ERA 간 0.5 정도의 차이는 확실히 과대평가다/과소평가다 라고 말할 수 없는 부분인데 하물며 반 시즌은 말할 것도 없었죠. 그런데 그걸 두고 '이래서 FIP 는 쓰레기다' 라고 어그로를 끈 사람도 많았고, '후반기에 류현진 망할 거다' 라고 어그로를 끈 사람도 있었습니다.

뭐 요즘은 전체적으로 다 자정작용이 어느 정도 이루어진 듯 해요. 무엇보다 어그로 꾼은 지속적인 컨텐츠 생산이 불가능하니까 지독한 경우 아니면 사라지죠. 예외는 있지만...사이영X빛같은...
14/09/30 20:50
수정 아이콘
아 얼마전 네이션에서 있었던 그거는요 이전 논쟁하고는 아무 상관 없어요...
선형대수세이지
14/09/30 20:53
수정 아이콘
서로 아무 상관없는 주제이긴 한데, 그 걸로 약간 틈을 보인 사이에 '어 기회다! 물어뜯자!' 하고 득달같이 달려든 감도 없지 않아 있다고 보거든요. 애초에 해야갤 베이스로 태어난 사이트가 청정 공간을 지향했다는 점에서 언젠간 터질 문제라고 생각하긴 했지만.

사실 좀 많이 아쉽긴 하네요, 그 사건 뒤로 다른 분들은 어찌 느끼실 지 모르지만 사이트가 좀 풀이 죽은 것 같긴 해서요. 요 며칠 사이 조금씩 나아지는 것 같긴 한데...
14/09/30 20:59
수정 아이콘
해야갤 베이스라고 하긴 하지만 해야갤보다는 엠바다 같은곳에 가까운 사이트였죠.
청정 공간을 지향하는것 자체는 아무 문제 없었습니다만 운영자의 운영 미숙이 문제가 되었죠

여튼 그 사건 이후 자유게시판도 그렇고 사이트가 많이 죽었죠 그것때문에 글 많이올리는 유저들이 도배규정때문에 짤리기도 하구요
제가 생각하기엔 계속 이렇게 유지되다가 차단당한인원 돌아올때 어떻게 될런지가 관건일듯 하네요
선형대수세이지
14/09/30 21:04
수정 아이콘
엠바다를 지향했지만 운영자 중 한 명은 해야갤 출신에 사실 좀...음...뭐 그랬죠, 그곳에서의 행적이. 해야갤에서 펀딩도 했던 것 같고. 펀딩을 한 건 좋은데 그 이후로 확실하게 선을 긋는 행위나 대처가 좀 미숙했고, 그런 걸 보니 말씀하신대로 운영 미숙이 제일 큰 것 같긴 하네요. XX레인 시즌 2 라는 이야기도 있었고 크크
함순이는함순함순
14/09/30 21:10
수정 아이콘
사이트에 꽤나 애정을 가졌는데 그 이후로 눈팅만 합니다.
운영진 트친도 다 끊어버리구요..

해야갤 출신인건 문제 없어요.
단지 실망했던건 '분명히 과거에 본인이 했던 실언들'이 넷상에 증거로 남아있는데 깔끔하게 사과했다면 저처럼 '과거는 과거고 앞으로가 더 중요하다'라고 생각하는 유저들이 힘이 되어줬을텐데, 무작정 발뺌하고 일관성없는 규정적용으로 신뢰 잃은 철권통치까지...

무튼 그래도 현재 업계(?) 사이트중에서는 최고 퀄리티가 아닌가 싶습니다.
선형대수세이지
14/09/30 21:25
수정 아이콘
아직까지는 최고이긴 한데, 솔직히 얼마나 더 갈 지는 조금 의문이긴 합니다. 한창 물 들어 올 때 노 저어야 했는데 노를 박살내 버린 경우라...

그래도 애증으로 이용하네요. 남의 욕하는 건 좀 그렇지만 다저스 팬 입장에서 다저스 티스토리 블로그 이용하는 거랑 비슷한 느낌이네요. 거기 필진 중 한명은 정말 심성이 꼬였다는 게 뭔 지 제대로 보여주는 인간이지만 정보가 그 쪽으로 들어오니 울며 겨자먹기로...뭐 괜찮은 분들도 많지만요.
14/09/30 21:11
수정 아이콘
운영자중 한명이라지만 사실 그냥 사이트 주인이었고
말이 좋아 펀딩이지 그냥 돈 받은거죠...
선형대수세이지
14/09/30 21:21
수정 아이콘
꼬우면 5만원 돌려준다는 말이 좀 어이터지긴 했습니다.
김연우
14/09/30 19:35
수정 아이콘
그런면에서 수비력이 압도적이었던 왕조시대 sk투수들에 대한 시각은 다소 조정이 필요하다고 봅니다 이대형에 송은범의 사례가 있는 기아를 보면요
선형대수세이지
14/09/30 20:03
수정 아이콘
SK 투수들에 대한 시각 조정은 이미 야구 커뮤니티들에서는 이루어진 편이죠. 말씀하신 김광현과 송은범을 필두로요.
14/09/30 19:36
수정 아이콘
국내 세이버는 응원하는 선수에게 유리한 스텟찾기라는 면이 있긴하죠.
이 선수가 WAR가 좋으면 WAR, 출루율이 좋으면 출루율, ERA가 좋으면 ERA, FIP가 좋으면 FIP..
이중잣대가 되지 않는다면 세이버스텟이 알려지는건 좋은일이죠
14/09/30 19:39
수정 아이콘
그리고 BABIP역시 한가지 가정이 필요합니다. 일반적으로 비슷한 수준의 선수들이 뛰는 리그여야한다는거죠.
아무리 BABIP이 진리라고 해도 한국고딩이 던지는공을 메이저리그 타자가 칠때도 저런 수치가 나오는건 아닙니다.
그리고 그 수준의 평준화는 상위리그로 갈수록 평탄해지고요. 한국리그는 메이저리그에 비하면 '표준편차가 큰' 리그죠.

수비역시 여기에 들어가고...SK왕조시절 SK투수들의 BABIP이 하나같이 평균보다 조금씩 낮은건 우연은 아니겠죠.
WAR도 그렇고 도루의 가치라던가, 번트의가치 등등 세이버스텟을 한국에 그대로 들여오기에는 조금씩은 안 맞는 부분이 있어요.
물론 투승타타보단 100배 낫지만.
선형대수세이지
14/09/30 20:07
수정 아이콘
그렇죠, 그게 기본적인 가정이죠. 비슷한 수준의 선수들이 뛰는 리그. 수준의 평준화는 상위 리그로 갈 수록 평탄해진다기보다 경기수가 많은 리그로 갈 수록, 수준이 비슷한 선수들이 다수인 리그로 갈 수록, 선수들이 많은 리그로 갈 수록 평탄해 진다는 거겠죠. 물론 여기에 해당되는 게 결국 상위리그지만.

kbreport 의 가공 스탯은 어느 정도 조정이 필요하다고 생각하긴 합니다. 하지만 말씀하신대로 투승타타 보다야...
14/09/30 19:50
수정 아이콘
세이버글 볼때마다 생각하는건데 fip이나 war나 앞에 계수들(가령 fip의 홈런 계수는 13 등)을 구할때 분명 메이저 자료를 기준으로 구할텐데 그럼 우리나라에 적용할땐 우리나라 기록을 가지고 계수를 구하는지 또 그렇게 구한 계수들이 메이저 계수와 차이는 없는지 궁금합니다. 분명이 리그 차이가 존재할거 같거든요.
14/09/30 19:52
수정 아이콘
knreport에선 기록 선정시에 한국기준으로 계수를 구해서 계산했다고 나와있습니다.
차이가 어느 정도 존재하긴 하지만, 큰차이가 없었던걸로 기억합니다.
선형대수세이지
14/09/30 20:10
수정 아이콘
천우 님이 말씀해 주셨듯이 당연히 리그마다 변동이 생깁니다. kbreport 도 그 계수를 구한 뒤에 적용하고요. 물론 도저히 답이 없는 경우에는 그냥 메이저 수치로, 잇몸으로 때워 버리지만...선수의 포지션에 따른 수비 가중치를 어찌 구해 볼 방법이 없어서 메이저 수치 쓴다고 알고 있네요. 아니라면 다른 분이 지적해 주시길...
타임트래블
14/09/30 19:53
수정 아이콘
FIP가 의미있는 수치이긴 하지만, 그렇다고 FIP에 지나친 의미를 부여하는 것도 경계해야 합니다. FIP와 ERA가 아주 심한 괴리를 보이는 경우에나 유용합니다. 예를 들어 ERA 3.0 이고 FIP가 3.5 라고 해서 그 투수가 지나치게 운이 좋았다거나 커리어 평균이 3.5에 수렴할 거라고 예단할 수는 없습니다. FIP와 ERA의 상관관계가 높다는 건 ERA가 높아지면 FIP도 덩달아 높아진다는 의미를 내포하고 있기 때문입니다. 유동훈처럼 극단적인 경우에 올해보다 내년에는 이보다 힘들거다 정도를 얘기할 수는 있겠지만, 내년도 ERA가 얼마 정도될 거라 단정할 만큼의 정확도는 FIP에도 없습니다. 통계학적인 관점에서 보자면 FIP나 ERA에 내포된 랜덤오차의 영향을 감안해야 하기 때문에 적어도 1.0 이상 FIP와 ERA의 차이가 있을 때 비교적 정확히 올해 성적이 플루크인지 판정하는 도구로서 유용하다고 생각합니다. 더구나 투수 개인에 따른 차이에 FIP도 영향을 받기 때문에 한 투수의 올해와 내년을 비교하는 목적으로는 유용한 도구지만, 서로 다른 투수를 비교하는 목적으로는 유용성이나 정확도가 크게 떨어지는 지표이기도 합니다.
선형대수세이지
14/09/30 20:19
수정 아이콘
일단 ERA 역시 삼진과 볼넷, 홈런의 영향을 크게 받기 때문에 이 세 가지만 평가하는 FIP 와도 상관관계를 가지는 것이지, ERA 라는 스탯 자체가 FIP 와 직접적인 연동을 가지고 있어 ERA 가 높아지면 FIP 가 높아지는 건 아니죠.

그 외에 FIP 의 미래 예측에 대한 한계에 대해서는 저도 'A 선수의 올해 성적이 운이 좋은 것인지, 나쁜 것인지에 대한 기준점 제공' 이라고만 말해 놓긴 했습니다. 다만 ERA 와 FIP 간의 괴리가 어느 정도이냐에 따라 플루크 여부에 대한 기준을 세울 것인지에 대한 기준은 사람마다 다를 것 같네요. 저 같은 경우는 메이저리그 기준으로 1.0 은 너무 관대하고, 0.5 는 너무 박하다고 생각합니다. 하지만 0.7~8 정도라면 플루크일 가능성이 높다 생각하고요.

다만 경기수도 적고 여러모로 평준화가 덜 된 대한민국의 경우에는 FIP 의 정확성에 대해 경계를 해야한다는 건 동의합니다.
14/09/30 19:57
수정 아이콘
한 선수의 BABIP 변천을 살펴보면 이래저래 흥미로운 점을 많이 찾아볼 수 있습니다.

BABIP .282 (OPS .779)
BABIP .251 (OPS .866)
BABIP .352 (OPS 1.003)
BABIP .299 (OPS .823)
BABIP .278 (OPS .755)
BABIP .245 (OPS .811)
BABIP .161 (OPS .617)
BABIP .242 (OPS .622)

평균: BABIP .281 (OPS .818)
선형대수세이지
14/09/30 20:31
수정 아이콘
으으 딸리는 덕력...메이저리그의 최근 선수는 아닌 것 같은데 한국 선수인지 메쟈 선수인지에 대한 여부도 판가름 내리지 못하겠네요. 준수히 쳐주다가 뜬금 시즌을 보내고 다시 준수한 수준에서 몰락한 선수...누굴까요...
함순이는함순함순
14/09/30 20:41
수정 아이콘
왠지 이현곤 같은데; 맞나요? 크
선형대수세이지
14/09/30 21:18
수정 아이콘
으익 그러고보니...
14/09/30 20:42
수정 아이콘
2004-2011년, 즉 일본에서 뛰던 시기의 이승엽입니다.
(2004-2005 지바) (2006-2010 요미우리) (2011 오릭스)
함순이는함순함순
14/09/30 20:50
수정 아이콘
06승짱 ops가 저것밖에 안되나요? 덜덜덜
40홈런 넘겼는데 1.0 턱걸이라니...;;
2루타를 많이 못 쳤나보네요
14/09/30 20:56
수정 아이콘
장타율은 발군이었는데.....출루율이 .389였거든요. (일본시절 이승엽이 출루율 .330을 넘긴 유일한 시즌입니다.)

이제나 저제나 출루율을 끌어올리지 않으면 OPS에서 1.000을 돌파하긴 쉽지 않지요.
이 시즌에 이승엽보다 10홈런이나 덜 친 후쿠도메는 출루율 .435를 찍은 덕에 무려 1.093의 OPS를 기록했습니다.
함순이는함순함순
14/09/30 21:04
수정 아이콘
avg.352 에 oba가 .389요?;;
와... 저정도 선구안이니 바빕신의 가호를 바랄수 밖에...
승짱의 저런 자세한 성적 보려면 위키로 가야되나요? 아님 레퍼런스?
선형대수세이지
14/09/30 21:17
수정 아이콘
AVG .352 가 아니라 BABIP .352 니까요 크크크 제 기억에 06 이승엽 AVG 가 .320 근처였던 걸로 아는데...확실히 국내에 비해 타율-출루율 갭이 좁아졌죠. 이건 상대적으로 파워가 줄어들으니 출루율이 극적으로 하락한 2013, 2014 아드리안 곤잘레스의 효과가 리그 이동으로 비슷하게 나타난 거지 싶습니다.
14/09/30 21:18
수정 아이콘
출루율이나 OPS는 레퍼런스에서 쉽게 구할 수 있지만, BABIP이나 RC, XR 등의 세이버스탯을 구하려면 널데이터나 베이스볼데이터같은 일본 사이트로 가야 합니다.

그런데 일본 야구관련 사이트들은 한국인들에겐 영 익숙하지 않은 인터페이스로 짜여져 있어서 (예를 들자면, 데이터베이스가 연도별로 분리되어 있습니다.) 그다지 접근이 쉽지 않습니다.
선형대수세이지
14/09/30 23:15
수정 아이콘
으익 그러고보니...
14/09/30 20:20
수정 아이콘
본문에서 제가 생각하는 컨셉만 간단하게 요약해 봤습니다.

1. BABIP

타구가 안타가 될지, 아니면 야수의 수비범위 안으로 가 타자를 아웃시킬지 여부가 투수의 능력(예를 들어 투수의 구위는 범타에 큰 영향을 주는가?)과 관련이 있는지를 통계적으로 조사해보니 통념과는 다르게 투수 간에 유의미한 차이를 보이지 않았다.

2. FIP

따라서 투수의 순수한 능력을 평가하기 위해 수비를 배제하고 우리가 확실하게 알 수 있는 요소(삼진, 볼넷, 홈런)들로만 수학적으로 이것들이 점수에 얼마나 영향을 주는지를 계산하여 하나의 수식으로 만들어 리그의 평균 ERA와 같도록 보정한 것이 FIP이다.
선형대수세이지
14/09/30 20:27
수정 아이콘
정확하십니다. 졸필을 이렇게 이해해 주시니 이해력에 감사를 드리네요. 물론 BABIP 의 경우에는 어느 정도 예외가 존재하므로 그걸 감안한 세부 연구와 스탯들이 진행되었고 진행중이긴 합니다. 하지만 그게 그리 크지 않다는 데에는 다들 동의하고 있는 상태고요.
미라이
14/09/30 20:23
수정 아이콘
FIP는 피홈런의 비중이 너무 큰게 좀 아쉽죠. 홈런 또한 투수보다 타자가 제어하는 부분이 크고 변수도 많고 운의 영향을 많이 받죠. 그리고 많은
숫자가 아니기때문에 시즌중엔 특히 오차가 많이 생기는것같아요. ERA보다 나은점도 있지만 단점도 있는 스탯같아요.
선형대수세이지
14/09/30 20:26
수정 아이콘
일단 한 줄 뿐이긴 하지만 홈런에 대한 이야기는 써 놨습니다 크크 완벽한 면피용...

확실히 어느 정도 ERA 과 큰 괴리가 난다면 단언할 순 있지만, 당장 내년을 예측하기엔 애매하죠. 위에도 써 놨지만 400~500 이닝이 최적의 신뢰도를 가지는 구간이라는 것도 있고...보통은 플루크 여부를 가릴 때에 제한적으로 사용하는 게 미래 예측을 위해 사용할 때에는 최적의 용도인 것 같습니다.
함순이는함순함순
14/09/30 20:35
수정 아이콘
10년에 babip이론을 처음 접했을때의 충격이 엊그제 같은데 이렇게 pgr에서 fip글을 읽고있자니 기분이 묘하네요 흐흐

저도 처음엔 sbs의 fip언급이 매우 고까웠었는데, '의도야 어땠든 일단 첫 발걸음 내딛었다'라고 생각하니 한결 편해지더군요.
확실히 난사람 한명이 중요합니다 그 어떤 설명보다도 류현진 한명 끼여있는게 주목도든, 파급력이든 넘사벽이네요 크
14/09/30 20:40
수정 아이콘
올시즌 KBO의 기괴할 정도의 타고투저에서 느끼는 특이점이라면, 타자의 실력을 불문하고 타자들의 BABIP이 거의 일률적으로 폭등했다는 것입니다.

그래서인지 올해 KBO의 타고투저 원인은 외국인타자들의 유입이나 갑작스런 투수들의 수준하락보다는 모두에게 일률적으로 적용되는 파라미터인 공인구나 존 쪽에 원인이 있는 것이 아닌가 생각하게 되더군요.
선형대수세이지
14/09/30 20:43
수정 아이콘
뭐 거의 확신 수준 아닌가요? 배트보다도 공인구 쪽이 훨씬 조치하기 쉬웠을 테니 아무래도 그 쪽이겠죠. 9 구단 OPS 가 .800 에 근접하거나 넘어가는 이 기현상은 그 외에는 무엇으로도 설명이 안 된다고 봅니다. 삼진이 많이 줄긴 햇지만 이대형이 .298의 타율을 기록하고 있습니다 크크
14/09/30 20:49
수정 아이콘
그래서인지 올시즌의 기록만 보고 "A 타자 부활!!!" "B 타자 브레이크아웃!!!" "C 투수 망했다!!!" "D 투수 방출하자!!" 등등을 주장하는 것은 많이 성급하다고 할 수 있겠지요. 올시즌의 투타밸런스 붕괴는 KBO가 아니라 전 세계적으로도 손꼽을 정도의 역사적 사건이라, 올해의 기록만을 토대로 선수를 평가하거나 내년의 기록을 예측하는 것에는 매우 신중해야 할 것 같습니다. (내년에도 이 미친 현상이 계속된다면 또 모르겠지만요).

2014년의 기록을 별도의 조정과정을 거치지 않은 raw stat으로 활용한다면 상당한 왜곡을 불러일으킬지도 모르겠습니다.
미움의제국
14/09/30 21:39
수정 아이콘
공인구와, 스트존의 영향이라고 대충은 생각하고 있는데

올시즌 끝나면 분석적으로 답이 나오겠죠?
선형대수세이지
14/09/30 21:41
수정 아이콘
측정할 수 있는 수단이 마련되어 있지 않다면 분석적인 답은 영원히 나오지 않죠. 정확한 타구 비거리와 심판들의 콜링 판정을 분석할 수 있으면 좋은데, 그건 메이저리그에서도 비교적 최근에야 도입된 거라서...
bellhorn
14/09/30 21:45
수정 아이콘
참고로 투수가 제어하지 못해!! 는 반쯤은 틀린말입니다. 플라이볼피쳐와 땅볼투수가 있어서...
영원이란
14/09/30 21:48
수정 아이콘
정확히는 투수는 타구의 방향을 제어하기 어렵다는 거지요. 플라이볼과 땅볼의 발생은 공의 상승무브먼트 및 높낮이에 따라서 달라지는거라.
bellhorn
14/09/30 21:49
수정 아이콘
그렇죠. 다만 투수가 던지는 구질에 따라서 약간은 영향을 받기도 합니다.
영원이란
14/09/30 22:03
수정 아이콘
네 구질에 따라 달라지죠. 각 구질이 가지는 고유한 무브먼트가 있으니까요.
bellhorn
14/09/30 21:48
수정 아이콘
다만 신기하게도(?) 바빕은 플라이볼 피쳐가 더 낮....
선형대수세이지
14/09/30 21:49
수정 아이콘
네, 절대 제로가 아니죠. 비단 그라운드볼러와 플라이볼러의 구분 뿐만이 아니라 BABIP 자체에도 투수는 영향을 끼치죠. 본문에도 그 점은 분명히 했습니다. 초창기에 맥크라켄이 자신의 주장을 보다 명료히 하려고, 혹은 깔끔하게 보이려고 흔히들 하는 데이터 조작을 하기도 했었고요. 단지 수소 원자 모형이 현재 옳지 않다는 걸 알아도 그 뒤의 단계를 배우기 위해 학습하는 것처럼, FIP 의 개념은 이러한데 사실 완벽히 맞는 말은 아닙니다' 라는 거죠.
영원이란
14/09/30 21:47
수정 아이콘
FIP는 대체적으로 좋은 스탯이나, 만능은 아니지요. 이미 잘 설명해주셨지만. 또한 이닝 소화가 적은 투수에게는(특히 불펜투수) 약간 설명력이 떨어지는 모습도 보여줍니다.
BABIP는 가끔 무조건 평균치로 수렴한다로 잘못알고 계시는 분들이 계시더라고요. BABIP는 (정확히는 DIPS 이론은) 타자나 투수의 성적이 오르는 이유나 내려가는 이유를 설명하는 훌륭한 도구이지만 잘못파악하면 실제 타자나 투수의 실력이 미치는 영향을 너무 간과한다는 문제가 있습니다. 이 투수는 BABIP가 왜 평균보다 낮냐? 이 타자는 왜 BABIP가 평균보다 높냐는 좀 더 면밀하게 파악해야할 문제지요.
선형대수세이지
14/09/30 21:54
수정 아이콘
타자의 BABIP 는 사실 아주 극단적으로 높은 경우가 아니라면 갑자기 확 높아 졌다고 해도 무조건 뽀록이야 라고 바라볼 순 없죠, 본인의 디시플린이 극적으로 영향을 끼치는 부분이니. 단적으로 올해의 저스틴 터너가 있는데, 전 4할에 달하는 터너의 BABIP 가 내년에도 그대로 유지되진 않겠지만, .320 정도이던 본인의 평균보다는 높아질 것 같습니다. 다저스에서 맥과이어 코치의 코칭을 받은 후 분명히 히팅 존이 좁아지고, 볼넷이 늘며 루킹 삼진이 늘었어요.

이닝 소화가 적은 투수는 뭐 표본 크기의 문제고 이건 모든 스탯이 벗어날 수 없는 단점이죠 흐. 또 DIPS, FIP 가 사실 완벽한 건 절대 아닌데 원래 다들 처음 뭔가 파악하면 뿌듯해서 그걸 과신하는 경향이 있어서...그래도 위에서도 말했듯이, 이런 부작용이 다 사람들이 알아간다는 긍정적인 신호라고 받아들이고는 있습니다 크크
영원이란
14/09/30 22:05
수정 아이콘
가끔 세이버 얘기하는 사람중에 투수는 타구의질을 제어할 수 없다라는 얘기를 무조건 신봉하는 사람이 있는게 문제지요. 크크. 특히 모 공원사이트에서 작년만 해도 아주 자주 보였고.. 타자 바빕은 모 선수 까는데도 자주 이용 되고 그렇지요. 바빕이 높아졌다고 무조건 플루크다 라고 우기는 사람들이 있어서..
14/09/30 22:26
수정 아이콘
애시당초 플루크라는 것이 평균으로부터 일탈한 outlier를 지칭하는 개념인지라, 플루크라는 것을 입증하려면 평균으로부터의 일탈이 다시 평균으로 돌아오는 과정이 확인되어야 하죠. 영원이란님이 말씀하신대로 BABIP의 급격한 상승만으로 플루크라 칭할 수는 없습니다. 대신 한번 올라간 BABIP이 유지되지 않고 다시 폭락해버린다면 그것은 플루크겠지요.

플루크로 유명한 선수들의 예를 들어 설명하자면,
타격왕시절 이현곤: 대충 3할 언저리의 BABIP -> 2007년에 무려 .379 기록 -> 이후 다시 평균치로 회귀 : 따라서 2007 이현곤은 플루크
일본에서의 이승엽: 대충 2할 후반대의 BABIP -> 2006년에 무려 .351로 폭증 -> 이후 다시 BABIP 2할 후반대로 회귀: 따라서 2006 이승엽은 플루크

반면 플루크로 의심되었으나 알고보니 아니었던 선수의 예로, 2011년까지 평균 3할 언저리의 BABIP을 기록하던 앤드류 맥커첸은 2012년의 BABIP이 무려 .375까지 뛰어오릅니다. 플루크를 의심하기에 충분한 변화폭이지요. 그런데 2013년도 2014년도 3할 5푼 이상의 BABIP을 유지합니다. 이렇게 평균 자체가 상승했다면 플루크가 아니라고 할 수 있겠습니다.
영원이란
14/09/30 22:27
수정 아이콘
그렇지요. 그런데 1시즌 데이터로 플루크라고 우기는 사람들이 의외로 많다는게 문제지요.
14/09/30 22:37
수정 아이콘
플루크를 입증하려면 4~5시즌의 데이터 축적은 필요할 겁니다. 각종 수치의 안정화에 그 정도 시간이 걸린다고 하니까요.

그런데 거꾸로 말해서 이미 4~5시즌의 데이터를 축적한 선수가 갑자기 BABIP에서 급격한 변화를 보인다면 그것은 플루크라고 의심할만한 정황이라고 할 수 있겠지요. 물론 그 이후의 평균회귀를 확인할 수 있으면 더 확실하겠지만요.

그리고 단기간의 데이터지만 현실의 범주를 벗어날 정도로 극단적인 데이터가 산출된다면 그것은 그 자체로도 플루크를 의심할 수도 있을 겁니다. 예를 들어 2013년 채태인의 BABIP .472는 인간이 기록할 수가 있는 수치가 아니었다는 점에서 어떻게 생각해도 평균회귀를 예상할 수밖에 없었지요. 물론 올해도 BABIP .360을 기록하는 대단한 활약을 보여주고는 있습니다만, 올해는 비현실적일 정도의 타고투저로 타자들의 BABIP이 이상할 정도로 상승했다는 점을 고려하면 요모조모 더 뜯어볼 여지가 있겠지요.
영원이란
14/09/30 22:52
수정 아이콘
채태인의 경우는 좀 다른게 라인드라이브 타구가 굉장히 많이 나오죠. 물론 말씀하신대로 내년을 지켜봐야 할 여지는 있지만, 히팅스타일상 바빕이 급격히 하락하지는 않을듯 합니다.
영원이란
14/09/30 22:13
수정 아이콘
사실 국내에서 세이버 스탯은 스탯의 의미도 정확히 모르고 특정선수를 까거나 띄우는데 이용되는 경우가 많아서 말이죠. OPS를 만능 취급하는 분들도 자주 보이시고, 세이버에서 가하는 조정이라는게 어떤 조정인지에 대한 고찰도 없이 조정스탯만 가지고 무조건 1:1 비교를 시도한다던가..
세이버매트릭스가 끊임없는 연구와 개량을 거치고 스탯이 쓰이는 목적과 한계를 정확히 파악하고 선수를 비교해야 올바른 사용이라고 할 수 있는데, 국내에서는 유독 스탯 만능론이 심해서 좀 그렇더라고요. 세이버의 결정체라고 불리는 WAR도 아직은 많은 개량이 필요하고 (WAR이 만능이라면 bWAR, fWAR 등 WAR 정보를 제공하는 사이트 별로 WAR이 다를 이유가 없지요) 수비 스탯인 UZR은 안정화 표본에 3시즌가량 데이터가 필요한 약점도 있고 계속 개량중이죠. 또한 파크팩터 조정이라던가 각종 보정도 100% 완벽하진 않죠. 그런데 미세한 차이가 나는 선수들을 줄세우기 하면서 파이어 내는 경우가 워낙에 잦다 보니..
선형대수세이지
14/09/30 22:15
수정 아이콘
그런데 사실 세이버 스탯들 자체가 VS 용도에 너무 좋긴 합니다 크. 또 사실 충분한 수의 덕후들이 생산되어 있다면 그런 VS 를 하다가 자신의 주장을 증명하기 위해 또 다른 가공 스탯을 찾아내고 하긴 할 텐데, 우리나라는 특히 좀 류현진을 까기 위해서든 빨기 위해서든 류 vs 누구누구의 쓸데없는 vs 가 많이 벌어지긴 하죠.
영원이란
14/09/30 22:17
수정 아이콘
작년에만 류만 그랬다면 올해는 다저스 선수 전방위로 확대되었다고 할려나요. 한국야구는 뭐 스탯도 부족하다 보니 OPS를 만능취급하는 위험한 분위기도 있고요..
잠수중
14/09/30 22:23
수정 아이콘
우연히 엔하위키에서 FIP 관련 자료 보다 단기간에 xFIP, SIERa,pFIP가 더 좋다는 말이 나오던데(님이 쓰신 본문에서 나오지만요^^)
여기서 용어 질문이요
FIP- 조정 FIP이고
SIERa는 기존의 FIP에 그라운드볼 /플라이볼 비율해서 평가한거고
xFIP은 기존의 FIP에 홈런/플라이볼 비율해서 평가 한거고
pFIP은 어떤 건가요?
기존 FIP에 Def(수비기여도) 플러스한 스텟인가요?
영원이란
14/09/30 22:28
수정 아이콘
predictive FIP 라고 아네요. 기존의 fip 스탯의 계수를 조정해서 조금 더 미래 예측력을 높인 스탯이라고 합니다.
잠수중
14/09/30 22:31
수정 아이콘
답변 감사합니다.
알고보니 predictive의 약자군요
역시 야구은 알면 알수록 복잡하고 어렵네요^^
많이 배우고 갑니다.
선형대수세이지
14/09/30 22:56
수정 아이콘
영원이란 님의 설명에 살짝 보충을 하면 pFIP는 설명에도 나와 있듯이 오직 미래예측을 위한 스탯입니다.

FIP 와의 차이는, FIP 의 홈런,볼넷,삼진 계수는 실제로 그 해의 실점 상황에 바탕해 각각의 결과값이 실점에 끼치는 비중의 비로 구해집니다. 그 비를 정수화 한 것이 13 대 3 대 -2 인거고요.

반면 pFIP 는 전해의 홈런, 볼넷, 삼진이 다음 시즌 투수의 RA/9 과 어느 정도 연관성을 보여줬는지 계산하고, 어찌보면 이는 각 스탯의 미래 예측 능력의 비를 구하는 셈입니다. 꽤 전 이야기라 지금은 그 비가 달라졌을 수도 있지만, 저는 그 비중을 대략 7 대 1.6 대 -2 로 알고 있고요.

보시다시피 홈런과 볼넷의 비중이 줄었습니다. 그리고 상대적으로 삼진의 비중이 늘었는데, 이건 실제 실점 상황에서의 비는 아닙니다. 각각의 스탯이 다음 시즌 실점을 예측할 때 통계적으로 이 정도 비중이 있더라 라는 이야기입니다.

삼진의 중요성이 크게 늘었고 이는 어찌보면 당연한 게 투수의 미래는 퓨어 스터프가 크게 좌우하니까요. 볼넷은 교정할 수 있다는 이야기이고, 피홈런은 삼진을 잡을 스터프가 좋으면 좋을 수록 같이 감소하는 게 일반적이니.

결국 모든 세이버스탯이 그렇듯, pFIP 도 일반적인 이야기입니다. 스터프 좋은 놈일수록 터질 확률도 높다는 거죠.

보충설명 해주실 수 있는 분이 계심 좋을텐데요. 뭔가 부족하게 설명한 거 같은데 덕력이 딸리니 글이 안 써지네요 크
14/09/30 22:51
수정 아이콘
결국 어떤 스탯도 만능은 아니고, 한 선수를 판단할 때에는 여러 스탯을 보면서 비교하고 보완해야 한다는 일반론이 최선인 것 같습니다. 저에게는 BABIP는 정말 충격 그 자체였어서 세이버 근본주의자스러운 면이 있기는 해서 이걸 의식하면서 컨트롤 하는게 쉽지는 않네요.
선형대수세이지
14/09/30 22:58
수정 아이콘
본래 원론적인 이야기가 가장 옳은 말이죠. 세상은 롸끈한 걸 원하지만 크
14/09/30 22:55
수정 아이콘
여기 많은 야구덕후님들께 좋은소식 하나 알려드리자면 스탯티즈 내년 시즌을 목표로 오픈준비중인걸로 압니다. 우리모두 행복한 스탯덕후질을 합시다.
선형대수세이지
14/09/30 22:59
수정 아이콘
오오...kbreport 와 경쟁하면서 견제하는 그림이 좋게 나왔으면 합니다 크크
애패는 엄마
14/10/01 00:09
수정 아이콘
사실 비교라는 건 세이버 스탯을 만능으로 생각해서라는 문제보다는 보통 비교 자체 마인드에 문제를 가지고 있을 경우가 많죠. 조정이나 세이버가 다 설명해주지 않는다면서 클래식 스탯만으로 비교하는 것도 역시 이상해질텐데 그런식 접근도 많아요. 그렇다면 아직 미진한 로우 스탯이 존재하는 상황에서 비교 자체를 왜 들고 오느냐라는 말로 귀결되어야 하는게 맞는데 말인데. 근데 막상 비교라는 건 인간에 있어서 스포츠에 있어서 가장 재밌는 부분이긴 하죠.
문제는 스탯을 접하기 전에 내가 어떻게 쓰고자 하는 자세일겁니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
공지 [일반] [공지]2024년 4월 총선을 앞두고 선거게시판을 오픈합니다 → 오픈완료 [53] jjohny=쿠마 24/03/09 27807 6
공지 [정치] [공지] 정치카테고리 운영 규칙을 변경합니다. [허들 적용 완료] [126] 오호 20/12/30 249888 0
공지 [일반] 자유게시판 글 작성시의 표현 사용에 대해 다시 공지드립니다. [16] empty 19/02/25 326017 8
공지 [일반] [필독] 성인 정보를 포함하는 글에 대한 공지입니다 [51] OrBef 16/05/03 448956 28
공지 [일반] 통합 규정(2019.11.8. 개정) [2] jjohny=쿠마 19/11/08 319271 3
101348 [일반] [개발] re: 제로부터 시작하는 기술 블로그(完) Kaestro591 24/04/26 591 0
101347 [일반] 테일러 스위프트 에라스 투어 도쿄 공연 후기 (2/7) [3] 간옹손건미축1264 24/04/26 1264 4
101346 [일반] 민희진씨 기자회견 내용만 보고 생각해본 본인 입장 [229] 수지짜응11273 24/04/25 11273 5
101345 [일반] 나이 40살.. 무시무시한 공포의 당뇨병에 걸렸습니다 [38] 허스키5307 24/04/25 5307 5
101344 [일반] 고인 뜻과 관계없이 형제자매에게 상속 유류분 할당은 위헌 [38] 라이언 덕후5121 24/04/25 5121 1
101295 [일반] 추천게시판 운영위원 신규모집(~4/30) [3] jjohny=쿠마16588 24/04/17 16588 5
101343 [일반] 다윈의 악마, 다윈의 천사 (부제 : 평범한 한국인을 위한 진화론) [47] 오지의4863 24/04/24 4863 11
101342 [정치] [서평]을 빙자한 지방 소멸 잡썰, '한국 도시의 미래' [17] 사람되고싶다2484 24/04/24 2484 0
101341 [정치] 나중이 아니라 지금, 국민연금에 세금을 투입해야 합니다 [57] 사부작3856 24/04/24 3856 0
101340 [일반] 미국 대선의 예상치 못한 그 이름, '케네디' [59] Davi4ever9124 24/04/24 9124 4
101339 [일반] [해석] 인스타 릴스 '사진찍는 꿀팁' 해석 [15] *alchemist*4859 24/04/24 4859 11
101338 [일반] 범죄도시4 보고왔습니다.(스포X) [44] 네오짱6792 24/04/24 6792 5
101337 [일반] 저는 외로워서 퇴사를 결심했고, 이젠 아닙니다 [27] Kaestro6276 24/04/24 6276 16
101336 [일반] 틱톡강제매각법 美 상원의회 통과…1년내 안 팔면 美서 서비스 금지 [33] EnergyFlow4304 24/04/24 4304 2
101334 [정치] 이와중에 소리 없이 국익을 말아먹는 김건희 여사 [17] 미카노아3661 24/04/24 3661 0
101333 [일반] [개발]re: 제로부터 시작하는 기술 블로그(2) [14] Kaestro2958 24/04/23 2958 3
101332 [정치] 국민연금 더무서운이야기 [127] 오사십오9877 24/04/23 9877 0
101331 [일반] 기독교 난제) 구원을 위해서 꼭 모든 진리를 정확히 알아야 하는 것은 아니다 [87] 푸른잔향4282 24/04/23 4282 8
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로