Rehabilitation Facility

gminhee.egloos.com

포토로그



빌 제임스와 세이버매트릭스 - 숫자놀음, 방어율(ERA), FIP 야생야사


바둑에는 정석이 있다. 물론 정석을 몰라도 바둑을 둘 수는 있다. 하지만 고수가 되기 위해서는 필수다. 컴퓨터 프로그램에도 비슷한 것이 있다. 알고리즘이 그것이다.

알고리즘을 모르면 프로그래머가 될 수 없었던 시대가 있었다. 4세대 언어가 등장한 이후에 알고리즘을 몰라도 프로그래머 행세를 할 수 있는 시대가 되었다. 성형기술의 발달로 미인들이, 약물(스테로이드)의 발달로 스포츠 우월자들이 대량 양산된 것과 동일하다.

<참고> 아시아 야구사 역대 최고 스테로이드맨 노모히데오


2.18 × N × log(N) + 12.85

위의 공식을 보면 그럴듯해 보이지만, 사실 아무 것도 아니다. 하지만 인터넷 양아치들에게는 대단하게 보인다. 그 이유가 있다.

지능과 운동능력은 인간의 우월함을 상징한다. 인간은 본능적으로 지능과 운동능력이 우월해 보이는 사람에게 호감을 갖는다. 수학은 논리의 기본이며, 논리가 뛰어난 사람은 지능이 뛰어날 가능성도 높다.

그렇다면 그럴듯해 보이는 공식을 이해한다는 것은 지능이 뛰어난 사람일 가능성이 높다는 것을 의미할까?

사실은 허영심이 만든 착각에 지나지 않는다. 그리고 그 허영심은 희대의 상병신 빌 제임스를 우월한 인간으로 포장했던 것이다.


2.18 × N × log(N) + 12.85

위의 공식처럼 알고리즘에는 상수가 사용되는 경우가 있는데, 이런 상수를 "변수에 의해 검증된 숫자"라고 한다. 쉽게 말해서 믿고 사용해도 되는 숫자라는 뜻이다. 황금비율과 동일한 개념으로 이해하면 된다.

그렇다면 투수의 기량을 측정하는데 있어서 가장 중요하다는 ERA, FIP는 어떻게 설명해야 하나?

[ERA] 자책점 × 9 ÷ 이닝
[FIP]  HR x 13 + (BB + HBP - IBB) x 3 - K x 2) / IP + 리그에 따라 변동하는 수치


ERA에 사용되는 상수 9와 FIP에 사용되는 상수 13, 3, 2는 과연 변수에 의해 검증된, 믿고 사용해도 되는 확실한 숫자인가?


타율과 방어율은 비슷한 비율 기록인 것 같지만 천지차이다. 타율은 결과 비율이지만 방어율은 가상 비율이다. 그렇다면 승/패를 구별하는 야구에서 가상 비율을 가장 중요하게 평가한다는 것인데, 그런 미친 짓이 세상에 어디있나?

야구에 사용되는 공식은 공식이라고 말하기도 힘든 수준이다. 미천한 난이도에 지나지 않는다. 그러나 인터넷 양아치들이 야구의 숫자놀음을 경험하는 순간 지능을 가늠하는 척도로 둔갑하게 된다. 그런데 웃기는 건, 공식에 사용되는 상수를 설명하지 못한다는 사실이다.

85년 김시진 - 47경기 25승 5패 10세이브 269.2이닝 (2.00)
86년 선동열 - 39경기 24승 6패   6세이브 262.2이닝 (0.99)


85년 김시진과 86년 선동열은 최강팀 에이스였고, 방어율을 제외하고는 모든 기록에서 김시진이 우위라는 사실을 확인할 수 있다. 그런데 황당하게도 숫자놀음으로는 86년 선동열이 85년 김시진보다 압도적인 투수로 나온다고 한다.

복잡하게 따질 필요 없이 숫자놀음에 사용되는 상수를 논리적으로 설명할 수 있을 때까지 숫자놀음은 개수작으로 정의해야 한다!


백남준은 이런 말을 했다. "예술은 반이 사기다. 속이고 속는 것이다. 사기 중에서도 고등 사기다."

예술처럼 추상적 또는 애매한 분야는 사기치기가 용이하다. 야구판의 숫자놀음도 마찬가지다. 희대의 상병신 빌 제임스와 세이버매트리션이라 불리는 인터넷 양아치들의 개수작은 지적 열등감과 허영심에서 비롯된 것이다.

설명 불가능한 상수가 사용되는 논리는 존재할 수가 없다. 즉 야구판에서 사용되는 대부분의 숫자놀음이 사기극인 것이다.


[ 방어율은 경험적 기록이며 식별자 용도 ]

85년 김시진 - 47경기 25승 5패 10세이브 269.2이닝 (2.00)
86년 선동열 - 39경기 24승 6패   6세이브 262.2이닝 (0.99)


김시진, 선동열의 기록이 동일 시즌 기록이라고 가정을 하자. 그리고 사이영상 수상자를 결정한다면 누가 적합할까?

방어율을 제외한 주요 기록에서 김시진이 선동열보다 우위지만 큰 격차를 보이는 항목은 사실상 없다. 하지만 방어율은 선동열이 김시진보다 월등히 좋기 때문에 선동열이 적합할 것이다. 즉 방어율이 식별자 역할을 한 것이다.

그렇다면 MVP 경우에는 어떻게 되나? MVP는 가장 가치있는 활약이라는 관점에서 평가해야 한다.

김시진이 무려 47경기에 등판했다는 사실에 주목해야 한다. 야구에서 최고의 가치는 이기는 것이다. 김시진은 선동열에 비해 무려 8경기나 많이 등판했고 1승이, 그리고 4세이브가 더 많다. 당연히 MVP는 김시진이 적합할 것이다.


이번에는 방어율이 경험적 기록인 이유를 알아보자.

미인의 기준은 시대에 따라 다르다. 방어율 공식에 사용되는 상수(9)는 설명이 불가능하며, 따라서 미인의 기준처럼 애매하다. 결국 시대에 따라 경험을 토대로 방어율의 가치를 해석해야 하는데,

일반적으로 선발투수의 경우에는 3점대 방어율까지, 불펜투수의 경우에는 2점대 방어율까지는 사실상 동일하게 평가해야 한다. 실제로 1점대 방어율의 선발투수와 3점대 방어율의 선발투수가 진검승부를 하는 포스트시즌에서 맞대결을 하게 되면, 단순히 방어율로는 그 어떤 전문가도 결과를 장담하기 힘들다. 예상도 불가능하다. 그럴 수 밖에 없는 이유가 있다.


에이스의 덕목은 로테이션과 이닝이팅이다. 특히 로테이션은 방어율에 지대한 영향을 끼친다.

야구팬들이 로테이션이 방어율에 끼치는 영향을 이해한다는 것은 불가능하다. 하지만 방법이 있다. 실험을 통해서 체험할 수 있다.

3시간 정도 걸리는 등산 코스를 물색한 다음 [4일 휴식 - 1일 등산]의 로테이션을 8번 반복하면 어떤 패턴이 있다는 사실을 알게 된다. 4일의 휴식기간 동안 컨디션 조절을 아무리 잘 해도 한계가 있다는 사실을 알게 된다. 인간은 기계가 아니기 때문이다.

특별히 먹고 싶은 음식이 생각날 수도 있고, 예정에 없던 사람들을 만나서 어떤 자리에 참석하는 경우가 생길 수도 있다. 컨디션 조절이 그래서 힘든 것이다. 프로스포츠 선수들에게 사생활이 중요한 이유가 바로 이 때문이다. 어쨌든 패턴은 다음과 같은 형태이다.

8번의 로테이션에서 컨디션이 좋은 날은 최대 4번, 그리고 2번은 컨디션이 나쁘고 나머지 2번은 좋지도 나쁘지도 않다.

실력있는 에이스는 컨디션이 좋은 4번 중에서 3승, 그리고 나머지 4번 중에서 1승을 거둘 수 있는데, 이러한 패턴이 정규시즌에서 4번 반복되기 때문에 약 15승이 가능하다는 계산이 나온다.

소속팀 전력이 좋고 타선 지원을 잘 받으면, 즉 운이 좋은 시즌에는 20승 이상도 가능하겠지만, 반대로 불운한 시즌에는 10승이 불가능할 수도 있다. 15승을 기준으로 (+/-)5승은 순전히 운에 달려있다는 것이다. 그리고 방어율에는 다음과 같은 영향을 끼친다.

완성도가 높은 투수의 경우에는 좋지도 나쁘지도 않는 2경기에서도 실점을 최소화 할 수 있다. 컨디션이 나쁜 날의 많은 실점은 완성도가 높은 투수도 피할 수 있는 방법이 없다. 단, 실점이 많아도 많은 이닝을 소화할 수는 있다. 그래서 투수의 완성도가 중요한 것이다.

결국 로테이션을 거르지 않고 많은 이닝을 소화하는 에이스는 어떤 리그가 되었든 방어율 관리에 한계가 있을 수밖에 없다. 컨디션이 나쁜 날의 많은 실점을 피할 수 없기 때문이다.


그렇다면 리그 최고의 에이스가 로테이션을 거르지 않고 200이닝 이상 던졌을 경우에 방어율은 어느 정도까지 가능할까?

아무리 뛰어난 에이스라도 1점대 방어율은 불가능하다고 봐야 한다. 컨디션이 좋은 날은 기껏해야 50%에 불과하기 때문이다. 나머지 50% 등판에서, 그 중에서도 컨디션이 나쁜 25% 등판에서 방어율을 까먹기 때문이다.


그렇다면 컨디션이 나쁜 25%를 생략하면 어떻게 될까?

방어율을 최소한 50% 이상 내릴 수 있다. 해당되는 대표적인 투수가 선동열이다. 컨디션 나쁜 날의 등판을 피할 수만 있다면 방어율 관리에 유리하다. 그런 등판이 어떻게 가능했는지가 의문일 뿐이다.


그렇다면 로테이션을 지키지 않고 무차별 등판을 하면 어떻게 될까?

방어율은 최소한 50% 이상 상승한다. 로테이션을 무시하는 등판에는 두 가지 방법이 있다. 컨디션 나쁜 날은 피해서 등판하는 방법과 컨디션과 상관없이 무차별 등판하는 방법이 있다. 둘 다 로테이션은 존재할 수 없다.

하지만 차이점이 있다. 최소한 50% 이상의 방어율 하락과 상승의 차이가 발생한다. 2.0 방어율이 가능한 투수가 1.0이 될 수도 있고 3.0이 될 수도 있다는 뜻이다. 전자는 선동열(1.20)이고 후자는 최동원(2.46)이다.

그런데 최동원의 경우에는 설명이 불가능하다. 부상에서 회복된 84 ~ 86년동안의 등판은 인간이 가능한 것이 아니기 때문이다. 현재와 비교해서 정규시즌 일정이 평균적으로 20일 정도 짧았고 3년동안의 총 경기수는 318경기였다.

최동원은 롯데가 치룬 318경기 중에서 무려 41.5%를 등판했고(132경기), 776.2이닝을 던졌다(한국시리즈 40이닝까지 포함하면 816.2이닝). 3년연속 기간동안 엽기적인 등판을 하고 2.40/1.92/1.55 방어율은 불가능하다. 관련하여 선동열은 하일성과의 인터뷰에서 최동원에 대해서 이렇게 말하기도 했다(주간야구 1988년 9월 14일 발행).

하일성: 일본 프로야구에 가면 몇 승이나 할 것 같으냐?
선동열: 10승은 자신 있고요. 그 다음은 잘 모르겠어요. 86년에 한큐의 카지모토씨가 왔을 때 10승은 너끈히 할 거라고 하대요.

하일성: 미국에 가면?
선동열: 메이저리그는 꿈도 못 꾸고 트리플에이(AAA)쯤에서 뛰겠죠.
..........

하일성: 언제까지 지금같이 던질 수 있을 것 같으냐?
선동열: 3년쯤은 던지겠죠. 그런 것 보면 동원이 형은 굉장한 투수에요. 앞으로 그런 투수는 태어나기 힘들 거에요.


만약 선동열이 최동원처럼 등판했다면?

등판 자체가 불가능하다. 억지로라도 등판할 경우에는 두 자릿수 방어율 확정이라고 보면 된다. 1.20이 아니라 12.0이라는 뜻이다.

<참고> 선동열에게 사용되는 국보급 투수라는 수식어는 정당한가?


진지한 경험과 고뇌만이 방어율 기록의 가치를 이해할 수 있게 해 줄 것이다. 그것을 시도하지도 않았고, 시도할 생각도 없는 인터넷 양아치들이 함부로 거론할 수 있는 주제가 아닌 것이다.

방어율은 (가상)비율 기록이다. 승/패를 구별하는 팀-워크 스포츠 야구에서 방어율이 중요한 기록으로 인식되어서는 안 될 것이다. 방치할 경우에는 가짜 에이스들이 양산될 것이며, 돈벌이 수단으로 이용하려는 사기꾼(세이버매트리션)들이 활개를 치게 될 것이다. 이것이 바로 방어율을 경계해야 하는 이유인 것이다!



> 반론/의견은 여기를 클릭하세요.