화창한 하늘 아래

www.thegoodphight.com에 실린 박찬호 관련 글이다. 

시범경기 결과로만 판단하기에는 통계적으로 불충분하지만, 메이저리그 통산 박찬호의 삼진비율과 볼넷비율이 19.7%, 10.4% 인데 비해, 시범경기 삼진비율과 볼넷비율이 각각 29.4%, 2.4%를 기록한 것이 놀라울 정도라고 적고 있으며 과거 박찬호와 무언가 다르다고 평가하고 있다.


박찬호, 그는 누구인가? - Chan WHO Park?

Chan WHO Park? by MattS on Mar 30, 2009 10:28 PM EDT 

스프링 트레이닝 기간 동안 나는 JA 햅이 5선발 경쟁에서 승리하기를 응원하며 시간을 보냈다. 그렇다고 박찬호가 실패하기를 바랬던 것은 아니다. 스프링 트레이닝 기록은 로스터를 결정하는데 있어 보통 과대 평가된 것이라고 생각해 왔다. 어떤 결정을 내리는 기초 자료로 사용하기에는 "표본의 크기가 작다."고 믿었다. 그래서 나는 햅이 박찬호보다 더 나은 선택이라고 생각했다. 햅이 5선발 경쟁에서 성공하고 박찬호가 불펜으로 가기를 원했다. 결국 박찬호는 메이저리그 통산 8,074명의 타자를 상대했지만 그가 보통이라는 것을 증명했다. 맞나? 아닐 수도 있다.

I have spent this Spring Training rooting for JA Happ to earn the 5th spot in the rotation.  It is not that I wanted Chan Ho Park to fail, but I have generally felt that Spring Training numbers are overvalued in making roster decisions.  I have generally believed that the sample size is too small to base any decisions on, and so I thought Happ was the better option and wanted him to succeed and Park to fail.  After all, Chan Ho Park faced 8,074 hitters in the major leagues, demonstrating that he is in fact mediocre.  Right?  Maybe not.

통상 "표본 크기가 작다."라고 말을 할때 단지 Sabermatric적인(Sabermetrics란 미국야구연구협회(SABR)에서 비롯된 단어로 야구를 객관적이고 통계적인 수치로 분석한 것을 말하며, 빌 제임스가 선구자적인 인물이다.) 논의 포인트가 없다고 말하는 것은 아니다. "표본 크가가 작다."라고 말할 때 의미하는 것은 스프링 캠프 기록이 평균이라고 말하는 것 중 두가지 표준 오차 내에 있다는 것이다. 표준 오차 범위는 역으로 표본 사이즈에 관련 있는 것이므로, 스프링 캠프 결과가 사실을 말한다고 신뢰하기는 범위가 너무 넓다.

When we say things like "small sample size", we need to make sure that it's not just an empty sabermetric talking point.  What a person means when they say "small sample size" is that the resulting outcome is within two standard errors of what would be expected on average.  As the size of a standard error is inversely related to the sample size, the idea is that the range of possible outcomes is too vast to trust that any one outcome represents the truth.

이런 점을 고려하여 박찬호의 스프링 캠프 기록을 살펴보았다. 박찬호의 방어율은 2.53으로 꽤 낮은 편이다. 또한 햅의 3.15 방어율도 마찬가지로 낮은 편이다. 그러나 박찬호의 외적인 기록을 보았을때 놀랄만 한 것이 있었다.

So, as I thought about all of this, I took a look at Chan Ho Park's spring numbers.  His ERA is quite low at 2.53, but so is JA Happ's at 3.15.  But then I looked at Chan Ho Park's peripheral numbers and something shocked me.

상대 타자 : 85명

삼진 : 25개

볼넷 : 2개

Hitters faced: 85

Strikeouts: 25

Walks: 2

이것은 매우 놀라운 기록이었다. 결과적으로 타자당 삼진비율이 29.4%, 타자당 볼넷비율이 2.4%라는 의미이다. 박찬호의 통산 기록을 볼때 삼진비율은 19.7%, 볼넷비율은 10.4% 이었다. 통계적인 의미를 확인하기 위해, 어떤 차이가 삼진비율 19.7%, 볼넷 비율 10.4%에서 삼진비율은 29.4%로 더 좋아지게 했고 볼넷비율은 2.4%로 더 낮아지게 했는지를 살펴 보았다. 결과적으로 박찬호의 스킬이 과거와 같다고 가정하면 행운에 의해 삼진비율이 9.7% 높아지게 될 확율은 1.2%, 행운에 의해 볼넷 비율이 높아질 확율은 0.7%에 불과했다.

That seemed extreme.  After all, that is 29.4% K/PA and 2.4% BB/PA.  In his career, he has 19.7% K/PA and 10.6% BB/PA.  I checked for statistical significance-- in other words, I checked to see what the odds were of someone with a true skill level of 19.7% K/PA and 10.6% BB/PA getting 29.4% K/PA or more and getting 2.4% BB/PA or less by random chance.  As it turns out, the odds of being 9.7% above his K/PA by luck when his skill level remained the same is 1.2%.  The odds of being 8.2% below his BB/PA by luck is 0.7%. 

이러한 결과는 통계적으로 의미 있는 것이다. 매우 통계적인 의미를 갖는 것이다. 이것이 의미하는 것은 무엇인가가 아마도 매우, 매우 다르다는 것이다. 이러한 다른 점 중 어떤 것은 상대했던 타자들의 능력이나 상대했던 타자들의 경쟁 정도가 될 것이지만, 무언가 더 큰 차이가 있다는 것을 의미하는 것 같다. 볼넷 당 삼진 비율이 박찬호가 12.5, 햅이 2.33으로 큰 차이를 보였다. 통상 메이저리그 팀들은 최소한 비용으로 선발 로테이션의 뒷 부분을 채우려고 한다. 박찬호는 앞으로 몇년간 저렴한 비용으로 선발 로테이션을 채울 수 있게 하지만, 새로운 이러한 박찬호에게는 통계적으로 의미있는 무언가 차이가 있다. 도대체 그는 누구인가?

These are both statistically significant-- very statistically significant.  What this means is that something is very, very probably different.  Some of this could be the quality of hitters faced or the level of competition of the hitters he does face, but it does seem to imply that something larger is different.  A K/BB ratio of 12.5 for Park and just 2.33 for Happ is a huge difference.  In general, I tend to believe that the team would be better off with a guy with league minimum salary anchoring the back of the rotation, since he would be able to do so for the next couple of years, but there is something different-- something statistically significantly different-- about this new Chan Ho Park.  But who is he?
