세이버메트릭스

위키백과, 우리 모두의 백과사전.
(세이버매트릭스에서 넘어옴)
이동: 둘러보기, 검색

세이버메트릭스(Sabermetrics)는 빌 제임스가 창시한 SABR(The Society for American Baseball Research)라는 모임에서 만들어진, 야구를 통계학적/수학적으로 분석하는 방법론이다. 세이버메트릭스는 빌 제임스가 창시한 이래로 수많은 변화를 겪어왔으며, 이제는 단순한 개인의 취미 차원을 넘어서 야구 전반에서 쓰이고 있을 만큼 널리 퍼져 있다. 창시되었던 1970년대에는 많은 변화를 가져오지 못하였으나, 1980년대를 넘어 1990년대부터는 본격적으로 야구계에 영향을 미치기 시작하였다.

사례 : 오클랜드 애슬레틱스의 빌리 빈

오클랜드 애슬레틱스 팀 단장을 맡은 빌리는 2001년 다비전 시리즈 최종전에서 양키스에게 역전패를 당하고 그나마 실력 있는 선수들도 다른 구단에 빼앗기게 된다. 팀 재정상태를 고려해 적은 선수영입 비용으로 최고의 성적을 얻고자 했던 빌리 빈 단장은 세이버메트릭스를 도입하고 이를 지지하던 예일대 경제학과 출신 피터 브래드와 함께 머니볼 이론을 창시하게 된다. 이후 메이저리그(MLB)에서 전무후무한 기록인 팀연승 20승을 기록하면서 대성공을 거두게 된다.


공격 : 각 타자의 세부 분석 지표

1. OBP(On base percentage) : 출루율

이를 구하는 식은 다음과 같다

(H + BB + HBP)/(AB + BB + SF + HBP) 

( H : 안타, AB : 타수, BB : 볼넷, SF : 희생플라이, HBP : 데드볼 )


2. SLG(Plus Slugging percentage) : 장타율

이를 구하는 식은 다음과 같다

TB/AB = (1B + 2*2B + 3*3B + 4*4B)/AB

( TB : 총루타수, AB : 타수 )


3. OPS(OBP + SLG) : 출루율(OBP)와 장타율(SLG)을 더한 값(타자의 능력을 평가하는 기준, 보통 10할을 넘어서면 타자가 좋은 성적을 거둔다고 표현함), 세이버메트릭스를 가장 크게 알린 스탯으로 꼽히며 현재는 MLB.com에서 공식적으로 제공하는 스탯이다.


4. OPS+ : 조정OPS, 구장마다 타자에게 유리하게 작용하는 곳과 불리하게 작용하는 곳이 있다는 것을 감안하여 등장. 구장효과(Park Factor)를 반영하며, 100을 평균으로 하여 스케일도 조정되기 때문에, 특정 시즌에 특정 타자가 리그 평균에 비해 얼마나 좋은 활약을 펼쳤는지 알 수 있다.

이를 구하는 식은 다음과 같다

OPS+ = 100*((OBP?lgOBP + SLG/lgSLG) - 1)/BPF

( lgOBP : 리그출루율, lgSLG : 리그장타율, BPF : 구장효과(Park Factor))


5. GPA (Gross Production Average)

이 스탯은 출루율에 1.8의 가중치를 부여한 것이다 ( 왜냐하면 어떤 연구에서도 출루율과 득점과의 상관 관게가 장타율과 득점과의 상관 관계보다 높게 나왔기 때문 )

GPA = ( 1.8*OBP + SLG )/4

GPA는 OPS보다 실제 득점과의 상관관계가 더 높으면서도 여전히 계산하기가 쉽다는 장점을 지니고 있다.


6. RC, RC/27

RC는 Runs Created의 약자로 다음과 같은 기본 형태를 가진다.

RC = ( A*B )/C

(A : 출루율을 반영한 어떤 값( On Base Factor ), B : 출루한 주자를 진루시키는 능력을 반영한 어떤 값( Advacement Factor ), C : 타자가 출루 내지는 진루를 시킬 수 있는 기회( Opportunity Factor ))

이는 무려 14차례나 변형되어 왔고, 현재 가장 기본적인 형태의 공식은 이러한 식으로 되어있다.

RC = (( H + BB )*TB )/( AB + BB ) = OBP*SLG*AB


하지만, 실무에서는 RC보다 RC/27를 더 많이 사용하는 편이다. 그 이유는 RC가 누적 스탯이기 때문에, 절대적인 출장 기회가 많을수록 유리해지기 때문이다.

RC/27의 개념은, 해당 타자 아홉 명으로 1번부터 9번까지 타순을 짠 다음, 9회까지 27아웃을 뛰는 동안 그 팀이 몇 점이나 득점할 수 있을지의 예상치를 산출하는 것이다. 따라서 타석 수에 상관없이 절대적인 비교가 가능해진다.

RC/27을 구하는 식은 다음과 같다

RC/27 = 27*RC/( AB - H + CS + GIDP + SH + SF)

( GIDP : 땅볼로 인한 더블플레이, CS : 도루사, SH : 희생타 )


7. EqA

EqA는 Equivalent Average의 약자로써 어떤 유망주가 있을 때, 그의 활약정도가 현 리그에서는 어느정도일지 예측분석이 가능하게 된다. 즉, 리그에 대한 조정이 가능하다.

아무 조정도 되지 않은 Raw EqA를 구하는 식은 다음과 같다

RawEqA = ( H + TB + 1.5*(BB + HBP + SB) + SH + SF - IBB/2)/( AB + BB + HBP + SH + SF + CS + SB )

( SB : 도루, IBB : 고의사구 )


8. wOBA

wOBA는 weighted On Base Average의 약자로, 타자의 타석당 타격능력을 측정하는 값이다.(모든 타석에서 어떤 타격 결과를 가져다 주었는지를 평가하는 선형분석의 결과값) wOBA를 구하는 공식은 다음과 같다.

wOBA = ( 0.72*NIBB + 0.75*HBP + 0.90*1B + 0.92*RBOE + 1.24*2B + 1.56*3B + 1.95*HR )/PA

( NIBB : 고의사구를 제외한 볼넷, RBOE : 에러로 인해 타자가 출루에 성공하는 것, PA : 타석 )


9. wRAA

wRAA는 weighted Runs Above Average의 약자로 평균 타자에 비해 얼마나 득점에 기여하느냐를 점수(Runs)로 나타내는 지표이다. 이를 구하는 공식은 다음과 같다

wRAA = ((wOBA - lgwOBA)/1.15)*PA


10. 기타

UBR : 근본적인 주루

wRC : 타자의 생산성을 구하는 선형계수의 한 종류

wRC+ : 리그성적과 파트 팩터에 맞춰서 계산된 선형계수의 한 종류

BABIP : 인플레이 타구의 비율 - 타자가 친 공이 페어 영역 안에 떨어지는 경우만을 구성하는 스탯

ISO : 선구안(공의 볼과 스트라이크를 구별 및 판단하는 능력

HR/FB : 플라이볼 중 홈런의 비율

Spd : 속도점수, 야구선수의 속도에 관한 평가

GB% : 땅볼타구비율

FB% : 플라이율

LD% : 타격이 라인처럼 쭉 뻗어가는 비율(정타율)

K% : 스트라이크 아웃 비율

BB% : 볼넷비율

O-Swing% : 스트라이크 존 바깥에서 스윙하는 비율

Z-Swing% : 스트라이크 존 안에서 스윙하는 비율

Swing% : 스윙 비율

O-Contact% : 스트라이크 존 바깥에서 컨택하는 비율

Z-Contact% : 타자의 타격에서 스트라이큰 존 밖에서 컨택하는 비율


수비 : 필더의 수비 세부 분석 지표


1. FPct : Fielding Percentage

가장 단순하고 오랜 역사를 가지고 있으나 부족한 부분이 있는 스탯이다. 식은 다음과 같다

FPct = ( A + PO )/( A + PO + E )

( A : Assists 다른 곳에서 아웃이 될 수 있도록 공을 던져준 것, PO : Putouts 수비수 스스로 아웃을 기록한 것, E : Error 수비실책 )


2. RF : Range Factor

RF는 Bill James이 고안해 낸 것으로써, FPct와는 달리 수비수가 실제로 얼마나 아웃을 만들기 위한 플레이에 관여했는지를 측정하기 위해 만들어진 것이다. 공식은 다음과 같다

RF = ( PO + A )*9/Inn

( Inn : Innings played )


3. ZR : Zone Rating

ZR은 기본적으로 각각의 수비수가 자신의 수비 구역에 떨어지는 공 중에서 얼마만큼을 아웃으로 처리했는가의 비율이다. 이를 구하는 공식은 다음과 같다.

자기 구역에서 아웃 처리한 공/자기 구역에 떨어진 공

만약에 수시수가 자기 구역 이외의 필드에서 아웃을 1개 잡았다면, 분모와 분자에 모두 1을 더해주는 식의 수정을 거치게 된다


4. 기타

rSB 도루 저지율

rGDP 더블플레이 성공률 = ( 더블플레이 상황에서의 성공/실패 )

rARM 외야수의 추가 출루저지율 = ( 2루타성 타구를 1루에 묶어 두는 비율/3루타성 타구를 2루에 묶어두는 비율 )

rGFP 좋은 수비로 출루를 저지하는 비율

rPM ( 실점 포함 출루 저지율 )/( 실점을 막은 출루 저지율)

BIZ 영역 안의 공( 수비수가 송구를 할 때 수비가 잡을 수 있는 공을 준 비율 )

OOZ 영역 밖의 공( 수비수가 송구를 할 때 수비가 잡을 수 없는 공을 준 비율 )

CPP 투수의 공을 포수가 놓치는 비율

RPP 투수의 폭투 상황시 포수가 투수의 폭투를 블로킹 한 비율

TZ 전체 영역에 대한 플레이를 데이터와 해 기록한 수비통계

FSR 개개인의 주관적 평가를 취합해서 선수의 수비능력을 평가하는 방식, 보통은 팬들의 의견과 투표를 기반으로 평가한다.

ARM 외야수가 송구를 통해 주자가 진루하는 것을 저지한 점수

DPR 내야수가 더블플레이를 성공시켜서 저지한 점수의 수

RngR 수비수의 수비 범위에 대한 평가를 나타내는 지표

ErrR 같은 포지션의 수비수를 대상으로 얼마나 많은 에러를 기록했는지에 대한 비율

UZR 수비수가 얼마나 많은 실점을 막았는지 또는 내주었는지를 나타내는 지표

UZR/150 150 경기 수비에서 UZR의 비율


피칭 : 투수의 세부 분석 지표


1. ERA

방어율을 의미하며 이를 구하는 공식은 다음과 같다

( 자책점/이닝 )*9

2. WHIP

이닝당 출루허용률이다. 이를 구하는 공식은 다음과 같다

( 안타 + 볼넷 )/이닝

3. FIP

모든 상황이 리그 평균이라고 가정한 뒤, 투수의 실제 ERA가 얼마나 되는지를 측정하는 평가지표로 안타가 아닌 삼진아웃, 볼넷, 사구, 홈런에 대해서만 측정을 한다. ERA와 비슷한 지표지만 FIP은 모든 투수의 페어 지역으로 인플레이 된 타구나 위기관리 능력으로 불리는 요소를 중립화 한뒤, 삼진, 볼넷, 피홈런을 바탕으로 구해지는 값이다.

4. xFIP

FIP와 비슷하지만, 투수의 기록을 예측하는데 아주 중요하게 쓰이고 있다. 이를 구하는 공식은 다음과 같다.

( 홈런/뜬공 )*FB


5. SIERA

ERA를 측정하는 지표 중 가장 최근에 나온 지표이다. 투수의 능력은 어느정도인지, 지난 시즌과 비교해 좋은 성적을 거두고 있는지, ERA가 타 투수들의 능력치보다 높은지, 낮은지를 평가하는 지표

6. tERA

수비의 영향을 배제한 투수의 능력치. 가끔 안타가 될 타구나 실점으로 연결될 타구들이 수비수의 호수비로 안타나 실점으로 연결되지 않는 경우, 투수의 능력치로 포함이 되버리기 때문에, 이를 제외하면 순수한 투수의 능력을 알 수 있게 된다.

7. 기타

K/9 스트라이크 아웃 비율

BB/9 볼넷 비율

K% 스트라이크 아웃 백분율

BB 볼넷 백분율

K/BB 볼넷에 대한 스트라이크 아웃 비율

GB% 땅볼처리비율

FB% Fly볼 비율

HR/FB 플라이볼 중 홈런의 비율

BABIP 인플레이상태가 된 투구율

LOB% 왼쪽으로 날아간 타구의 비율

ROB% 오른쪽으로 날아간 타구의 비율

MD/SD 세이브의 대안으로 중간 계투진의 가치를 평가하기 위해 만들어진 지표이다. 중간계투가 팀을 승리할 수 있도록 얼마나 기여했는가를 나타내며 승리에 도움을 주면 SD를 얻고, 지면 MD를 얻는다.

F-Strike% 첫번째 투구 공이 스트라이크인 비율

SwStr% 총 투구(수) 중에서 타자가 스윙하거나 공을 맞추지 못하는 비율

wFB 빠른공으로 출루하게 한 비율

wSL 슬라이더로 출루하게 한 비율

wCT 커터볼로 출루하게 한 비율

wCB 커브볼로 출루하게 한 비율

wCH 체인지업으로 출루하게 한 비율

wSF SF볼로 출루하게 한 비율

wKN 너클볼로 출루하게 한 비율

FB/C 100개의 투구당 빠른볼로 출루하게 한 비율

wSL/C 100개의 투구당 슬라이더로 출루하게 한 비율

wCT/C 100개의 투구당 커터로 출루하게 한 비율

wCB/C 100개의 투구당 커브로 출루하게 한 비율

wCH/C 100개의 투구당 체인지업으로 출루하게 한 비율

wSF/C 100개의 투구당 SF볼로 출루하게 한 비율

wKN/C 100개의 투구당 너클볼로 출루하게 한 비율


승리에 대한 가능성


1. WPA

각 선수가 하나의 플레이 전체를 두고, 안타를 치거나, 삼진을 당하거나, 포볼로 출루했거나 등을 통해 얼마나 승리에 기여했는지를 측정해주는 지표이다.( 각 세부 지표의 측정은 각 구단마다 다르다.)

-WPA : Loss Advancement, 팀이 패배하는데 각 선수가 얼마나 기여했는지에 대한 측정 지표

+WPA : Win Advancement, 팀이 승리하는데 각 선수가 얼마나 기여했는지에 대한 측정 지표


2. pLI 모든 경기의 이벤트 평균지표에 대한 각 선수의 평균값


3. phLI 핀치 히트 상황에서 각 타자의 평균기여도


4. gmLI 경기에서 투수의 평균 승리 기여도


5. inLI 각 이닝 별 투수의 평균 기여도


6. exLI 종료 게임에서 투수의 평균 기여도


7. WPA/LI 선수가 하나의 플레이(삼진, 안타 등)를 통해 승리 기대치를 얼마나 올려주었는지를 측정해주는 지표이다. /LI는 이런 모든 상황에서 각 선수의 플레이에 대한 평균영향력을 측정하는 것인데 각 항목을 나눈 값은 각 선수의 승리/패배 기여도를 측정해주는 지표다. 비교는 가능하지만 예측은 불가능한 지표이다.


8. CluTch

평균적인 상황을 제외하고 보다 득점 가능성이 높은 상황에서 얼마나 많은 기여를 했는지 여부이다.


결론

앞에서 설명한 지표들을 포함, 다른 많은 지표들이 계속 개발되고, 수정되고 있다. '세이버메트릭스는 야구를 객관적으로 이해하려는 시도이다'라는 빌 제임스( Bill James )와 같이 지속 발전되고 있으면서 현장에서는 이를 활용해 주전 선수 또는 영입 선수 등을 결정하는데 중요한 기준 지표로서 사용되고 있다. 이러한 지표들을 종합하고 분석해 빅데이터를 이루고, 빅데이터를 통한 구단운용이나 경기운용이 실제로 효율성을 보이고 있는 부분이다.