보통 축구는 '10경기를 치루고 난 후에 리그 판도를 가름할 수 있다.'는 이야기가 있어. 마침 개클 리그가 10경기를 치뤘지.
오늘은 시간도 조금 있으니 피타고리안 기대 승률에 대해 한번 이야기를 해볼까해. 유명해서 다들 알텐데, 혹시나 해서 ㅎㅎ
이 공식을 내가 안지는 한 2년 넘었나. 지금은 블로거질을 접고 모든 글을 폐쇄하신 '스트렛퍼드의 축구교실'이란 곳에서 처음 봤던 거야. 자세히 설명하려면 거기 글을 참고해야는데... 글이 없으니 내가 아는 한도내에서 짧게 소개할게.
피타고리안 기대승률
먼저 이 공식은 야구에서 유래가 되었어. 야구는 기록에 미친 종목 중에 하나로, 간단한 기록을 다양한 조합을 통해 팀의 공격력이나 수비력, 승률을 예측하곤 하지. 이 피타고리안 기대 승률은 팀의 득점과 실점을 기반으로 우리팀이 어느 정도의 승률을 기록하나(혹은 어느정도의 승리와 패배를 기록하나)를 예측하는 시스템이야. 정확히는 크보가 아닌 메쟈의 시스템이지.
이게 흘러 흘러서 축구에 접목을 하고자 하는 사람이 생겨나기 시작했어. 당연히 외국이야. 알다시피 축구는 통계쪽은 거의 쥐약이라 부를 수 있는 종목이야. 야구가 기록을 통해서 실제 스포츠에 이용하는(흔히 말하는 빌리빈의 머니볼) 추세까지 이르렀다면, 축구는 이제 만져볼까나? 뭐 이런거지. 여튼 그걸 축구에 맞춰 내놓은게 피타고리안 기대승점이야.
수식
=ROUND((POWER(팀 득점, 1.122777)/(POWER(팀 득점, 1.072388)+POWER(팀 실점, 1.127248)))*2.499973*경기수,0)
원래 한글켜서 수식 입력 쓰려고 했는데 귀찮다... 그냥 엑셀에 한글로 써져 있는 부분만 알아서 고치면 이용 가능하니까 쓰고 싶은 횽들은 저거 그대로 써. 짧게 엑셀 함수 이야기 하자면 Power 함수는 지수승, 즉 팀 득점에 1.12XXXX 승. 라운드 함수는 반올림 함수야. 더 세세하게 구하고 싶은 횽들은 저기 라운드 함수와 뒤에 붙은 0(이건 소수 첫째자리부터 반올림 한다는 뜻)을 빼고 하면 대.
이걸 그대로 지금 개축판에 적용시켜보자.
기대 승점의 의미를 읽기 편하게 알려주면 '전북은 14득점을 올릴 수 있는 공격자원과 7실점을 내줄 수 있는 수비자원을 통해 올릴 수 있는 예상 승점은 19점'이란 이야기야. 현재 우리 승점은 20점이니 우리는 예상 보다 잘하고 있다고 할 수 있어. 아까 말한 경기수 부분에 33R을 곱하면? 우리 팀의 미래 승점을 알 수 있지.
아까 말했듯이 피타고리안은 야구에서 유래되었어. 야구에서는 보통 피타고리안을 어떤식으로 생각할까.
접전 승부에 강했던 팀을 알 수 있다.
축구에서 가장 재미있는 스코어는 3:2라는 펠레스코어가 있지만, 이건 실제로 이긴 팀이나 진팀이나 그리 좋은 수치가 아니야. 무려 3득점이나 해서 좋긴 하나 2실점이나 했으니... 가령 꺼내본 김에 개축 데이터를 살펴보자.
2012년에 홈/어웨이가 끝나고, 스플릿 돌입하기전 부산과 스크의 승점이야. 당시 질식 축구로 리그에 새바람(?)을 불러왔던 부산과 압도적인 공격력과 빈약한 수비력을 가진 스크. 둘의 실제 승점은 겨우 3점차인데, 이 걸 기대승점으로 표현하면 부산이 스크보다 무려 8점이나 낮아.
득실차가 무려 14점이 나는 상황에서 이렇게 벌어지는 이유는 이 공식이 전적으로 수비력 혹은 접전 승부에 강한 팀을 보여주고 있기 때문이야. 한마디로 2점차 승부는 별 볼일 없고 낭비라는 뜻. 승부를 결정짓기 위해서는 단 한골만 있어도 된다는 이야기. 그 외 공격력은 쓸데 없다는 이야기이기도 해.
같은 이야기로 올해 개클을 보면, 울산이 7실점으로 리그에서 2번째 최소 실점을 거두나 승점은 -2점이 낮아. (예상승점 17, 실제승점 15) 이 이야기는 울산이 접전 승부에 그리 강하지 못했다는 것을 알 수있어. 반면 올해 스크는 수비력을 바탕으로 안정적인 승점을 계속 따왔다는 이야기가 되는 거고. 실제로 보면 울산은 무승부 혹은 1골차 패배가 리그 10경기 중에 무려 6번, 반면에 스크는 무승부 1번과 1골차 승리가 무려 5번이야. 만약 울산이 1골을 넣어서 승부를 결정지거나 비겼다면?
운빨
말 그대로 팀의 운빨을 나타내준다고 볼 수도 있어. 이 피타고리안 승점을 기반으로 10년 주기로 한해동안 기대승점이 실제 승점보다 높았던 팀 VS 한해동안 기대승점이 실제승점 보다 낮았던 팀(EPL)을 분석을 하면, 전자는 추락하고 후자는 상승하기도 하는 데이터가 존재한다고 해(그분 블로거에 있는 건데 자료가 없어서 첨부를 못하겠다...). 한마디로 DTD, UTU. 본래 전력으로 회귀한다는 이야기야.
그 유명한 인천 UTU 데이터야.
17R에서 기대승점보다 못하고 있는 팀이 있고, 잘하고 있는 팀이 있는데 인천은 전자에 속한 팀이지. 약 2점을 못 얻고 있어. 17R 전체를 보자면, 인천은 8위 대구와 실제 승점차가 무려 12점차이가 나지만, 기대승점으로만 보면 6점 정도 밖에 차이가 안나. 이는 인천이 가진 전력에 비해서 어떤 요인으로 인해 승점을 못 얻었다고 볼 수 있어.
즉, 앞서 말한 운빨은 A라는 팀이 좋든, 나쁘든 팀의 전력을 벗어난 승점을 얻거나 혹은 얻지 못했다는 뜻이야. 그래서 피타고리안 기대 승점은 이러한 운빨을 제거하고 본래의 전력만을 보여주기 때문에 시간이 지나면 지날수록 본래의 위치로 회귀하려는 형태가 나타나기도 해. 그게 인천 UTU라 할 수 있지. 하지만 스플릿A는 실패...ㅠㅠ
물론 모든 팀들이 다 맞는다는 것은 아니야. 경남 같은 경우도 있으니까. 단지 앞선 해축이야기처럼 이러한 경향이 있다고 알려주기 위해서 억지로 짜맞춰 써봤어.
하지만...
앞서 이야기 했듯이
야구가 기록을 통해서 실제 스포츠에 이용하는(흔히 말하는 빌리빈의 머니볼) 수준까지 이르렀다면, 축구는 이제 만져볼까나?
실제로 유의미하게 볼 수는 없는 수치야. 축구는 데이터를 수식화해서 표현하는게 굉장히 어려운 종목이지. 그래서 오차도 굉장히 많고, 때론 갸우뚱 거리기도 해.
추가적으로, EPL은 더 맞을지 모르겠으나 EPL에서 쓰던 공식을 개축판으로 가져왔으니 오차는 더 날 수 밖에 없어. 거긴 38R를 최소 20여년은 끌어왔던 리그인데 반해 우린(...). 승강제도 작년이니 이걸 그대로 맞출 수도 없고 여기에 플옵제도까지 있었기 때문에 뭐 제대로 할 수 있는게 없지. 전/후기 리그는 후....
거기에 이 공식은 미래의 성적을 나타낸다기보다 경기운영을 얼마나 잘하냐에 초점이 맞춰져있기 때문에 야구의 피타고리안 기대승률처럼 예측을 하는 것도 쉽지 않아. 지금은 그럴싸하게 써댔지만, 막상 과거 데이터와 비교해보면 오차가 많이 나거든... 헤헤...
그래서 맨날 하는 이야기지만, 그냥 재미로 보자. 축구의 피타고리안은 이 것 말고도 다양한 수식법이 있다고 알고 있어. 그냥 소개를 해볼까 싶어서 가지고 와봤음.
-----------------------------------------------------------------------------------------------------------------
여담으로 어릴적에 정말 궁금했던 게 있었어. '우리팀 우천시 승리확률이 얼마나 될까.'
https://data.j-league.or.jp/SFTD03/
흐규흐규...부롭다. 정말 어릴때부터 궁금했던 건데 즐리그는 해주고 있구나.