표집 편향 수량화

NBA 올스타 3점슛 콘테스트에서의 핫핸드 슛

핫핸드 오류: 직관 vs 분석

스포츠에서는 많은 연구 결과에서 부정되는 개념인 모멘텀 또는 핫핸드를 일반적으로 믿는 경향이 있습니다. 그러면 베터는 이 개념을 버려야 할까요? 이 기사에서는 이 개념을 버리는 것이 잘못된 생각일 수도 있는 점을 다룹니다.
Michael Jordan이 NBA 올해의 신인상을 받은 1985년, Journal of Cognitive Psychology에 게제된 한 논문은 농구 선수의 슛 능력이 확률적 기대치보다 높아지는 순간이 있다는 일반적인 인식이 틀렸다고 주장했습니다.
특히 논문의 저자들(Gilovich, Vallone 및 Tversky - 'GVT')은 농구 선수의 슛이 모멘텀의 영향을 받는 순간이 있다는 일반적인 믿음은 '인식의 착각'이라고 결론을 내렸습니다. 이 현상은 '핫핸드 오류'라고 알려졌으며 더 일반적으로 통용되는 '도박사의 오류'와 유사합니다. 이 분명한 편견은 무작위성에서 패턴과 의미를 찾으려는 인간의 욕구로 설명됩니다.
스포츠에서 기세 또는 핫핸드에 대한 믿음은 농구에만 국한되지 않습니다. '폼이 좋다', '날아다닌다', '필드를 지배한다', '호기' 등의 용어는 많은 스포츠의 방송 해설과 분석에 흔하게 쓰입니다.
이러한 용어는 핫핸드 오류를 다룬 GVT의 발견과 그 뒤를 이은 여러 논문에도 불구하고 계속 사용되었습니다. 지금까지도 스포츠를 시청할 때 해설자가 이러한 용어를 사용하며 성적에서의 모멘텀이나 무작위성에서의 차이에 대해 시사하는 것을 흔히 볼 수 있습니다.
그러면 왜 스포츠 팬과 해설자들은 30년 넘도록 스포츠에서 모멘텀의 개념을 계속 사용하고 있을까요? 새로운 연구를 통해 모멘텀의 존재에 관한 우리의 직관이 사실은 옳았다는 것을 알게 되었습니다.
논문 '도박사와 핫핸드의 오류 때문에 놀라셨습니까? 작은 숫자의 법칙에 대한 진실(Surprised by the Gambler's and Hot Hand Fallacies? A Truth in the Law of Small Numbers)'에서 Miller와 Sanjurjo는 GTV 연구에 등장하는 농구 선수들이 실제로는 핫핸드를 보여주었으며 핫핸드 오류 자체에 오류가 있다고 주장합니다. 그 이유는 1985년 GTV의 연구 결과에 간단하지만 중요한 표집 오류가 있기 때문입니다. 예시를 들어 설명하겠습니다.
동전 던지기를 5번 한다고 가정하겠습니다. 관찰하면서 앞이 두 번 연속해서 나온 경우에만 결과를 기록합니다. 그러면 5번 던졌을 때 앞면이 나온 결과를 '기록한' 비율은 얼마나 될까요? 50%? 50% 이상 또는 이하?
GVT가 그랬듯이 누군가가 동전 던지기는 앞뒤가 같은 확률이므로 50%라고 주장하겠지만, 훨씬 적습니다. 동전 던지기를 5번 하면 같은 확률을 가지는 순차적 결과가 32개 가능합니다. 아래 열 2에 결과가 있습니다.
가능한 결과 32개 중 16개에서 5번 던졌을 때 두 번 이상 연속으로 앞면이 나왔으므로 기록을 해야 합니다. 이 중 8개는 0%, 3개는 50%, 1개는 67%, 나머지 4개는 100% 앞면입니다. 이 16개 결과의 발생 확률이 모두 같다는 것을 고려하면 두 번 연속 앞면이 나온 이후 앞면이 나와 이를 기록하게 될 확률은 고작 38.5%입니다.
이 결과는 반 직관적으로 보이고 GTV 논문을 포함한 이후의 '핫핸드' 연구에 오류를 제공합니다. 이 편향을 시각적으로 이해하려면 앞면이 한 번 나온 이후 또 앞면이 나올 확률을 구하는 간단한 가정을 해보겠습니다. 아래 표에 5,000번의 시뮬레이션에서 얻은 동전 던지기 500번의 예상 결과가 있습니다.

표집 편향 수량화

편향은 주황색 줄과 실제 조건이 없는 예상치인 50%까지의 거리로 수량화할 수 있습니다. 동전을 10번만 던진 경우 앞면이 연속 두 번 나올 확률은 44.5%입니다. 그러므로 편향은 5.5%입니다.
스포츠에서는 슛 한 번이나 1점만 낸 후에 핫핸드에 대한 언급을 들을 확률은 적습니다. 아래 표에는 실제 성공 확률 50%가 주어진 경우 연속 성공 "k"번 이후의 성공 확률을 표시합니다. 역시 5,000번의 시뮬레이션을 사용했습니다.
보시다시피 연속되는 성공이 많을수록 편향이 증가하고 시도 횟수만큼 줄어듭니다. GVR의 연구에서는 대학 선수 25명이 각자 100번 슛을 쏘고 'k'번(k = 1,2,3)의 성공 또는 실패 이후 슛 퍼센트를 기록하는 농구 실험을 고안했습니다.
각 선수의 슛 위치는 50% 성공 확률을 예측하여 결정했습니다. GVT는 연속 성공 다음의 슛 성공률과 연속 실패 다음의 슛 성공률을 직접 비교했습니다. 그들의 가설은 k번 성공한 후의 성공 확률이 k번 실패한 후의 실패 확률과 같다는 것이었습니다.
그러나 위에서 봤듯이 이 확률은 같지 않습니다. 선수가 쏜 100번 슛의 실제 확률이 50%라고 가정하면 3번 연속 성공한 이후의 성공 확률은 46% 이하입니다. 반대로 3번 연속 실패한 이후의 성공 확률은 54% 이하입니다.
편향의 규모가 조절될 때 핫핸드 부족과 관련한 GVT의 결론은 뒤집힐 수 있습니다. 대부분 선수는 실제로 핫핸드 슛을 보여줍니다. 스포츠에서 맥락에서 모든 '성공' 확률은 일관적으로 50%를 유지할 가능성이 적습니다. 예를 들어 NBA에서는 평균 자유투 성공 확률은 약 75%입니다. 편향이 성공 확률에 따라 어떻게 다른지 이해할 수 있도록, 아래 표는 5,000번 시뮬레이션의 성공 확률 75%에 따른 편향을 예측합니다.
두 개의 표를 비교하면 성공 확률이 증가하면 편향이 감소하는 것을 볼 수 있습니다. 예를 들어, 조건 없는 성공 확률이 50%와 75%라고 가정할 때 100번의 시도에서 5번 연속 성공한 후의 성공 확률은 각각 38%와 72%임을 확인할 수 있습니다. 즉, 편향은 각각 12%(50%-38%) 및 3%(75%-72%)입니다.

NBA 올스타 3점슛 콘테스트에서의 핫핸드 슛

그다음으로, 지난 4년간(2015~2018년) NBA 올스타 3점슛 콘테스트에 참가한 선수들이 핫핸드 슛을 보여주었는지 확인했습니다. 콘테스트는 같은 위치에서 슛을 쏘고 방어 압박이 없으므로 핫핸드 분석에 적합한 조건입니다. 선수들은 한 라운드에 3점슛 라인 뒤에 정해진 5개 위치에서 3점슛을 25번 쏩니다.
4년간 선수 46명이 경쟁했으며 총 1150번 슛을 쏴서 54%가 성공했습니다. 아래 표에는 각 선수의 성공 한 번, 실패 한 번, 성공 두 번, 실패 두 번 이후의 조건부 슛 성공률을 보여줍니다.

NBA 3점슛 콘테스트 통계

슛 성공률은 한 번 또는 두 번 성공한 이후가 평균보다 높았고 한 번 또는 두 번 실패한 이후는 평균보다 낮았습니다.
열 11에서는 성공 또는 실패 이후 슛 성공률(한 번 성공한 이후의 슛 성공률 - 한 번 실패한 이후의 슛 성공률) 차이를 계산했습니다. GVT는 이 차이를 핫핸드 슛 실험에 사용했습니다.
GVT와 같이 이 수치를 그대로 적용하면 보시다시피 4년간 콘테스트에서 선수 24명이 양수, 21명이 음수였고 평균적으로 한 번 성공한 이후에는 성공할 확률이 10퍼센트 더 높습니다. 그러나 이제 표집 편향을 고려해야 합니다.
각 선수의 성공 기대치가 54%(평균)라 가정하면 성공 후 다시 성공할 확률은 52% 이하입니다. 반대로 실패 이후 성공할 확률은 56% 이하입니다. 그러므로 열 11에 표집 편향을 고려해 4%를 추가할 수 있습니다.
조정을 했으니 이제 통계에서 양수 확률은 실패한 이후보다 성공한 이후에 성공 확률이 높다는 것을 의미함을 알 수 있습니다. 조정 후, 32명의 선수가 양수, 14명이 음수가 되었습니다. 평균적으로 선수의 슛 성공률은 성공한 이후 14% 더 높아집니다. 이는 핫핸드 슛의 강력한 증거가 됩니다.
열 12에도 같은 조정을 적용하면(두 번 성공한 이후의 슛 성공률 - 두 번 실패한 이후의 슛 성공률), 편향을 제외하는 조건으로 기존 19명에서 늘어난 30명이 핫핸드 슛(양수)을 보여줍니다. 두 번 성공한 이후 슛 성공률의 평균 증가량은 29%이며 이 역시 최근 NBA 3점슛 콘테스트에 핫핸드 슛이 존재한다는 강력한 증거가 됩니다.

직관 vs 분석

핫핸드 오류가 30년 넘게 견뎌오는 동안 스포츠 팬들과 해설자들도 핫핸드 오류 자체에 오류가 있고 실력에도 모멘텀이 있다는 것을 믿으며 견뎠습니다. 직관(또는 본능)과 마찬가지로 통계적 분석에도 편향이 존재할 수 있다면 직관과 통계적 분석 둘 모두 중요하다고 가정할 수 있으므로, '기세', '폼이 좋다', '날아다닌다'와 같은 용어는 스포츠 해설에서 빠질 수 없는 말입니다.
스포츠에서 모멘텀은 최근에서야 학계에서 긍정적으로 받아들여졌지만, 북메이커는 이미 오래전부터 존재를 알고 있었습니다. 스포츠, 팀, 선수에 따라 게임 내 배당률 모델에는 일반적으로 모멘텀이라는 요소가 포함되어 있습니다.
이전 기사에서 프로 테니스 경기의 세트 사이에 모멘텀이 미치는 영향에 대해 다루었습니다. 베터가 배당률에 반영된 함축적 확률보다 더 높거나 낮은 확률을 가지는 팀 또는 선수를 더 정확하게 구분할 수 있다면, 통계적 분석에 근거해 예측하든, 직감에 근거해 예측하든 상관없이 수익을 낼 수 있을 것입니다.

댓글

이 블로그의 인기 게시물

그래프게임 해시값에 대해서 완벽 이해

그래프게임 돈 따는법, 이렇게만 하세요!

유출픽 해킹픽 카톡 : BIG377