도박사의 오류라고도 불리는 이것은 항상 사람들을 헷갈리게 만드는 주제이다.
나도 자주 헷갈리기 때문에 잊지 않기 위해 정리하려 한다.
예를들어 동전던지기를 생각해보자
앞면이 연속으로 10번 나왔다 여러분이라면 다음에 어디에 걸겠는가?
많은 사람들이 앞면이 연속으로 11번 나올 확률이 매우 낮으므로 다음에는 뒷면이 나올 확률이 높다고 생각한다.
하지만 확률에 대해 조금 공부해본 사람이라면
동전던지기는 독립시행이므로 확률은 50%인데? 라고 생각한다.
하지만 대수의 법칙도 배웠기 때문에 지식의 충돌이 발생한다.
과연 무엇이 맞는 것일까?
일단 앞면이 연속으로 11번 나올 확률이 낮은 것은 맞다.
다만, 그것은 아직 동전을 한 번도 던지지 않을 때의 이야기다.
누군가 당신에게 동전을 주고 지금부터 던져서 11번 연속 앞면이 나오게 해보라고 한다면 막막할 것이다.
하지만 이미 10번 앞면이 나온 상태로 가져와서 당신에게 동전을 주고 던져서 앞면을 요구한다면 어떠한가? 실패하고 과거로 바로 돌아가서 다시 한 번 던질 수 있다면 어떠한가? 실패할 자신이 없다.
서로 무엇이 다른가?? 전자는 모든 사건이 일어나기 전의 시점이고 후자는 이미 앞의 사건들이 다 결정된 뒤의 일이다.
이미 결정된 앞의 사건들은 이미 벌어진 확정된 상태이므로 확률이 1이다.
그렇기 때문에 이미 10번의 앞면이 나왔고 11번째 앞면이 나올 확률은 1*1*1*1.....*0.5 = 0.5 가 되는 것이다.
그렇다면 이제는 대수의 법칙의 차례이다.
계속 앞면만 나왔는데 대수의 법칙을 맞추려면 뒷면이 나올 가능성이 높은거 아니냐 할 것이다.
대수라는 것은 생각보다 매우 큰 수다.
매우 큰 시행횟수 중 앞면이 뒷면보다 1000번 더 나오더라도 전혀 이상할게 없다.
총 시행이 10억번만 되어도 1천번의 결과 차이는 전체 비중의 0.0001%밖에 되지 않는다.
전체 결과로 보면 49.9999% vs 50.0001% 로 보여도 우리는 재수없게 시행의 앞부분에서 한쪽으로 편향된 분포를 얻을수도 있는 것이다.
이는 평균회귀와 동일하다. 통계적으로 보면 앞면 뒷면의 빈도는 평균으로 돌아갈 수 밖에 없다.
하지만 그 약간의 차이에서 오는 편향이 우리의 전체 경험을 차지할 수도 있을만큼 클 수도 있다.
컴퓨터 시뮬레이션으로 시행횟수(N)를 조정해봐도 우리가 삶에서 경험할 수 있는 수준의 시행횟수에서는 편향이 생각보다 크게 일어날 수 있다는 것을 확인할 수 있다.
실제 우리 주위에 이런 편향을 인위적으로 제거하는 사례가 있다.
게임에서 크리티컬/회피 확률을 적용할 때가 그러하다.
예를들어 확률이 10%로 설정된 크리티컬 공격이 있다고 하자.
매 시행마다 크리티컬이 터지지 않으면 다음 공격은 최초의 수치보다 점점 더 높은 확률로 크리티컬을 계산하게 된다.
그러다가 크리티컬이 터지면 다시 원래의 확률로 돌아오는 방식이다.
적은 시행횟수에서는 생각보다 기대값을 충족하지 못하는 결과가 많이 나오기 때문에 이러한 보정이 들어가는 것이다.
우리가 일반적으로 경험할 수 있는 시행횟수 안에서 기대값을 충족하려면 이런 보정장치가 있어야만 한다.
도박사의 오류는 이런 상황에서만 실제로 실현이 가능한 것이다.
앞에서 정리한 바와 같이 우리가 일상에서 경험할 수 있는 수준의 시행횟수에서는 대수의 법칙을 체감하기도 힘들고
대수의 법칙이 적용될만큼 시행횟수가 커져도 극단적으로 한쪽으로 편항되어 있을리가 없다...
(극단적으로 편향되어 있다면 그건 애초에 확률이 50%가 아닐 가능성이 크다.)
무엇보다 결정되기 전에 확률과 결정된 상태에서 다음 시행의 결과를 예상하려는 것이 큰 오류이다.
앞으로 100번 던져서 앞면이 80번이상 나올 확률은 낮다는 것은 맞는말이다.
하지만 99번을 이미 던졌고 앞면이 79번 나온 상태에서는 전혀 다른 상태이다.
확률을 계산하는 시점을 잘 이해하는 것이 중요하다.