분석읽는 시간 14분

복권 번호 빈도 이해하기

빈도 차트는 복권 분석에서 가장 많이 조회되는 도구이자 가장 많이 잘못 읽히는 도구입니다. 빈도 차트가 무엇을 알려주고, 무엇을 알려주지 않으며, 무엇을 알려줄 수 없는지에 대한 실용 가이드입니다.

LottoWise 팀

복권 분석 사이트에 들어가면 가장 먼저 보게 되는 것 중 하나가 빈도 차트입니다. 보통은 각 축에 숫자가 있고, 해당 숫자가 몇 번 뽑혔는지를 막대의 높이로 표시한 막대 그래프입니다. 때로는 색상 구분이 있습니다 — 핫 넘버는 빨간색, 콜드 넘버는 파란색으로.

빈도 차트가 인기 있는 이유는 즉각적으로 읽히기 때문입니다. 보고 나면 무언가를 배운 것 같은 기분이 듭니다. 종종 정말로 배웠을 때도 있습니다. 하지만 그만큼 자주, 잘못된 것을 배우고 있습니다. 이 글은 빈도 차트를 올바르게 읽는 방법에 관한 것입니다.

빈도 차트가 실제로 측정하는 것

복권 빈도 차트는 하나의 구체적인 질문에 답합니다: 어떤 추첨 기간에 걸쳐, 각 숫자가 몇 번 등장했는가?

그게 전부입니다. "어떤 숫자가 운이 좋은가"가 아닙니다. "어떤 숫자가 곧 나올 차례인가"도 아닙니다. "다음에 어떤 숫자를 고를지"도 아닙니다. 특정 복권에 대해, 정해진 기간 동안의 원시 횟수일 뿐입니다.

당연해 보이지만, 이 구분이 중요한 이유는 빈도 차트에 대한 거의 모든 혼란이 그 횟수를 단순한 횟수 이상의 무언가로 취급하는 데서 비롯되기 때문입니다.

반드시 알아야 할 세 가지 변수

빈도 차트를 정직하게 읽기 전에, 세 가지 정보가 필요합니다. 차트가 이것들을 보여주지 않는다면 의심해 보십시오.

복권. 빈도는 단일 복권 내에서만 의미를 갖습니다. Powerball (5/69 + 1/26)과 EuroMillions (5/50 + 2/12)은 완전히 다른 표본 공간을 가지고 있으므로, 두 복권의 빈도 차트를 직접 비교할 수는 없습니다.

기간. 차트가 몇 회차를 포함하고 있는가? 최근 20회차? 최근 500회차? 최근 5년? 20회차에 걸친 차트는 단기 노이즈를 보여 주고 있는 것입니다. 5,000회차에 걸친 차트는 기저 분포에 가까운 것을 보여 주고 있습니다. 이들은 다른 것들입니다. 기간을 공개하지 않는 플랫폼은 가장 중요한 변수를 숨기고 있는 것입니다.

기준선. 복권이 완벽하게 균일하다면 빈도는 어떻게 보일까? 500회차에 걸친 6/49의 경우 각 숫자는 대략 500 × 6/49 ≈ 61번 등장해야 합니다. 모든 차트는 그 기준선을 참조선이나 음영 밴드로 보여 주어야 합니다. 그것이 없으면 자연 분산은 극적으로 보이지만, 그것과 대비하면 보통 노이즈처럼 보입니다.

이 셋이 없는 빈도 차트를 본다면, 닫으십시오. 그것은 정보가 아니라 장식입니다 — 스스로를 속이지 않고 빈도 차트를 읽는 가이드에서 전체 훈련을 다룹니다.

"핫"과 "콜드"가 실제로 뜻하는 것

빈도 차트가 가장 흔하게 오용되는 방식은 핫/콜드 프레임입니다. 기준선 위에 있는 숫자는 "핫"이고, 아래에 있는 숫자는 "콜드"입니다. 일부 플랫폼은 여기서 더 나아가 조언으로 확장합니다 — 잘 나오고 있으니 핫 넘버를 플레이하라, 또는 "곧 나올 차례"이니 콜드 넘버를 플레이하라고.

두 확장 모두 잘못되었고, 같은 이유에서 잘못되었습니다: 여러분이 보고 있는 분산은 거의 확실히 노이즈입니다.

6/49 복권에서 500회차에 걸쳐 각 숫자의 기대 빈도가 61인 경우를 생각해 봅시다. 통계 이론은 특정 숫자의 실제 횟수가 61 주위의 범위 안에 들어가며, 그 범위의 폭은 이항 분포의 표준 편차에 의해 결정된다고 말합니다. 이 경우 표준 편차는 약 7.4입니다. 이는 약 95%의 숫자가 46에서 76 사이의 횟수를 가질 것임을 뜻합니다 — 순전히 무작위 변동에 의해서 말입니다.

73이라는 횟수를 가진 숫자를 본다면, 그것은 "핫하게 운영되고" 있는 것이 아닙니다. 그것은 무작위 분산의 정상 범위 안에 편안히 자리 잡고 있습니다. 49라는 횟수를 가진 숫자도 마찬가지입니다 — 그것은 "콜드"가 아니라, 단지 기대값을 살짝 밑도는, 정상 통계 변동 내의 값일 뿐입니다.

이것을 기술적으로 말하자면: 기대값의 두 표준 편차 이내로 떨어지는 관측 빈도는 비균일성의 증거를 제공하지 않습니다. 사람들이 보는 핫/콜드 패턴의 대부분이 정확히 이것입니다.

빈도 차트가 실제로 무언가를 말해 줄 수 있는 경우는?

빈도 데이터가 실제 효과를 가리킬 수 있는 좁은 범위의 경우가 있습니다.

매우 긴 기간. 5,000회차 혹은 10,000회차에 걸치면 자연 분산이 기대값 대비 축소되고, 실제 편향이 (존재한다면) 드러나기 시작합니다. 대부분의 복권에는 이것이 수십 년치의 데이터를 뜻하며, 대부분의 복권은 그 기간 동안 엄격하게 감사되어 왔습니다. 답은 거의 언제나: 실제 편향 없음.

극단적 이상치. 어떤 숫자의 횟수가 기대값에서 5~6 표준 편차 이상 벗어난다면 조사할 가치가 있습니다. 이것은 평판 있는 복권에서는 거의 일어나지 않습니다. 일어난다면, 첫 번째 용의자는 복권의 물리학이 아니라 데이터 수집 오류입니다.

일관된 방법론을 적용한 복권 간 비교. 이것은 실행 가능한 것이라기보다 학술적인 것이지만, 많은 복권을 연구하여 체계적 편차를 찾는 것이 가능합니다. 주요 복권에 대한 동료 심사 연구들은 일반적으로 예상대로의 결과를 찾아냈습니다: 추첨은 무작위와 통계적으로 구별되지 않습니다.

실용적 읽기 가이드

이 모든 것을 염두에 두고, 빈도 차트를 스스로를 속이지 않고 실제로 사용하는 방법은 다음과 같습니다.

  1. 세 가지 변수를 확인하세요. 복권, 기간, 기준선. 하나라도 빠지면 멈추십시오.
  2. 극단이 아니라 퍼짐을 보세요. 흥미로운 질문은 "어떤 숫자가 가장 높은가?"가 아니라 — "전체적으로 퍼짐이 얼마나 되는가?"입니다. 균일 분포에서 기대되는 퍼짐과 비교하십시오.
  3. 기본적으로 분산은 노이즈라고 가정하세요. 입증 책임은 균일이 아니라 편차에 있습니다. 몇 표준 편차의 데이터로 편차를 설명할 수 없다면, 그것은 노이즈입니다.
  4. 여러 기간을 보세요. 한 기간에서 "핫"한 숫자는 다음 기간에서 거의 핫하지 않습니다. 핫함이 지속되지 않는다면, 그것은 실재하지 않았습니다.
  5. 거기서 숫자를 고르지 마세요. 이것이 명확한 경계입니다. 빈도 차트는 무슨 일이 일어났는지를 기술합니다. 무슨 일이 일어날지 예측하지 않습니다.

정직한 분석 플랫폼이 하는 일

빈도 데이터를 진지하게 다루는 플랫폼은 다음을 할 것입니다.

  • 기준선을 명시적으로 보여 줍니다. 보통 1시그마 및 2시그마에 해당하는 음영 밴드로 보여 줍니다.
  • 기간을 변경할 수 있게 합니다. 서로 다른 기간은 서로 다른 질문에 답합니다. 이를 숨기는 플랫폼은 지나치게 단순화하고 있는 것입니다.
  • 숫자를 "베스트 픽"으로 순위 매기기를 거부합니다. 정직한 플랫폼은 암시된 당첨 확률로 숫자를 순위 매기지 않습니다. 암시된 당첨 확률이라는 것이 존재하지 않기 때문입니다.
  • 수학을 설명합니다. 기준선을 어떻게 계산하고 분산 밴드가 왜 그런 값인지 설명하는 페이지를 찾을 수 있어야 합니다.

확률 교육 도구로서의 빈도 차트

올바르게 사용된 빈도 차트는 아름다운 교육 도구입니다. 그것은 무작위 과정의 자연 분산을 즉시 볼 수 있는 방식으로 보여주며, 대부분의 사람들의 직관과는 거의 일치하지 않습니다. 대부분의 사람들은 균일 분포가 균일하게 보일 거라고 기대합니다. 하지만 그렇지 않습니다. 울퉁불퉁해 보입니다. 그 울퉁불퉁함을 신호가 아니라 기대되는 것으로 보는 법을 배우는 것이 확률적 문해력의 시작입니다.

이것이 빈도 차트가 할 수 있는 가장 좋은 일입니다: 숫자를 고르는 것이 아니라, 무작위가 실제로 어떻게 생겼는지에 대한 여러분의 직관을 훈련하는 것.

결론

복권 빈도 차트는 어떤 기간에 걸친 횟수이며, 기대 기준선과 비교한 것입니다. 그것은 무작위 추첨이 실제로 얼마나 노이지한지 이해하는 데 유용하며, 작은 분산이 무언가를 뜻한다는 직관을 걷어내는 데 유용합니다.

숫자를 고르는 데는 유용하지 않습니다. 유용할 수 없습니다. 차트를 만들어낸 추첨은 서로 독립적이었으며, 이는 차트가 다음 추첨에 대해 예측력을 가지지 않는다는 뜻입니다. 이것은 차트의 한계가 아니라 — 기저 과정의 성질입니다.

빈도 데이터를 보는 것을 즐긴다면, 직접 해 보십시오. 그리고 그것을 있는 그대로 보십시오: 무작위 과정을 들여다보는 창. 거기서 숫자를 고르기 시작하는 순간, 그 차트는 분석이 아니라 그래프를 붙인 미신이 됩니다.