Mega-Sena: o que dá para concluir (e o que não dá) só com frequências

Pergunta

Por que, ao longo do histórico completo dos sorteios da Mega-Sena, alguns números apresentam frequências observadas significativamente superiores às de outros, apesar da hipótese de equiprobabilidade?

Fluxograma de decisão para escolher entre Teste Z e Teste t.
Figura: Na Mega-Sena, “a sorte está lançada”: o jogo está feito e, a partir daqui, só resta acompanhar o sorteio — porque a decisão é sem volta… e a estatística é quem conta a história.

Resposta (visão geral)

Porque aleatoriedade real gera ruído: mesmo que o processo seja justo, as frequências não ficam iguais no finito — elas apenas tendem a se aproximar no longo prazo (Lei dos Grandes Números). E como você observa 60 números ao mesmo tempo, é esperado que alguns apareçam como “campeões” e outros como “lanternas” (efeito dos extremos).


O modelo probabilístico correto (com notação)

Em cada sorteio, saem 6 números distintos dentre 60.

Fixe um número \(k\in\{1,\dots,60\}\) e defina a variável indicadora:

\[I_{n,k}= \begin{cases} 1, & \text{se o número }k\text{ saiu no sorteio }n\\ 0, & \text{caso contrário} \end{cases}\]

A contagem total de aparições de \(k\) em \(N\) sorteios é:

\[X_k=\sum_{n=1}^{N} I_{n,k}\]

Em um sorteio, a probabilidade de \(k\) aparecer é:

\[P(I_{n,k}=1)=\frac{6}{60}=\frac{1}{10}=0{,}1\]

Assumindo sorteios independentes, então:

\[X_k \sim \text{Binomial}(N,\,p)\quad\text{com }p=0{,}1\]

Frequência esperada × frequência observada

A esperança é:

\[\mathbb{E}[X_k]=Np\]

Logo, a frequência esperada por número é:

\[E = N\cdot 0{,}1=\frac{N}{10}\]

Mas isso é uma média, não uma obrigação.


Variância e desvio padrão (o “motor” das diferenças)

Para a binomial:

\[\mathrm{Var}(X_k)=Np(1-p)\] \[\sigma=\sqrt{Np(1-p)}=\sqrt{N\cdot 0{,}1\cdot 0{,}9}=\sqrt{0{,}09N}\]

Moral importante:


Exemplo numérico completo (um número específico)

Considere \(N=2500\) sorteios.

\[E=\frac{N}{10}=\frac{2500}{10}=250\] \[\sigma=\sqrt{2500\cdot0{,}1\cdot0{,}9}=\sqrt{225}=15\]

Interpretação:

Então ver algo como \(220\) ou \(280\) é totalmente compatível com um processo justo.


Exemplo 1: “um número saiu 290 vezes em 2500 sorteios — é suspeito?”

Vamos estimar \(P(X_k\ge 290)\) sob \(X_k\sim\text{Bin}(2500,0{,}1)\).

Use aproximação normal com correção de continuidade:

\[Z=\frac{X_k-\mu}{\sigma},\quad \mu=250,\ \sigma=15\]

Queremos \(P(X_k\ge 290)\approx P\big(X_k\ge 289{,}5\big)\):

\[z=\frac{289{,}5-250}{15}=\frac{39{,}5}{15}\approx 2{,}633\]

Da tabela normal, \(P(Z\ge 2{,}63)\approx 0{,}0042\) (cerca de 0,42%).

Conclusão: para um número específico, isso é raro, mas não impossível.


Exemplo 2 (crucial): “ok, mas eu olho 60 números!”

Aqui entra o efeito dos extremos.

Se, grosso modo, tratarmos “cada número ter \(P(X_k\ge 290)\approx 0{,}0042\)” como eventos independentes (é uma aproximação), então a chance de existir pelo menos um número com \(\ge 290\) aparições é:

\[P(\max_k X_k\ge 290)\approx 1-(1-0{,}0042)^{60}\]

Aproximando \((1-a)^{60}\approx e^{-60a}\):

\[1-e^{-60\cdot0{,}0042}=1-e^{-0{,}252}\approx 1-0{,}777\approx 0{,}223\]

Ou seja, ~22% de chance de aparecer “um número muito frequente” nesse nível em algum dos 60.

Isso explica por que sempre existem “top 10 mais sorteados”.


Exemplo 3: “e o outro extremo? um número com 220 aparições”

Agora \(P(X_k\le 220)\approx P(X_k\le 220{,}5)\):

\[z=\frac{220{,}5-250}{15}=\frac{-29{,}5}{15}\approx -1{,}967\] \[P(Z\le -1{,}97)\approx 0{,}0245\quad(\text{cerca de 2,45%})\]

Para algum número entre os 60:

\[P(\min_k X_k\le 220)\approx 1-(1-0{,}0245)^{60}\approx 1-e^{-1{,}47}\approx 0{,}77\]

Ou seja: ~77% de chance de existir pelo menos um número “bem frio” (\(\le 220\)) num histórico de 2500 sorteios.


Exemplo 4: repetição de números entre dois sorteios seguidos (sem mistério)

Muita gente estranha “número repetido do sorteio anterior”. Mas é bem comum.

A probabilidade de não repetir nenhum número de um sorteio para o próximo é:

\[P(\text{sem repetição})=\frac{\binom{54}{6}}{\binom{60}{6}}\]

Porque, fixado o 1º sorteio (6 números), para o próximo não repetir nenhum, ele precisa escolher os 6 dentre os 54 restantes.

Numericamente, \(\binom{54}{6}/\binom{60}{6}\approx 0{,}516\).

Logo:

\[P(\text{repetir pelo menos 1})=1-0{,}516\approx 0{,}484\]

Quase metade das transições entre sorteios têm ao menos um número repetido do sorteio anterior — e isso é exatamente o que a aleatoriedade prevê.

Se \(N=2500\), existem \(N-1=2499\) “pares consecutivos”, então o número esperado de transições com repetição é:

\[2499\cdot 0{,}484 \approx 1210\]

Psicologia dos padrões (por que isso “parece” estranho)

Nosso cérebro:

Aleatoriedade real parece “imperfeita” para a intuição humana.


Testes estatísticos (o que faz sentido testar)

Você pode testar:

Um detalhe: quanto mais coisas você testa, maior a chance de achar “algo estranho” por puro acaso (múltiplas comparações). Correções como Bonferroni/FDR são importantes quando você sai testando “tudo”.


Pergunta

Sob a hipótese de equiprobabilidade, selecionar números historicamente mais frequentes implica vantagem probabilística?

Resposta curta

Não. A probabilidade do próximo sorteio não muda por causa do histórico.


Justificativa rigorosa (com independência)

Para um número fixo \(k\), defina \(X_n=\{k\text{ sai no sorteio }n\}\).

Independência significa:

\[P(X_{n+1}\mid X_1,\dots,X_n)=P(X_{n+1})\]

E como:

\[P(X_{n+1})=\frac{6}{60}=\frac{1}{10}\]

Então, mesmo que \(k\) tenha sido “quente” no passado:

\[P(k\text{ sair no próximo})=\frac{1}{10}\]

Exemplo explícito: “10 saiu 300 vezes e 47 saiu 230 vezes” \(P(10\ \text{no próximo})=P(47\ \text{no próximo})=\frac{1}{10}\)


Falácia do jogador (em uma linha)

“Está atrasado” ou “está quente” não altera urna nenhuma.
Urna não tem memória.


ÚNICA coisa que pode mudar: valor esperado do prêmio (divisão)

A chance de acertar é a mesma, mas o quanto você recebe se ganhar pode mudar, porque números “populares” são mais escolhidos.

Modelo simples:

Se \(W\) fosse “mais ou menos fixo”, uma aproximação do valor esperado seria:

\[\mathbb{E}[\text{retorno}] \approx p\cdot \frac{J}{\mathbb{E}[W]}\]

Exemplo didático (fácil de ver a ideia):

então:

\[\frac{J/2}{J/5}=2{,}5\]

Ou seja: o retorno esperado (quando ganha) pode ser maior escolhendo combinações menos óbvias — embora a probabilidade de ganhar continue igual.

Heurísticas para reduzir chance de dividir:


Pergunta

Mediante a análise do histórico integral e testes de aderência, é possível inferir vieses sistemáticos ou intervenções no mecanismo de sorteio?

Resposta curta

Dá para testar compatibilidade com um modelo justo e detectar anomalias grandes, mas não dá para “provar justiça absoluta” só com frequências.


O que a estatística consegue (formalizando)

Hipótese nula:

\[H_0:\ \text{sorteios justos, equiprováveis e independentes}\]

Se os dados contradisserem fortemente \(H_0\), você tem evidência contra o modelo.

Se não contradisserem, você tem compatibilidade com o modelo — compatível (\neq) prova absoluta.


Exemplo técnico 1: quão grande teria que ser um viés para “aparecer” em \(N=2500\)?

Sob \(H_0\), para um número \(k\):

\[X_k\sim\text{Bin}(2500,0{,}1),\quad \mu=250,\ \sigma=15\]

Suponha um viés pequeno: \(p=0{,}11\) (em vez de \(0{,}10\)).

A nova média seria:

\[\mu_1=N\cdot 0{,}11=275\]

Diferença em relação ao justo:

\[\Delta = 275-250=25\]

Em unidades de desvio padrão:

\[z=\frac{\Delta}{\sigma}=\frac{25}{15}\approx 1{,}67\]

Isso não é um “alarme forte” (especialmente lembrando que você olha 60 números).


Exemplo técnico 2: quantos sorteios para um viés de 0,01 virar um “3σ”?

Queremos:

\[N(0{,}11-0{,}10)=3\sqrt{N\cdot0{,}1\cdot0{,}9}\] \[0{,}01N = 3\sqrt{0{,}09N}=3\cdot 0{,}3\sqrt{N}=0{,}9\sqrt{N}\]

Dividindo por \(\sqrt{N}\):

\[0{,}01\sqrt{N}=0{,}9 \ \Rightarrow\ \sqrt{N}=90 \ \Rightarrow\ N=8100\]

Ou seja: para detectar com folga um viés de apenas 1 ponto percentual em um número, você precisa de milhares e milhares de sorteios — e ainda tem o fator “60 números testados”.


Exemplo de teste qui-quadrado (didático, em classes)

Para evitar listar 60 categorias, agrupe números em 6 classes:

Em um sorteio de 6 números, a quantidade esperada em cada classe é:

\[6\cdot \frac{10}{60}=1\]

Em \(N=2500\), o total de números sorteados é \(6N=15000\).
Logo, a frequência esperada por classe é:

\[E=\frac{15000}{6}=2500\]

Suponha observações (exemplo):

O qui-quadrado é:

\[\chi^2=\sum_{i=1}^{6}\frac{(O_i-E)^2}{E}\]

Calculando termo a termo:

\[\frac{(2600-2500)^2}{2500}=\frac{10000}{2500}=4\] \[\frac{(2450-2500)^2}{2500}=\frac{2500}{2500}=1\] \[\frac{(2520-2500)^2}{2500}=\frac{400}{2500}=0{,}16\] \[\frac{(2400-2500)^2}{2500}=\frac{10000}{2500}=4\] \[\frac{(2520-2500)^2}{2500}=0{,}16\] \[\frac{(2510-2500)^2}{2500}=\frac{100}{2500}=0{,}04\]

Somando:

\[\chi^2=4+1+0{,}16+4+0{,}16+0{,}04=9{,}36\]

Graus de liberdade: \(6-1=5\).
Esse valor não é “absurdo”; é o tipo de variação que pode acontecer por ruído.


Limitações (o que não dá para prometer)

Mesmo que vários testes deem “ok”:

Sinais realmente fortes costumam ser coisas como:

Além da estatística, confiança real envolve:


Pergunta

Se eu marcar 20 números em uma única aposta, qual é a probabilidade de acertar a Sena (6 acertos)? E o que significa “1 em x”: isso garante 100% de chance após x apostas?

Em um sorteio, existem \(\binom{60}{6}\) combinações possíveis de 6 números.
Quando você marca 20 números, você “cobre” \(\binom{20}{6}\) combinações de 6 números.

Logo, a probabilidade de acertar a Sena com uma aposta de 20 números é:

\[\begin{aligned} p_{20} &=\frac{\binom{20}{6}}{\binom{60}{6}} \end{aligned}\]

Agora calculemos cada combinação.

1) Calculando \(\binom{20}{6}\)

\[\begin{aligned} \binom{20}{6} &=\frac{20!}{6!\,14!} \\ &=\frac{20\cdot19\cdot18\cdot17\cdot16\cdot15}{6\cdot5\cdot4\cdot3\cdot2\cdot1} \\ &=\frac{(20/5)\cdot19\cdot(18/6)\cdot17\cdot(16/4)\cdot(15/3)}{2\cdot1} \\ &=\frac{4\cdot19\cdot3\cdot17\cdot4\cdot5}{2} \\ &=\frac{77520}{2} \\ &=38760 \end{aligned}\]

2) Calculando \(\binom{60}{6}\)

\[\begin{aligned} \binom{60}{6} &=\frac{60!}{6!\,54!} \\ &=\frac{60\cdot59\cdot58\cdot57\cdot56\cdot55}{6\cdot5\cdot4\cdot3\cdot2\cdot1} \\ &=\left(\frac{60}{6}\right)\cdot59\cdot\left(\frac{58}{2}\right)\cdot\left(\frac{57}{3}\right)\cdot\left(\frac{56}{4}\right)\cdot\left(\frac{55}{5}\right) \\ &=10\cdot59\cdot29\cdot19\cdot14\cdot11 \\ &=590\cdot29\cdot19\cdot14\cdot11 \\ &=17110\cdot19\cdot14\cdot11 \\ &=325090\cdot14\cdot11 \\ &=4551260\cdot11 \\ &=50063860 \end{aligned}\]

3) Probabilidade final

\[\begin{aligned} p_{20} &=\frac{38760}{50063860} \\ &=\frac{102}{131747} \\ &\approx 0{,}000774211 \\ &\approx 0{,}0774211\% \end{aligned}\]

Forma “1 em x”:

\[\begin{aligned} \frac{1}{p_{20}} &=\frac{131747}{102} \\ &\approx 1291{,}64 \end{aligned}\]

Então, aproximadamente, é 1 em 1292.

Importante: “1 em 1292” não significa que em 1292 tentativas você ganha com 100% de certeza.
Significa “em média, 1 acerto a cada 1292 apostas” (expectativa).

A chance de ganhar pelo menos uma vez em \(x\) apostas é:

\[\begin{aligned} P(\ge 1\ \text{ganho em }x) &=1-(1-p_{20})^x \end{aligned}\]

Se você fizer \(x\approx \frac{1}{p_{20}}\) apostas, então:

\[\begin{aligned} P(\ge 1) &=1-(1-p_{20})^{1/p_{20}} \\ &\approx 1-e^{-1} \\ &\approx 1-0{,}3679 \\ &\approx 0{,}6321 \end{aligned}\]

Ou seja: ~63%, não 100%.


Pergunta

Se eu fizer duas apostas de 20 números, a probabilidade de ganhar a Sena é simplesmente somar as probabilidades?

Se cada aposta tem probabilidade \(p_{20}\) de acertar a Sena, então a forma correta é usar o complemento:

\[\begin{aligned} P(\ge 1\ \text{ganho em 2 apostas}) &=1-P(\text{perder as 2}) \\ &=1-(1-p_{20})^2 \\ &=1-\big(1-2p_{20}+p_{20}^2\big) \\ &=2p_{20}-p_{20}^2 \end{aligned}\]

Como \(p_{20}\) é pequeno, \(p_{20}^2\) é menor ainda, então aproxima bem somar: \(2p_{20}-p_{20}^2 \approx 2p_{20}.\) Mas não é exatamente “só somar”.

Agora colocando os valores:

\[\begin{aligned} p_{20} &=\frac{102}{131747}\approx 0{,}000774211 \\ P(\ge 1\ \text{em 2}) &=1-(1-0{,}000774211)^2 \\ &\approx 0{,}001547823 \\ &\approx 0{,}1547823\% \end{aligned}\]

Forma “1 em x” (aproximada):

\[\begin{aligned} \frac{1}{0{,}001547823} &\approx 646{,}07 \end{aligned}\]

Então é cerca de 1 em 646.


Pergunta

Nesta semana, viralizou a notícia de um grupo de Cachoeira Dourada (GO) que reuniu cerca de R$ 13 milhões e registrou 57 jogos de 20 números na Mega da Virada. Se eu fizer 57 apostas de 20 números (uma vez cada), qual é a probabilidade de acertar a Sena pelo menos uma vez? E como interpretar esse resultado?

Contexto: caso noticiado pelo InfoMoney em 29/12/2025.

Observação importante:


1) Probabilidade de acertar a Sena com uma aposta de 20 números

Uma aposta de 20 números “cobre” todas as combinações de 6 dezenas dentro desses 20 números.

Logo:

\[\begin{aligned} p_{20} &=\frac{\binom{20}{6}}{\binom{60}{6}} \end{aligned}\]

Como já calculado:

\[\begin{aligned} \binom{20}{6}&=38760\\ \binom{60}{6}&=50063860 \end{aligned}\]

Então:

\[\begin{aligned} p_{20} &=\frac{38760}{50063860}\\ &=\frac{102}{131747}\\ &\approx 0{,}000774211\\ &\approx 0{,}0774211\% \end{aligned}\]

2) Probabilidade de ganhar pelo menos uma vez com 57 apostas

É mais fácil calcular pelo complemento:

\[\begin{aligned} P(\ge 1\ \text{Sena em 57}) &=1-P(\text{perder as 57})\\ &=1-(1-p_{20})^{57} \end{aligned}\]

Substituindo \(p_{20}\approx 0{,}000774211\):

\[\begin{aligned} P(\ge 1) &=1-(1-0{,}000774211)^{57}\\ &=1-(0{,}999225789)^{57}\\ &\approx 0{,}043186828\\ &\approx 4{,}3186828\% \end{aligned}\]

Uma leitura do tipo “1 em x” (só como referência):

\[\begin{aligned} \frac{1}{0{,}043186828} &\approx 23{,}16 \end{aligned}\]

Ou seja: aproximadamente 1 em 23 para acertar ao menos uma Sena, nesse cenário.


3) Interpretação correta (por que não vira “certeza”)

Mesmo gastando muito, 4,32% ainda significa que, na maioria das vezes, não sai a Sena:

\[\begin{aligned} P(\text{não ganhar em 57}) &=(1-p_{20})^{57}\\ &\approx 1-0{,}043186828\\ &\approx 0{,}956813172\\ &\approx 95{,}68\% \end{aligned}\]

4) Uma aposta de 20 números: probabilidade de “ter Quina” (pelo menos uma)

Fixe o sorteio com 6 dezenas. Seja $(X)$ o número de dezenas sorteadas que aparecem dentro do seu conjunto de 20 dezenas.

Então $(X)$ segue uma Hipergeométrica:

\[X \sim \text{Hipergeométrica}(N=60,\ K=6,\ n=20),\]

e, para $(k=0,1,\dots,6)$,

\[P(X=k)=\frac{\binom{6}{k}\binom{54}{20-k}}{\binom{60}{20}}.\]

Você “faz Quina” com a aposta de 20 números se e somente se $(X\ge 5)$, porque assim existe pelo menos uma combinação de 6 dezenas dentro da aposta que contém 5 (ou 6) das sorteadas.

Logo:

\[p_{\ge 5}=P(X\ge 5)=P(X=5)+P(X=6).\]

Exatamente 5 acertos dentro dos 20:

\[\begin{aligned} P(X=5) &=\frac{\binom{6}{5}\binom{54}{15}}{\binom{60}{20}}\\ &=\frac{1632}{131747}\\ &\approx 0{,}01238738\\ &\approx 1{,}238738\% \end{aligned}\]

Exatamente 6 acertos (Sena) dentro dos 20:

\[\begin{aligned} P(X=6) &=\frac{\binom{6}{6}\binom{54}{14}}{\binom{60}{20}}\\ &=\frac{102}{131747}\\ &\approx 0{,}000774211\\ &\approx 0{,}0774211\% \end{aligned}\]

Portanto (Quina ou melhor, isto é, $(X\ge 5)$):

\[\begin{aligned} p_{\ge 5} &=\frac{1632+102}{131747}\\ &=\frac{1734}{131747}\\ &\approx 0{,}01316159\\ &\approx 1{,}316159\% \end{aligned}\]

Observação prática importante:


5) Com 57 apostas de 20 números: chance de sair ao menos uma Quina (ou até Sena)

Assumindo as 57 apostas como 57 tentativas “separadas”, usamos o complemento:

\[\begin{aligned} P(\ge 1\ \text{Quina em 57}) &=1-(1-p_{\ge 5})^{57} \end{aligned}\]

Substituindo $(p_{\ge 5}\approx 0{,}01316159)$:

\[\begin{aligned} P(\ge 1) &=1-(1-0{,}01316159)^{57}\\ &\approx 0{,}53007932\\ &\approx 53{,}01\% \end{aligned}\]

Uma leitura “1 em $(x)$” (só como referência):

\[\begin{aligned} \frac{1}{0{,}53007932}\approx 1{,}89 \end{aligned}\]

Ou seja: aproximadamente 53% (um pouco melhor que “cara ou coroa”) para sair ao menos uma Quina no pacote de 57 apostas de 20 números.


6) Interpretação (por que ainda pode dar “nada”)

Mesmo com muito dinheiro, ainda existe uma probabilidade relevante de não sair nenhuma Quina:

\[\begin{aligned} P(\text{não sair Quina em 57}) &=(1-p_{\ge 5})^{57}\\ &\approx 1-0{,}53007932\\ &\approx 0{,}46992068\\ &\approx 46{,}99\% \end{aligned}\]

Portanto:


7) (Opcional) Separando “Quina sem Sena”

Se você quiser separar “ganhar Quina, mas não ganhar Sena”:

\[\begin{aligned} P(\ge 1\ \text{Quina e nenhuma Sena}) &=(1-p_6)^{57}-(1-p_{\ge 5})^{57}\\ &\approx 48{,}69\% \end{aligned}\]

E a probabilidade de sair ao menos uma Sena (seu cálculo anterior) permanece:

\[P(\ge 1\ \text{Sena em 57}) =1-(1-p_{20})^{57} \approx 4{,}3186828\%.\]

Portanto:


Referência rápida
  • Probabilidade teórica de um número específico sair em um sorteio: \(6/60=1/10\)
  • Contagem de um número em \(N\) sorteios (modelo): \(X_k\sim\text{Bin}(N,0{,}1)\)
  • Frequência esperada: \(\mathbb{E}[X_k]=N/10\)
  • Desvio padrão: \(\sigma=\sqrt{0{,}09N}\)
  • Probabilidade de pelo menos 1 repetição entre dois sorteios seguidos: \(1-\binom{54}{6}/\binom{60}{6}\approx 0{,}484\)
  • Probabilidade de acertar a Sena com 20 números em uma aposta: \(p_{20}=\binom{20}{6}/\binom{60}{6}=\frac{102}{131747}\approx 0{,}0774\%\)
Escrito em 29/12/2025