A amostragem é o processo de selecionar um subconjunto representativo de uma população para realizar inferências estatísticas sobre toda a população. Uma amostra bem escolhida permite estimar parâmetros populacionais com precisão e eficiência, reduzindo custos e tempo em relação ao censo completo.
Para que a inferência seja válida, três condições fundamentais devem ser satisfeitas:
- Representatividade — a composição da amostra deve refletir as características relevantes da população-alvo. Amostras enviesadas distorcem as estimativas independentemente do tamanho.
- Aleatoriedade controlada (nos métodos probabilísticos) — cada elemento deve ter probabilidade conhecida e não nula de ser selecionado, garantindo que as propriedades estatísticas das estimativas sejam matematicamente justificáveis.
- Tamanho adequado — a precisão cresce com a raiz quadrada de (n): para reduzir o erro padrão à metade, é preciso quadruplicar (n).

Por que Amostrar?
- Reduz custos e tempo — um censo completo é frequentemente inviável em termos de logística e tempo de análise
- Permite análises destrutivas — quando o teste destrói o item (resistência de materiais, prazo de validade de produtos, etc.)
- Torna viável o estudo de populações grandes — populações de milhões de elementos só podem ser estudadas via amostra
- Facilita o controle de qualidade — inspeção de 100% da produção é substituída por planos de amostragem padronizados (ex.: ABNT NBR 5426)
- Permite maior profundidade — com uma amostra menor, é possível coletar mais variáveis por elemento e com melhor qualidade de dados
Conceitos Fundamentais
- População ($N$): Conjunto completo de elementos ou observações de interesse.
- Origem: Do latim “populatio”, referente ao conjunto de pessoas ou coisas.
- Amostra ($n$): Subconjunto da população, selecionado para análise.
- Origem: Do latim “amostra”, porção retirada para representar o todo.
- Parâmetro ($\mu$, $\sigma$, $p$): Medida numérica que descreve uma característica da população (ex: média $\mu$, desvio padrão $\sigma$, proporção $p$).
- Origem: Do grego “parámetros”, aquilo que serve de referência.
- Estatística ($\bar{x}$, $s$, $\hat{p}$): Medida numérica que descreve uma característica da amostra (ex: média amostral $\bar{x}$, desvio padrão amostral $s$, proporção amostral $\hat{p}$).
- Origem: Do latim “statisticum”, relativo ao Estado, e do italiano “statistica”, ciência dos dados do Estado.
- Cadastro Amostral (sampling frame): Lista ou registro dos elementos elegíveis da população, a partir do qual a amostra é efetivamente selecionada. Um cadastro incompleto ou desatualizado gera viés de cobertura mesmo em amostras probabilísticas perfeitas.
- Erro Amostral ($\varepsilon$): Diferença inevitável entre a estatística amostral e o parâmetro populacional ($\varepsilon = \bar{x} - \mu$). Em amostras probabilísticas, $\mathbb{E}[\varepsilon] = 0$ — o erro é aleatório, sem direção sistemática, e reduzível com $n$ maior.
- Fração Amostral ($f = n/N$): Proporção da população incluída na amostra. Quando $f < 0{,}05$, a correção para população finita é geralmente dispensada — a população pode ser tratada como infinita para fins de cálculo.
- Viés (bias): Erro sistemático que desloca as estimativas consistentemente em uma direção. Diferentemente do erro amostral, não é reduzido aumentando $n$ — exige correção no próprio desenho da pesquisa.
Tipos de Amostragem: Conceitos, Prós, Contras e Exemplos
1. Amostragem Aleatória Simples
Conceito: Cada elemento da população tem a mesma probabilidade de ser selecionado. A seleção é feita de forma totalmente aleatória, geralmente por sorteio ou uso de geradores de números aleatórios.
Prós:
- Simples de entender e aplicar
- Resultados facilmente generalizáveis se a amostra for realmente aleatória
Contras:
- Requer lista completa da população
- Pode ser inviável para populações muito grandes
Exemplo prático manual (passo a passo):
Uma escola tem 10 alunos (A, B, C, D, E, F, G, H, I, J). Queremos sortear 3 para uma pesquisa.
- Liste todos os alunos: A, B, C, D, E, F, G, H, I, J
- Atribua um número a cada aluno: 1 a 10
- Sorteie 3 números aleatórios entre 1 e 10 (ex: 2, 7, 9)
- Os alunos selecionados são: B, G, I
Exemplo em Julia:
using Random
alunos = ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J"]
Random.seed!(123) # para reprodutibilidade
amostra = sample(alunos, 3; replace=false)
println("Amostra selecionada: ", amostra)
2. Amostragem Sistemática
Conceito: Seleciona-se um ponto de partida aleatório e, a partir dele, escolhe-se cada k-ésimo elemento da lista ordenada da população.
Prós:
- Mais simples e rápida que a aleatória simples
- Útil para populações grandes e listas ordenadas
Contras:
- Pode introduzir viés se houver periodicidade na lista
- Requer lista ordenada
Exemplo prático manual (passo a passo):
População de 20 funcionários, queremos amostra de 5.
- Calcule o intervalo k: $k = N/n = 20/5 = 4$
- Sorteie um número inicial entre 1 e 4 (ex: 3)
- Selecione os funcionários nas posições: 3, 7, 11, 15, 19
Exemplo em Julia:
using Random
N = 20; n = 5
k = div(N, n)
Random.seed!(42)
inicio = rand(1:k)
posicoes = [inicio + (i-1)*k for i in 1:n]
println("Posições selecionadas: ", posicoes)
3. Amostragem Estratificada
Conceito: A população é dividida em grupos homogêneos (estratos) e amostras são retiradas de cada estrato proporcionalmente ao seu tamanho.
Prós:
- Garante representatividade de todos os grupos
- Reduz variabilidade da amostra
Contras:
- Requer conhecimento prévio dos estratos
- Mais trabalhosa para organizar
Exemplo prático manual (passo a passo):
População: 100 alunos (60 do curso A, 40 do curso B). Queremos amostra de 10.
- Calcule proporção de cada estrato:
- Curso A: $60/100 = 60\%$ → 6 alunos
- Curso B: $40/100 = 40\%$ → 4 alunos
- Sorteie 6 alunos do curso A e 4 do curso B aleatoriamente
Exemplo em Julia:
using Random
alunos_A = ["A"*string(i) for i in 1:60]
alunos_B = ["B"*string(i) for i in 1:40]
Random.seed!(7)
amostra_A = sample(alunos_A, 6; replace=false)
amostra_B = sample(alunos_B, 4; replace=false)
amostra = vcat(amostra_A, amostra_B)
println("Amostra estratificada: ", amostra)
4. Amostragem por Conglomerados
Conceito: A população é dividida em grupos heterogêneos (conglomerados) e alguns grupos inteiros são sorteados para análise.
Prós:
- Reduz custos e tempo
- Útil quando não há lista completa da população
Contras:
- Menor precisão se os conglomerados forem muito diferentes entre si
- Pode introduzir viés se os conglomerados não forem representativos
Exemplo prático manual (passo a passo):
População: 5 bairros, cada um com 100 casas. Queremos amostrar 2 bairros e entrevistar todas as casas desses bairros.
- Liste os bairros: B1, B2, B3, B4, B5
- Sorteie 2 bairros (ex: B2, B4)
- Entrevistar todas as 100 casas de B2 e todas as 100 casas de B4
Exemplo em Julia:
using Random
bairros = ["B1", "B2", "B3", "B4", "B5"]
Random.seed!(21)
conglomerados = sample(bairros, 2; replace=false)
println("Bairros sorteados: ", conglomerados)
5. Amostragem Casual ou por Conveniência
Conceito: Amostra formada por elementos de fácil acesso ao pesquisador.
Prós:
- Rápida e barata
- Útil para estudos exploratórios
Contras:
- Alto risco de viés
- Não representa a população
Exemplo prático manual (passo a passo):
Um pesquisador entrevista as 10 primeiras pessoas que encontra em um shopping.
Exemplo em Julia:
pessoas = ["P"*string(i) for i in 1:100]
amostra = pessoas[1:10]
println("Amostra casual: ", amostra)
6. Amostragem por Quotas
Conceito: Amostra formada por cotas preestabelecidas de acordo com características da população (ex: sexo, idade, renda).
Prós:
- Garante representatividade de subgrupos
- Útil quando não há lista completa da população
Contras:
- Não é aleatória
- Pode introduzir viés do pesquisador
Exemplo prático manual (passo a passo):
Uma pesquisa exige 5 homens e 5 mulheres. O pesquisador entrevista até atingir essas cotas.
Exemplo em Julia:
pessoas = [("M", i) for i in 1:50] # homens
pessoas = vcat(pessoas, [("F", i) for i in 1:50]) # mulheres
amostra_homens = filter(x -> x[1] == "M", pessoas)[1:5]
amostra_mulheres = filter(x -> x[1] == "F", pessoas)[1:5]
amostra = vcat(amostra_homens, amostra_mulheres)
println("Amostra por quotas: ", amostra)
7. Amostragem Intencional (ou por Julgamento)
Conceito: O pesquisador seleciona intencionalmente elementos que considera mais representativos.
Prós:
- Útil para estudos de casos especiais
- Pode ser eficiente em situações específicas
Contras:
- Altamente subjetiva
- Não generalizável
Exemplo prático manual (passo a passo):
Um especialista escolhe 5 empresas líderes do setor para um estudo de benchmarking.
Exemplo em Julia:
empresas = ["EmpresaA", "EmpresaB", "EmpresaC", "EmpresaD", "EmpresaE", "EmpresaF", "EmpresaG"]
amostra = empresas[[1, 2, 3, 4, 5]] # escolhidas pelo especialista
println("Amostra intencional: ", amostra)
8. Amostragem Bola de Neve
Conceito: Os primeiros participantes indicam novos participantes, formando uma cadeia de indicações.
Prós:
- Útil para populações de difícil acesso
- Permite alcançar grupos ocultos
Contras:
- Não aleatória
- Pode gerar amostra enviesada
Exemplo prático manual (passo a passo):
Um pesquisador entrevista um usuário de um grupo restrito, que indica outro, e assim por diante, até atingir o tamanho desejado.
Exemplo em Julia:
pessoas = ["P1", "P2", "P3", "P4", "P5", "P6", "P7", "P8", "P9", "P10"]
indicacoes = Dict("P1"=>"P3", "P3"=>"P7", "P7"=>"P10", "P10"=>"P5")
# Começa com P1 e segue as indicações
amostra = ["P1"]
while haskey(indicacoes, amostra[end])
push!(amostra, indicacoes[amostra[end]])
end
println("Amostra bola de neve: ", amostra)
Comparação dos Métodos de Amostragem
| Método | Tipo | Cadastro | Precisão | Custo | Melhor uso |
|---|---|---|---|---|---|
| Aleatória Simples | Probabilístico | Completo | Alta | Moderado | Populações pequenas e homogêneas |
| Sistemática | Probabilístico | Completo (ordenado) | Alta ⚠ | Baixo | Listas sem periodicidade oculta |
| Estratificada | Probabilístico | Completo | Muito Alta | Moderado | Pop. heterogêneas com estratos conhecidos |
| Conglomerados | Probabilístico | Parcial | Moderada | Baixo | Pop. dispersas geograficamente |
| Conveniência | Não-probabilístico | Não | Baixa | Muito Baixo | Estudos exploratórios e piloto |
| Por Quotas | Não-probabilístico | Não | Moderada | Baixo | Pesquisas de mercado e opinião |
| Intencional | Não-probabilístico | Não | Variável | Baixo | Estudos de caso e benchmarking |
| Bola de Neve | Não-probabilístico | Não | Baixa | Muito Baixo | Populações ocultas ou de difícil acesso |
⚠ Precisão da sistemática pode ser inferior à AAS na presença de periodicidade oculta na lista ordenada.
Erros em Pesquisas por Amostra
Todo resultado de uma pesquisa por amostra está sujeito a dois tipos fundamentalmente distintos de erro:
Erro Amostral
Variação natural e esperada entre amostras diferentes extraídas da mesma população. Resulta do uso de parte, e não todos, os elementos. É quantificável pela margem de erro e reduzível aumentando $n$:
\[\varepsilon = \bar{x} - \mu \qquad \text{com } \mathbb{E}[\varepsilon] = 0 \text{ (amostras probabilísticas)}\]Erros Não-Amostrais (Sistemáticos)
São erros que não diminuem com amostras maiores — são mais perigosos porque frequentemente passam despercebidos:
| Tipo | Descrição | Como mitigar |
|---|---|---|
| Cobertura | Cadastro incompleto exclui parte da população alvo | Atualizar cadastro; usar múltiplas fontes |
| Não-resposta | Elementos selecionados recusam ou não participam | Múltiplas tentativas; analisar perfil dos ausentes |
| Mensuração | Instrumento mal elaborado ou entrevistador induz respostas | Pré-teste do questionário; treinamento padronizado |
| Processamento | Erros na digitação, codificação ou análise dos dados | Dupla digitação; validação automática |
Avisos Importantes
- Amostragem mal planejada introduz vieses que nem amostras enormes conseguem corrigir. A qualidade do desenho amostral supera a quantidade de dados.
- A aleatoriedade é insubstituível em estudos probabilísticos. Sem ela, intervalos de confiança e testes de hipótese perdem sua fundamentação matemática.
- O tamanho da amostra determina a precisão, não a representatividade. Uma amostra pequena e bem desenhada supera uma grande e enviesada.
- Métodos não-probabilísticos (conveniência, quotas, bola de neve) não permitem inferência formal — resultados não devem ser generalizados com margem de erro calculada por fórmulas probabilísticas.
- Aplique a correção para população finita quando $f = n/N > 0{,}05$ para evitar superestimação do tamanho amostral necessário.
Fórmulas Básicas
Tamanho da Amostra para Proporção
\[n = \frac{z_{\alpha/2}^2\; \hat{p}(1-\hat{p})}{E^2}\]Onde:
- $z_{\alpha/2}$ = valor crítico da distribuição normal padrão (ex.: 1,96 para 95% de confiança)
- $\hat{p}$ = proporção estimada (use $\hat{p} = 0{,}5$ quando desconhecida — resulta no maior $n$ possível)
- $E$ = margem de erro máxima tolerável (ex.: 0,05 para ±5 pontos percentuais)
Margem de erro: $E = z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}$ — a semilargura do intervalo de confiança para a proporção.
Tamanho da Amostra para Média — $\sigma$ conhecido
\[n = \left(\frac{z_{\alpha/2}\;\sigma}{E}\right)^2\]Onde:
- $\sigma$ = desvio padrão populacional (conhecido ou estimado por estudo piloto)
- $E$ = diferença máxima tolerável entre $\bar{x}$ e $\mu$
Tamanho da Amostra para Média — $\sigma$ desconhecido (distribuição t)
Quando $\sigma$ não é conhecido e precisa ser estimado por $s$, substitui-se $z_{\alpha/2}$ pelo quantil $t_{\alpha/2;\,n-1}$, que depende do próprio $n$. A solução é iterativa:
\[n^{(k+1)} = \left(\frac{t_{\alpha/2;\;n^{(k)}-1}\cdot s}{E}\right)^2\]Procedimento:
- Parta de $n^{(0)}$ calculado com $z_{\alpha/2}$ (fórmula acima usando $s$ no lugar de $\sigma$)
- Use $t_{\alpha/2;\,n^{(0)}-1}$ para obter $n^{(1)}$
- Repita até convergir (geralmente 2–3 iterações)
using Distributions
# n para média com σ desconhecido (iterativo)
function n_media_t(s, E; alpha=0.05, max_iter=10)
z = quantile(Normal(), 1 - alpha/2)
n = ceil(Int, (z * s / E)^2) # ponto de partida com z
for _ in 1:max_iter
t = quantile(TDist(n - 1), 1 - alpha/2)
n_novo = ceil(Int, (t * s / E)^2)
n_novo == n && break
n = n_novo
end
println("n necessário (t iterativo) = $n")
return n
end
# Exemplo: s=2.4, erro=0.8, confiança 95%
n_media_t(2.4, 0.8; alpha=0.05)
Resumo das Fórmulas de Tamanho Amostral
| Situação | Fórmula | Observação |
|---|---|---|
| Proporção (pop. infinita) | $n = z_{\alpha/2}^2\hat{p}(1-\hat{p})/E^2$ | Use $\hat{p}=0{,}5$ se desconhecida |
| Proporção (pop. finita) | Cochran com correção $n_0/(1+(n_0-1)/N)$ | Usar quando $f > 0{,}05$ |
| Média, $\sigma$ conhecido | $n = (z_{\alpha/2}\sigma/E)^2$ | Solução direta |
| Média, $\sigma$ desconhecido | $n = (t_{\alpha/2;\,n-1}\cdot s/E)^2$ (iterativo) | Exige estudo piloto para $s$ |
Exemplo Prático
Uma fábrica deseja estimar a proporção de peças defeituosas em sua produção diária. Deseja-se um erro máximo de 3% e um nível de confiança de 95%. Supondo proporção estimada de 0,10, qual o tamanho mínimo da amostra?
Resolução
\[z = 1,96\ (95\%\ de\ confiança)\qquad \hat{p} = 0,10\qquad E = 0,03\] \[n = \frac{1,96^2 \times 0,10 \times 0,90}{0,03^2} = \frac{3,8416 \times 0,09}{0,0009} = \frac{0,3457}{0,0009} \approx 384,11\]Arredondando para cima:
\[n = 385\]Portanto, a amostra deve ter pelo menos 385 peças.
Exemplo em Julia
using Distributions
# Parâmetros
z = quantile(Normal(), 1 - 0.05/2) # 95% de confiança
p̂ = 0.10 # proporção estimada
erro = 0.03 # erro máximo tolerável
# Cálculo do tamanho da amostra
n = ceil(Int, (z^2 * p̂ * (1 - p̂)) / erro^2)
println("Tamanho mínimo da amostra: $n")
Exemplo Prático: Pesquisa de Intenção de Voto para Presidente
Uma empresa de pesquisas deseja estimar a proporção de eleitores que pretendem votar em um determinado candidato à presidência. Para garantir um nível de confiança de 95% e um erro máximo de 2%, qual deve ser o tamanho mínimo da amostra, supondo que a proporção estimada de intenção de voto seja de 40%?
Resolução Manual Passo a Passo
Dados:
- Nível de confiança: 95% ($\alpha = 0,05$)
- Proporção estimada ($\hat{p}$): 0,40
- Erro máximo tolerável ($E$): 0,02
O que é a proporção estimada ($\hat{p}$)?
A proporção estimada ($\hat{p}$) representa a melhor estimativa, antes da pesquisa, da fração da população que possui a característica de interesse. No contexto de uma pesquisa eleitoral, é a estimativa inicial da porcentagem de eleitores que pretendem votar no candidato analisado. Essa estimativa pode ser baseada em pesquisas anteriores, dados históricos ou, na ausência de informações, pode-se usar o valor mais conservador ($\hat{p} = 0,5$), que resulta no maior tamanho de amostra possível.
1. Valor crítico $z_{\alpha/2}$
Para 95% de confiança: \(z_{\alpha/2} = 1,96\)
2. Aplicando a fórmula do tamanho da amostra para proporção
\[n = \frac{z_{\alpha/2}^2 \hat{p}(1-\hat{p})}{E^2}\]Substituindo os valores: \(n = \frac{1,96^2 \times 0,40 \times 0,60}{0,02^2}\)
Calculando passo a passo:
- $1,96^2 = 3,8416$
- $0,40 \times 0,60 = 0,24$
- $0,02^2 = 0,0004$
Arredondando para cima: \(n = 2305\)
Portanto, a amostra deve ter pelo menos 2.305 eleitores para garantir o erro máximo de 2% com 95% de confiança.
Exemplo em Julia
using Distributions
# Parâmetros
z = quantile(Normal(), 1 - 0.05/2) # 95% de confiança
p̂ = 0.40 # proporção estimada
erro = 0.02 # erro máximo tolerável
# Cálculo do tamanho da amostra
n = ceil(Int, (z^2 * p̂ * (1 - p̂)) / erro^2)
println("Tamanho mínimo da amostra: $n")
Fórmulas Adicionais para Tamanho de Amostra
Fórmula de Cochran com Correção para População Finita
A fórmula de Cochran é usada para calcular o tamanho da amostra quando a população é grande ou desconhecida. Quando a população é finita ($N$), uma correção é aplicada para ajustar o tamanho da amostra, resultando em um número menor e mais eficiente.
Fórmula:
\[n = \frac{n_0}{1 + \frac{n_0 - 1}{N}} \quad \text{onde} \quad n_0 = \frac{Z^2 \cdot p \cdot (1-p)}{E^2}\]Isso é algebricamente equivalente a:
\[n = \frac{N \cdot Z^2 \cdot p \cdot (1-p)}{E^2 \cdot (N-1) + Z^2 \cdot p \cdot (1-p)}\]Exemplo prático manual (passo a passo):
Calcular o tamanho da amostra para uma população de N = 5000, com 95% de confiança ($Z = 1,96$), margem de erro de 5% ($E = 0,05$) e proporção estimada $p = 0,5$.
- Calcular o numerador: $N \cdot Z^2 \cdot p \cdot (1-p)$
- Calcular o denominador: $E^2 \cdot (N-1) + Z^2 \cdot p \cdot (1-p)$
- Dividir:
Arredondando para cima, n = 357.
Exemplo em Julia:
using Distributions
# Parâmetros
N = 5000 # Tamanho da população
z = quantile(Normal(), 1 - 0.05/2) # 95% de confiança
p̂ = 0.5 # proporção estimada (mais conservador)
erro = 0.05 # erro máximo tolerável
# Cálculo do tamanho da amostra com correção
numerador = N * z^2 * p̂ * (1 - p̂)
denominador = erro^2 * (N - 1) + z^2 * p̂ * (1 - p̂)
n = ceil(Int, numerador / denominador)
println("Tamanho mínimo da amostra (população finita): $n")
Alocação de Amostra Estratificada
Após calcular o tamanho total da amostra ($n$), é preciso distribuí-lo entre os diferentes estratos. As duas abordagens mais comuns são a alocação proporcional e a alocação de Neyman.
1. Alocação Proporcional
Distribui o tamanho da amostra proporcionalmente ao tamanho de cada estrato na população.
Fórmula:
\[n_h = n \cdot \frac{N_h}{N}\]Onde:
- $n_h$ = tamanho da amostra do estrato $h$
- $n$ = tamanho total da amostra
- $N_h$ = tamanho da população do estrato $h$
- $N$ = tamanho total da população
Exemplo prático manual (passo a passo):
Uma universidade tem 10.000 alunos ($N=10000$). O tamanho total da amostra calculado foi de $n=400$. Os alunos estão divididos em dois estratos:
- Estrato A (Exatas): 6.000 alunos ($N_A = 6000$)
- Estrato B (Humanas): 4.000 alunos ($N_B = 4000$)
- Alocação para Estrato A:
- Alocação para Estrato B:
A amostra será composta por 240 alunos de Exatas e 160 de Humanas.
Exemplo em Julia:
# Parâmetros
n_total = 400
N_total = 10000
N_estratos = Dict("Exatas" => 6000, "Humanas" => 4000)
n_alocada = Dict()
for (estrato, N_h) in N_estratos
n_h = n_total * (N_h / N_total)
n_alocada[estrato] = ceil(Int, n_h)
end
println("Alocação Proporcional: ", n_alocada)
2. Alocação de Neyman (Ótima)
Considera tanto o tamanho do estrato quanto sua variabilidade (desvio padrão). Estratos com maior variabilidade recebem uma amostra maior para aumentar a precisão geral.
Fórmula:
\[n_h = n \cdot \frac{N_h \cdot \sigma_h}{\sum (N_i \cdot \sigma_i)}\]Onde:
- $\sigma_h$ = desvio padrão do estrato $h$
Exemplo prático manual (passo a passo):
Usando o mesmo exemplo da universidade ($n=400, N_A=6000, N_B=4000$), suponha que um estudo piloto revelou os seguintes desvios padrão para as notas dos alunos:
- Estrato A (Exatas): $\sigma_A = 10$ (notas mais homogêneas)
- Estrato B (Humanas): $\sigma_B = 20$ (notas mais heterogêneas)
- Calcular o denominador $\sum (N_i \cdot \sigma_i)$:
- Alocação para Estrato A:
- Alocação para Estrato B:
Arredondando, a amostra será de 171 alunos de Exatas e 229 de Humanas. Note como o estrato com maior variabilidade (Humanas) recebeu uma amostra maior, mesmo tendo uma população menor.
Exemplo em Julia:
# Parâmetros
n_total = 400
estratos = Dict(
"Exatas" => (N_h=6000, σ_h=10),
"Humanas" => (N_h=4000, σ_h=20)
)
n_alocada_neyman = Dict()
# Calcular denominador
denominador_neyman = sum(v.N_h * v.σ_h for (k, v) in estratos)
for (estrato, pars) in estratos
numerador = pars.N_h * pars.σ_h
n_h = n_total * (numerador / denominador_neyman)
n_alocada_neyman[estrato] = round(Int, n_h)
end
println("Alocação de Neyman: ", n_alocada_neyman)
Guia de Escolha do Método de Amostragem
A escolha do método depende de cinco critérios práticos. Responda às perguntas abaixo em ordem:
| # | Pergunta | Se SIM | Se NÃO |
|---|---|---|---|
| 1 | Existe cadastro completo e atualizado da população? | Vá para 2 | Conglomerados, Quotas ou Bola de Neve |
| 2 | A população é heterogênea com subgrupos identificáveis? | Estratificada (máxima precisão) | Vá para 3 |
| 3 | O cadastro está ordenado sem periodicidade oculta? | Sistemática (operacionalmente simples) | Aleatória Simples (referência padrão) |
| 4 | O orçamento é restrito e a população é geograficamente dispersa? | Conglomerados (reduz deslocamento) | Manter método probabilístico anterior |
| 5 | O objetivo é apenas exploratório ou piloto? | Conveniência (rápido, sem inferência formal) | Retornar ao passo 1 com rigor probabilístico |
Referências Bibliográficas
- Montgomery, D. C.; Runger, G. C. Applied Statistics and Probability for Engineers. 6ª ed. Wiley, 2014.
- Morettin, P. A.; Bussab, W. O. Estatística Básica. 9ª ed. Saraiva, 2017.
- Triola, M. F. Introdução à Estatística. 12ª ed. LTC, 2017.
- Bolfarine, H.; Bussab, W. O. Elementos de Amostragem. Blucher, 2005.
- Cochran, W. G. Sampling Techniques. 3ª ed. Wiley, 1977. — Referência clássica para teoria de amostragem.
- Lohr, S. L. Sampling: Design and Analysis. 2ª ed. Brooks/Cole, 2009. — Tratamento moderno com exemplos computacionais.
- Groves, R. M. et al. Survey Methodology. 2ª ed. Wiley, 2009. — Cobre erros amostrais e não-amostrais em profundidade.
- Kish, L. Survey Sampling. Wiley, 1965. — Fundamentos matemáticos da amostragem complexa.
🎧 Podcast: Aprofundando em Amostragem
Para uma discussão mais aprofundada sobre o tema, ouça o nosso podcast. Cobrimos exemplos práticos e dicas para escolher a distribuição correta para seus dados.