A média aritmética é a medida de tendência central mais utilizada e conhecida. Ela representa o valor que mostra para onde os dados tendem a se agrupar, ou seja, o ponto de equilíbrio de um conjunto de valores.
A média aritmética de um conjunto de dados observados é igual à soma dos valores numéricos de cada observação, dividida pelo número total de observações.
Origem e História
O termo “aritmética” tem suas raízes no termo latino arithmetica, que deriva das palavras gregas ἀριθμός (arithmos), que significa número, e ἀριθμητική τέχνη (arithmetike tekhne), que significa a arte de contar.
A palavra “média” tem uma etimologia curiosa e multifacetada, enraizada tanto no comércio marítimo quanto na matemática. Sua origem remonta ao latim medieval avaria, termo usado no contexto das viagens comerciais marítimas no Mediterrâneo dos séculos XII e XIII para designar danos, perdas ou despesas extraordinárias sofridas durante uma travessia. Quando mercadorias precisavam ser descartadas ao mar para salvar o navio, os prejuízos eram distribuídos proporcionalmente entre todos os comerciantes envolvidos. Essa prática jurídica deu origem ao conceito de avaria grossa (general average, em inglês), onde cada parte contribuía com uma parte proporcional da perda.
Fórmula da Média Aritmética
A fórmula para calcular a média aritmética simples é:
\[\bar{x} = \frac{x_1 + x_2 + x_3 + \dots + x_n}{n} = \frac{\sum_{i=1}^{n} x_i}{n}\]Onde:
- $\bar{x}$ é a média aritmética
- $x_1, x_2, \dots, x_n$ são os valores do conjunto de dados
- $n$ é o número de elementos no conjunto
Notação: Média Amostral vs. Média Populacional
É fundamental distinguir dois contextos na estatística:
Média Amostral ($\bar{x}$): calculada a partir de uma amostra de $n$ observações extraídas de uma população. É uma estatística — varia de amostra para amostra.
\[\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}\]Média Populacional ($\mu$): parâmetro verdadeiro que descreve a população inteira de $N$ elementos. Em geral, desconhecido na prática.
\[\mu = \frac{\sum_{i=1}^{N} x_i}{N}\]A média amostral $\bar{x}$ é um estimador não-viesado de $\mu$, pois $E[\bar{x}] = \mu$. Isso significa que, em média (sobre todas as amostras possíveis), a média amostral coincide com o parâmetro populacional — propriedade essencial para a inferência estatística.
Em distribuições assimétricas, como a distribuição de renda ou de tempos de espera, a média pode não representar bem a tendência central.
Nestes casos, considere usar a mediana ou a moda, conforme o objetivo da análise estatística.
Exemplo Prático
Vamos calcular a média das notas de um aluno em cinco provas:
Exemplo em Julia
Aqui está como você pode calcular a média aritmética em Julia:
# Definindo as notas do aluno
notas = [7.5, 8.0, 6.5, 9.0, 8.5]
# Calculando a média usando a função mean() do pacote Statistics
using Statistics
media = mean(notas)
# Mostrando o resultado
println("As notas são: ", notas)
println("A média é: ", round(media, digits=2))
Saída esperada:
Explicação do código:
- Criamos um vetor
notascom as cinco notas do aluno - Utilizamos a função
mean()do pacoteStatisticspara calcular a média - Exibimos as notas e o resultado da média
Você também pode calcular a média manualmente em Julia:
# Cálculo manual da média
soma = sum(notas)
quantidade = length(notas)
media_manual = soma / quantidade
println("Soma: ", soma)
println("Quantidade de notas: ", quantidade)
println("Média calculada manualmente: ", round(media_manual, digits=2))
Dicas úteis:
- Certifique-se de que o pacote
Statisticsesteja carregado comusing Statistics - A função
mean()também funciona com arrays multidimensionais - Para dados muito grandes, considere usar
mean(skipmissing(dados))para lidar com valores ausentes
Vamos calcular a média das notas de um aluno em cinco provas:
| Prova | Nota |
|---|---|
| 1 | 7.5 |
| 2 | 8.0 |
| 3 | 6.5 |
| 4 | 9.0 |
| 5 | 8.5 |
Aplicando a fórmula:
\[\bar{x} = \frac{7.5 + 8.0 + 6.5 + 9.0 + 8.5}{5} = \frac{39.5}{5} = 7.9\]Portanto, a média do aluno é 7.9.
A média aritmética de um conjunto de dados observados é igual à soma dos valores numéricos de cada observação, dividida pelo número total de observações.
Em outras palavras, a média aritmética é o valor central de um conjunto de dados, calculado pela soma de todos os valores dividida pela quantidade de valores. Ela fornece uma medida simples da “tendência central” dos dados.
Em termos simples, a média é calculada somando-se todos os valores de um conjunto de dados e dividindo-se pelo número total de elementos.
Média para Dados Agrupados
Quando os dados são organizados em uma distribuição de frequências (tabela de classes), a média aritmética é calculada usando os pontos médios de cada classe ($x_i$) ponderados pelas respectivas frequências absolutas ($f_i$):
\[\bar{x} = \frac{\sum_{i=1}^{k} f_i \cdot x_i}{\sum_{i=1}^{k} f_i} = \frac{\sum_{i=1}^{k} f_i \cdot x_i}{n}\]Onde:
- $k$ é o número de classes (intervalos)
- $x_i$ é o ponto médio da $i$-ésima classe (calculado como $\frac{\text{limite inferior} + \text{limite superior}}{2}$)
- $f_i$ é a frequência absoluta da $i$-ésima classe
- $n = \sum_{i=1}^{k} f_i$ é o total de observações
Exemplo: Distribuição das notas de 30 alunos em uma prova:
| Classe (Notas) | Ponto Médio ($x_i$) | Frequência ($f_i$) | $f_i \cdot x_i$ |
|---|---|---|---|
| [5,0 – 6,0) | 5,5 | 4 | 22,0 |
| [6,0 – 7,0) | 6,5 | 8 | 52,0 |
| [7,0 – 8,0) | 7,5 | 12 | 90,0 |
| [8,0 – 9,0) | 8,5 | 6 | 51,0 |
| Total | — | 30 | 215,0 |
Importante: O resultado para dados agrupados é uma aproximação da média real, pois assume que todos os valores dentro de uma classe estão concentrados no ponto médio da classe. A precisão aumenta conforme o número de classes e o tamanho da amostra crescem.
Tipos de Média
Média Aritmética Simples
É a média convencional, onde todos os valores têm o mesmo peso no cálculo.
Exemplo: Para o conjunto {2, 4, 6, 8, 10}
Média = (2 + 4 + 6 + 8 + 10) ÷ 5 = 30 ÷ 5 = 6
Média Aritmética Ponderada
Neste tipo de média, cada valor tem um peso diferente no cálculo final.
\[\bar{x} = \frac{\sum_{i=1}^{n} x_i \cdot w_i}{\sum_{i=1}^{n} w_i}\]Onde $w_i$ representa o peso de cada valor.
Exemplo: Cálculo de média final com pesos diferentes para provas
Prova 1: nota 7,0 (peso 2)
Prova 2: nota 8,0 (peso 3)
Prova 3: nota 9,0 (peso 5)
Média Ponderada = (7×2 + 8×3 + 9×5) ÷ (2+3+5) = (14 + 24 + 45) ÷ 10 = 83 ÷ 10 = 8,3
Média Geométrica
A média geométrica é usada principalmente para conjuntos de valores positivos e para taxas de crescimento (como juros compostos, crescimento populacional, etc.).
\[M_g = \sqrt[n]{x_1 \cdot x_2 \cdot \ldots \cdot x_n}\]Exemplo: Para os valores 2, 8 e 32:
Média geométrica = $(2 \times 8 \times 32)^{1/3} = (512)^{1/3} = 8$
Nota: A média geométrica só é definida para números positivos.
Média Harmônica
A média harmônica é especialmente útil para médias de razões, como velocidade média em trajetos com diferentes velocidades.
\[M_h = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}}\]Exemplo: Um carro percorre duas distâncias iguais a 60 km, uma a 30 km/h e outra a 60 km/h. Qual a velocidade média?
A velocidade média NÃO é a aritmética dos dois valores (45 km/h), pois o carro passa mais tempo no trecho mais lento. A distância total é $2 \times 60 = 120$ km; o tempo total é $\frac{60}{30} + \frac{60}{60} = 2 + 1 = 3$ h. Portanto:
\[v_{\text{média}} = \frac{120 \text{ km}}{3 \text{ h}} = 40 \text{ km/h}\]Confirmando com a fórmula da média harmônica:
\[M_h = \frac{2}{\dfrac{1}{30} + \dfrac{1}{60}} = \frac{2}{\dfrac{3}{60}} = 40 \text{ km/h}\]Nota: A média harmônica é sempre menor ou igual à média aritmética.
Quando NÃO usar a média harmônica em contextos de viagem
A média harmônica é a medida correta somente quando as distâncias percorridas em cada velocidade são iguais. Nas situações abaixo ela produz resultados incorretos:
| Situação | Medida correta | Por quê |
|---|---|---|
| Tempos iguais em cada velocidade (não distâncias) | Média aritmética | O tempo é o denominador fixo; cada segundo conta igualmente. |
| Distâncias diferentes em cada velocidade | Média ponderada $\frac{\sum d_i}{\sum (d_i/v_i)}$ | A ponderação deve refletir o comprimento de cada trecho. |
| Uma das velocidades é zero (parada total) | Indefinida / zero | A fórmula diverge: $1/v_i \to \infty$; o tempo de viagem torna-se infinito. |
| Combinação de taxas heterogêneas (ex: km/h com m/s) | Conversão antes + media harmônica | Unidades inconsistentes violam a premissa da fórmula. |
Exemplo do erro mais comum: Um ciclista pedala 10 km a 20 km/h e 30 km a 15 km/h. As distâncias são desiguais, portanto a média harmônica simples (M_h = 2/(1/20 + 1/15) ≈ 17,1 km/h) estaria errada. O valor correto é:
Regra prática: Sempre identifique qual é a grandeza fixa em cada observação. Se a distância é fixa, use a harmônica. Se o tempo é fixo, use a aritmética. Se nenhum é fixo, use a fórmula geral $\bar{v} = \frac{\sum d_i}{\sum t_i}$.
Média Quadrática (ou RMS)
A média quadrática é usada para medir a magnitude média de um conjunto de números, especialmente em física e engenharia (ex: corrente alternada).
\[M_q = \sqrt{\frac{1}{n}\sum_{i=1}^{n} x_i^2}\]Exemplo: Para os valores 3, 4 e 5:
Média quadrática = $\sqrt{\frac{3^2 + 4^2 + 5^2}{3}} = \sqrt{\frac{9+16+25}{3}} = \sqrt{\frac{50}{3}} \approx 4,08$
Nota: A média quadrática é sempre maior ou igual à média aritmética.
Média Móvel
A média móvel é uma ferramenta estatística utilizada para suavizar flutuações em séries temporais, facilitando a identificação de tendências ao longo do tempo. É muito utilizada em análise de dados financeiros, economia, meteorologia e controle de qualidade.
Definição:
A média móvel de ordem $k$ é calculada tirando a média dos últimos $k$ valores de uma série de dados, deslocando essa janela ao longo do tempo.
Fórmula:
\[MM_t = \frac{x_{t} + x_{t-1} + \ldots + x_{t-k+1}}{k}\]Onde:
- $MM_t$ = média móvel no tempo $t$
- $k$ = número de períodos da janela
- $x$ = valores da série
Exemplo:
Considere a série: 10, 12, 14, 16, 18, 20
Média móvel de ordem 3:
- 1ª média: (10 + 12 + 14) / 3 = 12
- 2ª média: (12 + 14 + 16) / 3 = 14
- 3ª média: (14 + 16 + 18) / 3 = 16
- 4ª média: (16 + 18 + 20) / 3 = 18
Portanto, a sequência de médias móveis é: 12, 14, 16, 18
Aplicações Comuns:
- Análise de tendências em séries financeiras (ex: preços de ações)
- Suavização de dados meteorológicos (ex: temperatura média)
- Controle de qualidade industrial
Nota: A escolha do valor de $k$ (tamanho da janela) afeta o quanto a série será suavizada: janelas maiores suavizam mais, mas podem atrasar a identificação de mudanças rápidas na tendência.
Média Móvel Ponderada (WMA)
Na média móvel ponderada (Weighted Moving Average), os valores mais recentes recebem pesos maiores, tornando a média mais responsiva a mudanças recentes:
\[WMA_t = \frac{\sum_{j=0}^{k-1} w_j \cdot x_{t-j}}{\sum_{j=0}^{k-1} w_j}\]Uma escolha comum é $w_j = k - j$, de modo que o valor mais recente tem peso $k$, o anterior peso $k-1$, e assim por diante.
Média Móvel Exponencial (EMA)
A média móvel exponencial (Exponential Moving Average) aplica pesos que decrescem exponencialmente com o tempo, controlados por um parâmetro de suavização $\alpha \in (0, 1)$:
\[EMA_t = \alpha \cdot x_t + (1 - \alpha) \cdot EMA_{t-1}\]Quanto maior o $\alpha$, mais peso é dado às observações recentes (menor “memória” do passado). É amplamente utilizada em análise técnica de mercados financeiros.
Resumo comparativo das médias móveis: A SMA trata todos os períodos igualmente; a WMA favorece períodos mais recentes com pesos lineares; a EMA favorece periodos recentes com decaimento exponencial, sendo a mais rápida para responder a novas tendências.
Resumo Visual
| Tipo | Fórmula Principal | Aplicação Comum |
|---|---|---|
| Aritmética Simples | $\bar{x} = \frac{\sum x_i}{n}$ | Dados gerais |
| Aritmética Ponderada | $\bar{x} = \frac{\sum x_i w_i}{\sum w_i}$ | Notas, médias com pesos |
| Geométrica | $M_g = \sqrt[n]{x_1 x_2 … x_n}$ | Crescimento, taxas |
| Harmônica | $M_h = \frac{n}{\sum \frac{1}{x_i}}$ | Razões, velocidades médias |
| Quadrática (RMS) | $M_q = \sqrt{\frac{1}{n}\sum x_i^2}$ | Física, engenharia |
| Móvel (SMA) | $MM_t = \frac{1}{k}\sum_{j=0}^{k-1} x_{t-j}$ | Séries temporais, finanças |
Propriedades da Média
- Influência de valores extremos: A média é sensível a valores extremos (outliers). Um valor muito alto ou muito baixo pode distorcer significativamente o resultado.
- Representatividade: A média nem sempre representa bem um conjunto de dados com distribuição assimétrica.
- Unicidade: Para um conjunto de dados, existe apenas uma média aritmética.
- Valor intermediário: A média sempre está entre o valor mínimo e o valor máximo do conjunto.
Além dessas propriedades gerais, a média aritmética possui propriedades matemáticas formais com implicações diretas na análise estatística:
1. Soma dos desvios é zero: A soma das diferenças entre cada observação e a média é sempre igual a zero. Essa propriedade expressa o caráter de “ponto de equilíbrio” da média.
\[\sum_{i=1}^{n} (x_i - \bar{x}) = 0\]2. Mínimo da soma dos desvios quadráticos: Dentre todas as constantes $c$, a média $\bar{x}$ é a única que minimiza a soma dos quadrados dos desvios. Essa é a base do método dos Mínimos Quadrados Ordinários (MQO).
\[\bar{x} = \underset{c}{\arg\min} \sum_{i=1}^{n} (x_i - c)^2\]3. Linearidade: Se transformarmos cada valor $x_i$ por uma função linear $y_i = a \cdot x_i + b$, a média de $y$ é determinada diretamente pela média de $x$:
\[\bar{y} = a \cdot \bar{x} + b\]Essa propriedade simplifica enormemente os cálculos em transformações de escala e de origem.
4. Aditividade: A média do conjunto união de dois grupos pode ser calculada a partir das médias e tamanhos de cada grupo (média ponderada das médias):
\[\bar{x}_{\text{total}} = \frac{n_1 \bar{x}_1 + n_2 \bar{x}_2}{n_1 + n_2}\]Limitações da Média
Embora seja uma medida amplamente utilizada, a média apresenta algumas limitações:
- É fortemente influenciada por valores extremos (outliers)
- Não representa bem conjuntos com distribuição assimétrica
- Pode resultar em um valor que não existe no conjunto original
- Não fornece informações sobre a dispersão dos dados
Por isso, é importante considerar outras medidas de tendência central, como a mediana e a moda, para uma análise mais completa.
Erro Padrão da Média
O erro padrão da média (EMP, ou Standard Error of the Mean — SEM) quantifica a variabilidade esperada das médias amostrais em torno do parâmetro populacional $\mu$:
\[\text{EMP} = \frac{s}{\sqrt{n}}\]Onde $s$ é o desvio padrão amostral e $n$ é o tamanho da amostra.
Por que isso importa? Enquanto o desvio padrão $s$ descreve a dispersão dos dados individuais, o erro padrão descreve a precisão da estimativa $\bar{x}$ para $\mu$. Quanto maior a amostra, menor o EMP — matematicamente capturando a ideia de que mais dados geram estimativas mais confiáveis.
Exemplo: Uma amostra de $n = 25$ observações com desvio padrão $s = 10$:
\[\text{EMP} = \frac{10}{\sqrt{25}} = \frac{10}{5} = 2{,}0\]Isso indica que a média amostral tende a se afastar da média populacional em torno de 2 unidades.
O erro padrão da média é a base para:
- Construção de intervalos de confiança: $\bar{x} \pm z_{\alpha/2} \cdot \text{EMP}$
- Testes de hipóteses sobre $\mu$ (teste $z$ e teste $t$)
- Avaliação do tamanho de amostra necessário para uma precisão desejada
Notas Importantes
- Sempre escolha o tipo de média mais adequado ao contexto do problema.
- A média aritmética pode ser enganosa em dados com muitos extremos (outliers).
- A média geométrica não é adequada para valores negativos ou zero.
- A média harmônica é ideal para médias de taxas (ex: velocidade, produtividade).
- A média quadrática é útil quando se deseja dar mais peso a valores maiores.
A média é puxada na direção dos valores extremos (cauda), enquanto a mediana representa o valor central e a moda indica o valor mais frequente.
Curiosidade
Desigualdade das Médias (AM–GM–HM–QM)
Para qualquer conjunto de $n$ valores estritamente positivos $x_1, x_2, \ldots, x_n$, vale a seguinte cadeia de desigualdades:
\[M_h \;\leq\; M_g \;\leq\; \bar{x} \;\leq\; M_q\]Em notação explícita:
\[\frac{n}{\displaystyle\sum_{i=1}^{n} \frac{1}{x_i}} \;\leq\; \sqrt[n]{\prod_{i=1}^{n} x_i} \;\leq\; \frac{\displaystyle\sum_{i=1}^{n} x_i}{n} \;\leq\; \sqrt{\frac{\displaystyle\sum_{i=1}^{n} x_i^2}{n}}\]A igualdade em todas as relações ocorre somente quando todos os valores são iguais: $x_1 = x_2 = \cdots = x_n$.
Esse resultado, conhecido como desigualdade das médias (ou desigualdade AM–GM–HM), tem aplicações fundamentais em otimização matemática, teoria da informação, economia e física.
Intuição numérica: Para os valores ${1, 4, 9}$:
- $M_h = \frac{3}{\frac{1}{1}+\frac{1}{4}+\frac{1}{9}} = \frac{3}{\frac{49}{36}} \approx 2{,}20$
- $M_g = \sqrt[3]{1 \cdot 4 \cdot 9} = \sqrt[3]{36} \approx 3{,}30$
- $\bar{x} = \frac{1+4+9}{3} \approx 4{,}67$
- $M_q = \sqrt{\frac{1+16+81}{3}} \approx 6{,}48$
Confirmando: $2{,}20 \leq 3{,}30 \leq 4{,}67 \leq 6{,}48$ ✔
Referências
-
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 10. ed. São Paulo: Saraiva, 2023.
-
MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 6. ed. Rio de Janeiro: LTC, 2016.
-
DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. 8. ed. São Paulo: Cengage Learning, 2014.
-
HOGG, R. V.; McKEAN, J. W.; CRAIG, A. T. Introduction to Mathematical Statistics. 8. ed. Boston: Pearson, 2019.
-
CASELLA, G.; BERGER, R. L. Statistical Inference. 2. ed. Pacific Grove: Duxbury, 2002.
-
HARDY, G. H.; LITTLEWOOD, J. E.; PÓLYA, G. Inequalities. 2. ed. Cambridge: Cambridge University Press, 1952. (Desigualdade das médias AM–GM–HM)
-
FREEDMAN, D.; PISANI, R.; PURVES, R. Statistics. 4. ed. New York: W. W. Norton & Company, 2007.
-
TUKEY, J. W. Exploratory Data Analysis. Reading: Addison-Wesley, 1977. (Análise exploratória e robustez de medidas de tendência central)
Calculadora de Média
Calcule a média aritmética
Insira os valores separados por vírgula:
Média: -