Suponhamos que ao copiar o enunciado de um problema em vez de escrever o seguinte conjunto de dados:
5, 2, 10, 6, 9,
redigiu-se: 5, 2, 50, 6, 9.
Estude o comportamento das duas medidas de localização do centro da amostra relativamente ao outlier introduzido (o valor 50).
Observemos a seguinte tabela:
Dados originais ( 5,2,10,6,9 ) |
Dados copiados (5,2,50,6,9) |
|
Media |
6.4 |
14.4 |
Mediana |
6 |
6 |
Resumindo, uma vez que a média é influenciada quer por valores muito grandes, quer por valores muito pequenos, se a distribuição dos dados for enviesada para a direita (alguns valores como outliers), a média tende a ser maior que a mediana; se for aproximadamente simétrica, a média aproxima-se da mediana e se for enviesada para a esquerda (alguns valores pequenos como outliers), a média tende a ser inferior à mediana.
Representando as distribuições dos dados (esta observação é válida para as representações gráficas na forma de diagrama de barras ou de histograma) na forma que se apresenta em seguida, temos de um modo geral:

Deve-se chamar a atenção de que o simples cálculo da média e da mediana nos pode dar informaçãofsobre a forma de distribuição dos dados.