Estatística Prática para Docentes e Pós-Graduandos
de Geraldo Maia Campos

3. As repetições

Experimento com uma única observação.

    Imaginemos que, num experimento qualquer, se fizesse apenas uma única observação. Esse experimento, é evidente, não teria um valor numérico médio, ou uma média, porque não haveria valores que se pudessem somar, nem um número pelo qual a soma desses valores pudesse ser dividido para calcular essa média.
    Enfim, em última instância, a soma dos dados (digamos assim) seria igual ao próprio valor único, e o número de dados seria 1, de forma que o valor do dado dividido por 1 seria o seu próprio valor original.
    Levando esse raciocínio ad absurdum, diríamos então que o valor do dado seria exatamente igual ao valor da média. Isso seria ótimo, poderia pensar alguém menos avisado. Não, não seria. Na verdade, seria péssimo, até mesmo desastroso. Isto porque, se o valor medido estivesse errado, tudo mais estaria também errado, inclusive quaisquer eventuais conclusões que se pudessem tirar desse resultado falso.

Experimento com mais de uma observação.

    Todavia, se o número de observações do mesmo fenômeno fosse aumentado para 2, ou 3 ou 10, ou para qualquer outro número maior do que 1, o pesquisador notaria um fato interessante: as medidas apresentariam diferenças entre si, mesmo que ele repetisse sempre os mesmos passos na execução dos experimentos, e mesmo que usasse sempre o mesmo observador para executar as medidas. Enfim, haveria diferenças, mesmo que ele fizesse tudo exatamente igual, desde o começo até o fim de sua pesquisa.
    Isso seria péssimo, poderia pensar aquele mesmo alguém que já fizera o comentário do parágrafo anterior. Mas na verdade ele estaria novamente enganado, e isso na verdade seria ótimo. Isto porque, mesmo que um, ou alguns, ou mesmo todos os valores medidos estivessem errados, o valor médio desses valores errados estaria sempre mais próximo do valor real daquilo que estava sendo medido, do que muitas vezes qualquer dos dados experimentais considerado isoladamente.

A média dos valores dos dados experimentais.

    Do que foi exposto no item anterior, depreende-se que a média tende a aproximar os valores errados do valor real daquilo que se mede. Isto porque a média é uma espécie de limite central, para o qual tendem naturalmente a convergir os erros de medida, considerando que estes podem ser para maior ou para menor, em relação ao valor real daquilo que é medido. Enfim, se não houvesse erro nenhum de medida, todas as medidas efetuadas seriam iguais à média, pois não haveria diferenças nem para maior, nem para menor, em relação ao valor real. É por esse motivo que os matemáticos chamam a média de esperança matemática, porque a média é o valor que se esperaria obter, caso não houvesse erros e todos os valores medidos fossem iguais.

O número de dados.

    De tudo o que se expôs acima, pode-se concluir que, quanto maior o número de repetições, tanto mais o valor médio se aproximará do valor real, o que é absolutamente verdadeiro. Porém é preciso considerar que o número de repetições pode teoricamente estender-se desde 2 até o infinito. Contudo, um número infinito de observações, ou de medidas, é absolutamente impraticável. Aliás, mesmo considerando um número de medidas finito porém demasiadamente grande, ainda que fosse praticável, não seria todavia prático.

Amostragem, probabilidade e significância.

    Deve existir portanto um número de repetições que, mesmo sendo finito, e por isso mesmo limitado, seja capaz de permitir que se possam tirar conclusões válidas a respeito de um fenômeno qualquer que se queira estudar. A Estatística procurou resolver esse problema pela associação de duas coisas cujos nomes nos habituamos a ouvir a toda hora, quando lidamos com testes estatísticos: a amostragem e a probabilidade.
    A significância dos valores calculados pelos diversos testes estatísticos — que é algo também comumente ouvido e discutido em Estatística — em última análise não é mais do que a probabilidade de serem corretas as conclusões tiradas a partir de amostras de dimensões limitadas, reduzidas, retiradas de conjuntos de dados às vezes infinitamente maiores do que a própria amostra analisada pelos testes.

O quarto passo.

    A esta altura do planeamento experimental, poder-se-ia acrescentar mais um passo em nosso roteiro estatístico:

4º passo - Estabelecer o número de repetições.

Esta página foi elaborada com apoio do Programa Incentivo à Produção de Material Didático do SIAE, Pró-Reitorias de Graduação e Pós-Graduação da USP.