Estatística Prática para Docentes e Pós-Graduandos
de Geraldo Maia Campos

1. A primeira pergunta

    A primeira pergunta que um estaticista faz ao seu consulente — e que este deveria estar apto a responder — é esta: Qual (ou o quê) é a sua variável?
    Parece fácil, mas posso garantir, com base em minha experiência pessoal de muitos anos, que poucos darão uma resposta correta a essa indagação tão simples. Alguns dirão coisas como esta: "Usei três marcas diferentes de gessos, dois métodos diferentes de manipulação e quatro proporções diferentes de água / pó" — ou qualquer coisa semelhante, que varia conforme o campo de atividade do pesquisador.
    Assim, na opinião do pesquisador do exemplo acima, estaríamos diante de um experimento com três variáveis: a marca do gesso, a técnica de manipulação e a proporção água / pó. Porém, na verdade, nada disso constitui a variável do trabalho em questão.
    Mas é bastante comum que, quando o estaticista diz isso ao seu consulente, este arregale os olhos de espanto.

A identificação da variável.

    No entanto, a identificação da variável deveria ser o primeiro passo na realização de qualquer trabalho de pesquisa — e de fato é, e todo pesquisador sabe perfeitamente qual é essa variável. Todavia, a sua falta de vivência estatística geralmente impede que ele a identifique como tal. Falta-lhe um roteiro lógico, um caminho bem definido, uma orientação clara, que ele possa seguir, sabendo perfeitamente o que faz e por que faz.
    O planejamento estatístico de uma pesquisa deve delinear-se quando ainda na fase de elaboração do projeto de pesquisa (ou do plano de trabalho), pois já nesse momento o investigador deve pensar sobre qual tratamento estatístico aplicará futuramente aos seus dados experimentais, para conseguir resultados, tirar conclusões, e obter respostas às indagações iniciais que motivam e justificam a realização dos seus experimentos.
    Voltando à pergunta inicial, é bem provável que o consulente só entenda a pergunta de seu conselheiro estatístico quando este a reformular e indagar: Afinal, o que foi que você mediu (ou contou, ou pesou, ou qualquer coisa do mesmo gênero)?
    Então, considerando ainda o mesmo caso dos gessos que estamos tomando como exemplo, o pesquisador dirá categoricamente: "Eu medi a dureza dos corpos-de-prova de gesso, construídos com cada marca de gesso, cada técnica de manipulação e cada proporção água / pó!".
    Eis aí, finalmente, a verdadeira variável do experimento: o grau de dureza dos corpos-de-prova de gesso! A sua variável é portanto precisamente aquele elemento que permite a comparação entre todas as combinações possíveis das marcas de gesso, técnicas de manipulação e proporções de água/pó utilizadas na pesquisa.

A variável única e o denominador comum.

    A variável do experimento, portanto, tem necessariamente de ser única, porque só assim poderá servir como um denominador comum no confronto entre tudo aquilo que se deseja comparar numa pesquisa, seja ela qual for.
    Mas o que vem a ser um denominador comum? Apesar de ter jurado que não falaria em Matemática neste curso, vou responder a essa pergunta com outra pergunta, de ordem puramente aritmética: qual das duas frações abaixo representa a grandeza maior?

    E agora, entre as duas novas frações abaixo, qual seria a de maior grandeza ?

    Agora sim, tomou-se muito fácil garantir que a segunda fração é maior do que a primeira, mesmo que os números envolvidos no segundo exemplo sejam muito maiores que os do primeiro e isso sem precisar fazer mais do que um simples exame visual das duas frações.
    Mas... por que seria assim?
    Na verdade as duas frações do primeiro conjunto são exatamente iguais às duas frações do segundo conjunto. A única diferença é que, neste último, as frações foram reduzidas ao mesmo denominador, calculando-se o seu denominador comum, uma tarefa matemática elementar, que aprendemos no curso primário, ao estudarmos frações ordinárias.
    A variável de um experimento é pois o denominador comum — ou seja, o termo de comparação — que permite cotejar seja lá o que for que queiramos comparar. Por isso tem de ser única ou então cairíamos no caso do primeiro conjunto de frações ordinárias mostrado em nosso exemplo matemático, em que os denominadores são diferentes.

Fatores de variação.

    Muito bem, mas se, na pesquisa sobre gessos que estamos adotando como exemplo no presente capítulo, a variável é a dureza dos corpos-de-prova, o que seriam afinal as marcas de gesso, as técnicas de manipulação e as proporções água / pó? É evidente que tudo isso é importante, ou não seria considerado na pesquisa.
    Na verdade, são exatamente esses fatores que fazem com que a variável dureza realmente varie. São portanto fatores de variação.
    Os fatores de variação, ao contrário da variável, podem ser múltiplos, não havendo teoricamente um limite para o seu número. A experiência, porém, bem como o bom-senso que costuma dela advir, aconselha que esse número não deva ser superior a três, e a razão disso será analisada quando se falar sobre algo muito importante em Estatística, que são as interações entre os diversos fatores de variação.

Os dois primeiros passos.

    Resumindo o que foi dito até agora, podemos finalmente indicar os dois primeiros passos a serem dados na preparação da análise estatística dos dados experimentais de uma pesquisa, seja esta qual for, esteja ela ainda na fase inicial de planejamento, ou já no seu final, com todos os experimentos realizados e todos os dados experimentais obtidos e convenientemente anotados nos protocolos elaborados para o registro das observações.
    Esses dois passos iniciais são:

1º passo - Identificação da variável,

2º passo - Identificação dos fatores de variação.

As repetições (ou réplicas).

    Contudo, esses dois elementos — variável e fatores de variação — não são os únicos que devem ser definidos logo no início de um experimento. Há ainda outro, de capital importância, que muitas vezes constitui uma verdadeira dor de cabeça para o pesquisador: o número de repetições (ou réplicas) a ser adotado nos experimentos.
    Aliás, é preciso dizer que uma das indagações que os estaticistas mais ouvem de seus consulentes, tanto de pesquisadores, como de pós-graduandos, e até mesmo dos orientadores destes, é esta: qual o número ideal de repetições num experimento, para tornar confiáveis os resultados e sua interpretação estatística ?
    Pois bem, vamos responder com a mais absoluta certeza e segurança a essa pergunta: não existe tal número ideal de repetições! Nesse caso, dirão os leitores deste texto, completamente atônitos e decepcionados, o que determinaria qual o número de repetições a ser adotado num experimento?
    A resposta a esta reformulação da mesma pergunta será dada mais adiante, e não agora, a esta altura deste curso, pois na verdade ainda há muita coisa importante a ser comentada, antes de chegarmos a esse detalhe. Um detalhe, aliás, importantíssimo, como se verá mais à frente, porque sem repetições é muito provável que a Estatística, tal como a conhecemos hoje, nem sequer existisse...!

Esta página foi elaborada com apoio do Programa Incentivo à Produção de Material Didático do SIAE, Pró-Reitorias de Graduação e Pós-Graduação da USP.