Estatística Prática para Docentes e Pós-Graduandos
de Geraldo Maia Campos

8. A importância da curva normal

Populações e amostras populacionais.

    A equação da curva normal de Gauss, que é uma curva matemática teórica, baseia-se em dois parâmetros — a média e o desvio-padrão — que são os elementos que definem uma determinada população, em relação a uma característica qualquer, estudada e medida em integrantes dessa população. Na verdade, porém, em Estatística, quando se usa o termo população, esta se refere mais ao conjunto de valores numéricos que serviram para estudar essa característica, do que propriamente ao conjunto de indivíduos nos quais ela foi investigada e medida. Como na maior parte das vezes é impossível estudar toda a população, essa avaliação se faz a partir de um número reduzido de elementos a ela pertencentes, e é a esses pequenos subconjuntos do universo populacional que se dá o nome de amostras.

Parâmetros populacionais.

    Esses dois parâmetros — média e desvio-padrão — que ao mesmo tempo definem tanto a curva normal como a população de onde a amostra foi retirada, constituem portanto os elementos primordiais desse tipo de estatística denominada paramétrica, uma estatística que é assim chamada justamente por basear-se nesses dois parâmetros.

O que são “parâmetros”?

    A pergunta acima procede, porque há quem confunda parâmetros com variáveis, imaginado terem estudado um fenômeno qualquer em relação a dois ou três parâmetros, quando na realidade o que fizeram foi estudá-lo por meio de duas ou três variáveis de alguma forma a ele relacionadas, direta ou indiretamente. Na verdade, parâmetros podem fazer parte de uma variável, porque esta pode ser representada por uma função de x, e nesse caso os parâmetros ajudariam a definir as relações de x dentro dessa função. Numa equação matemática, os parâmetros seriam representados pelos seus valores constantes, fixos, invariáveis. Por exemplo, quando se define uma reta pela sua equação matemática, diz-se que y = a + bx. Nessa expressão, os parâmetros são o a e o b, que são grandezas constantes. Todavia, são essas constantes que individualizam a linha reta por eles definida, esclarecendo em que ponto essa reta corta o eixo das ordenadas (a), e qual o seu ângulo de inclinação (b / a = tangente do ângulo de inclinação). Esses parâmetros só valem para essa reta, pois outras retas teriam a e b diferentes. Nada impede, porém, que, num determinado experimento, a amostra possa ser exatamente um conjunto de retas, com alturas e inclinações diferentes, caso em que as próprias retas, com seus parâmetros individuais, seriam a variável experimental. É o que ocorre toda vez em que o valor numérico dos dados experimentais é dado por uma equação, seja ela de natureza matemática ou física, como é o caso da pressão, dos números de dureza, etc., em que os dados precisam ser calculados, não representando portanto grandezas simples, unidimensionais, como são o comprimento, o peso, o tempo, a temperatura, etc. Assim, da mesma forma que no caso da reta, uma população qualquer, com distribuição normal, pode ser definida por dois parâmetros, que são a média e o desvio-padrão. Tanto a média como o desvio-padrão são portanto valores constantes, sendo que a média define o ponto onde a curva normal atinge o seu ponto mais elevado (máximo da distribuição), e o desvio-padrão define o lugar geométrico onde o traçado da curva normal muda de sentido, passando de côncava a convexa, ou vice-versa.

Os parâmetros da curva normal.

    Em termos matemáticos, diríamos que a média é o ponto da curva normal onde a primeira derivada de sua equação é igual a zero, e o desvio-padrão os dois pontos de inflexão dessa mesma curva, ou seja, os lugares onde a sua segunda derivada é igual a zero. Mas estes detalhes São importantes apenas para aqueles que tenham alguma tendência para a Matemática, não sendo absolutamente necessários para quem deseja apenas tratar estatisticamente os resultados de seu trabalho de pesquisa, visando a tirar deles conclusões válidas.

Propriedades da curva normal, e “probabilidade”.

    A curva normal, que expressa matemática e geometricamente a distribuição normal de freqüências, é uma curva sui generis, que apresenta umas tantas propriedades que a tornam particularmente útil no estudo das probabilidades, especialmente em Estatística, que afinal não é mais do que a teoria das probabilidades aplicada às Ciências de um modo geral, seja qual for o campo de atividade destas.
    As propriedades da distribuição normal e da curva que a expressa matematica e geometricamente são:

  1. A curva é uma função de x, e o seu domínio estende-se de - infinito até + infinito.
  2. A curva é assintótica; isto é, estende-se de - infinito a + infinito, sem nunca tocar o eixo horizontal, e portanto a função de x jamais se anula.
  3. A área compreendida pela curva nesse intervalo é exatamente igual a 1, valor que, em Estatística, corresponde a 100% de probabilidade.
  4. A função tem um máximo, e esse máximo ocorre quando x = 0, que corresponde ao seu ponto médio, ou seja, à média da distribuição.
  5. A distribuição é simétrica em torno da média, e como esta é igual a zero, os valores de x são negativos à sua esquerda e positivos à sua direita.
  6. A curva tem dois pontos de inflexão, simétricos em relação à média, que ocorrem quando x = +1 e x = -1. Esses pontos de inflexão são conhecidos, em Estatística, como o desvio-padrão da distribuição normal.
  7. Graficamente, a curva tem forma de sino, com concavidade voltada para baixo entre os pontos de inflexão da curva, e convexidade para além e aquém desses pontos.
  8. Tanto em termos de Probabilidade como em Estatística, a área sob a curva, desde - infinito até um valor qualquer de x, indica a probabilidade de ocorrência desse valor de x.
Mas, na vida real, como fica tudo isso?

    Transpondo tudo isso para o dia-a-dia da pesquisa científica, os valores de x correspondem aos valores numéricos dos dados experimentais, enquanto que os valores de y referem-se às freqüências com que cada valor de x aparece no experimento; e a curva normal seria ela própria o perfil do histograma de freqüências de toda a amostra.
    Todavia, a curva normal matemática tem sempre média igual a 0 (zero) e desvio-padrão igual a 1 (um), ao passo que qualquer pesquisador sabe que os seus dados experimentais dificilmente terão esses valores porque, num experimento científico, tanto a média como o desvio-padrão podem apresentar os valores mais variados. Por que isso acontece? Porque na verdade não existe apenas uma curva normal única, mas sim uma família de curvas normais, conforme já ficou dito anteriormente neste texto.
    Assim, considerando que, numa curva normal, a média não tem necessariamente de ser igual a zero, nem tampouco o desvio-padrão tem de ser igual a 1, o que significaria, em termos gráficos, uma mudança de valor, seja da média, seja do desvio-padrão?

Esta página foi elaborada com apoio do Programa Incentivo à Produção de Material Didático do SIAE, Pró-Reitorias de Graduação e Pós-Graduação da USP.