Análise de variância

Fonte: testwiki
Revisão em 01h03min de 27 de janeiro de 2025 por imported>ObserveOwl (História: link)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa

Análise de variância (ANOVA, do inglês analysis of variance) é a técnica estatística que permite avaliar afirmações sobre as médias de populações [1]. A análise visa, fundamentalmente, verificar se existe uma diferença significativa entre as médias e se os fatores exercem influência em alguma variável dependente.

Objetivo da Análise de Variância

A análise de variância compara médias de diferentes populações para verificar se essas populações possuem médias iguais ou não. Assim, essa técnica permite que vários grupos sejam comparados a um só tempo.

Em outras palavras, a análise de variância é utilizada quando se quer decidir se as diferenças amostrais observadas são reais (causadas por diferenças significativas nas populações observadas) ou casuais (decorrentes da mera variabilidade amostral). Portanto, essa análise parte do pressuposto que o acaso só produz pequenos desvios, sendo as grandes diferenças geradas por causas reais[1].

História

Segundo Stigler[2] os antecedentes da análise de variância existem desde há vários séculos tendo os métodos atingido maturidade no século XX. Este incluem testes de hipóteses, decomposição da soma dos quadrados, técnicas experimentais e o modelo aditivo. Laplace já realizava testes de hipóteses em 1770. Cerca de 1800, Laplace e Gauss desenvolveram o método dos mínimos quadrados para combinar observações melhorando métodos usados na época em astronomia e geodésica. Laplace sabia como estimar a variância a partir da soma dos quadrados dos resíduos (em vez do total). Em 1827 Laplace utilizava o método dos mínimos quadrados para resolver problemas de analise da variância sobre medições de correntes atmosféricas.[2]

Exigências para executar a análise de variância

Os pressupostos básicos da análise de variância são:

Na prática, esses pressupostos não precisam ser todos rigorosamente satisfeitos. Os resultados são empiricamente verdadeiros sempre que as populações são aproximadamente normais (isso é, não muito assimétricas) e têm variâncias próximas[1].

Testes de hipóteses

As hipóteses nula e alternativa da análise a serem testadas na análise de variância são:

  • Hipótese nula (H0): as médias populacionais são iguais.
  • Hipótese alternativa (H1): as médias populacionais são diferentes, ou seja, pelo menos uma das médias é diferente das demais.

Propriedades

Por se tratar de um teste bastante difundido, inúmeros softwares estatísticos e planilhas eletrônicas possuem o procedimento para ser aplicado automaticamente.

Considerando uma variável de interesse com média μ e variância σ2 temos dois estimadores da variância:

SB2 = dispersão entre os grupos (B ~ between) e SW2 = dispersão dentro dos grupos (W ~ within)

O teste é aplicado com:

F=SB2/SW2

Com K-1 graus de liberdade no numerador e N-K no denominador. Sendo K o número de fatores ou grupos e N o número de observações, e N-1 = (K-1) + (N-K)

Exemplo

O teste Enem foi aplicado pelo governo brasileiro nos 27 estados de Federação. Deseja-se descobrir se existe diferença significativa entre as médias de notas de cada Estado. Para isso, toma-se uma amostra aleatória de alunos de cada estado. Sabemos que k=número de populações é 27. O tamanho da amostra do estado 1 é n1 (por exemplo: 100 alunos do Acre), o tamanho da amostra do estado 2 é n2 e assim por diante.

Notas dos alunos da amostra de cada Estado e média da amostra cada estado
Estado k1=Acre k2=Amapá ... k27=Tocantins Total
Número de alunos da amostra do estado n1 n2 ... n27 k=127nk=n1+n2...+n27
Nota do 1º aluno do estado x11 x21 ... x271 k=127xk1=x11+x21+...+x271
Nota do 2º aluno do estado x12 x22 ... x272 k=127xk2
... ... ... ... ...
Nota do último aluno da amostra do Estado (note que o número de linhas, ou seja, o número de notas de alunos, pode ser diferente em cada Estado) x1n1 x2n2 ... x27n27
Soma das notas de todos os alunos do Estado Soma das notas dos "n1" alunos do Acre (estado k1)= i=1N1x1i=x11+x12+...+x1n1 Soma das notas dos "n2" alunos do Amapá (estado k2)= i=1N2x2i=x21+x22+...+x2n2 ... Soma das notas dos "n27" alunos de Tocantins(estado k27)=i=1N27x27i Soma das notas de todos os alunos da amostra, de todos os 27 estados: k=127i=1nixki=k=127nkxk
Nota média dos alunos do Estado x1=i=1N1x1in1 x2=i=1N2x2in2 ... x27=i=1N1x27in27 x=k=127xk27 = média ponderada das médias estaduais[3]

Calcula-se em seguida o desvio médio. Em seguida, eleva-se cada desvio ao quadrado e obtém-se a soma dos quadrados dos desvios de cada estado. Este resultado permite o cálculo da variância amostral.

Desvio de nota de cada aluno em relação à média de seu estado, elevado ao quadrado
Estado k1=Acre k2=Amapá ... k27=Tocantins Total
Número de alunos da amostra do estado n1 n2 ... n27 k=127nk=n1+n2...+n27
Nota do 1º aluno do estado menos média do seu estado, ao quadrado (x11x1)2 (x21x2)2 ... (x271x27)2
Nota do 2º aluno do estado menos média do seu estado, ao quadrado (x12x1)2 (x22x2)2 ... ...
... ... ... ... ...
Nota do último aluno da amostra do Estado menos média do seu estado, ao quadrado (x1n1x1)2 (x1n2x1)2 ... (x27n27x27)2
Soma dos quadrados dos desvios de cada Estado i=1N1(x1ix1)2 i=1N2(x2ix2)2 ... ...
Variância amostral (S2) S12=i=1N1(x1ix1)2n11 S22=i=1N2(x2ix2)2n21 ... S272=i=1N27(x1ix27)2n271 Sd2=k=127Sk227 = variância média

Na posse destes dados, é possível construir a "tabela ANOVA" (analysis of variance) (uma tabela para cada comparação):

Tabela ANOVA
Fonte de variação Soma dos quadrados Graus de liberdade Variância Valor de F
Entre amostras SQEnt=i=127ni(xix)2 k1=26 Se2=SQEntk1 F=Se2Sd2
Dentro das amostras SQDen=SQTotSQEnt i=127nik=i=127ni27 Sd2=SQDeni=127nik
Total SQTot=i=127j=1Ni(xijx)2 i=127ni1[3]

Referências

Predefinição:Reflist

Ver também

Predefinição:Estatística

  1. 1,0 1,1 1,2 1,3 1,4 1,5 MILONE, Giuseppe. Estatística geral e aplicada. São Paulo: Centage Learning, 2009. ISBN 85-221-0339-9. Capítulo 12.
  2. 2,0 2,1 Predefinição:Cite book
  3. 3,0 3,1 Escola Superior de Tecnologia e Gestão de Viseu. "Análise de Variância". Portugal. Disponível em: <http://www.estgv.ipv.pt/PaginasPessoais/lucas/material/ANOVA%20Formato%20Aluno.pdf>. Acesso em: 19 de outubro de 2013