Distribuição F de Fisher-Snedecor

Fonte: testwiki
Saltar para a navegação Saltar para a pesquisa

Predefinição:Info/Distribuições de probabilidade Em teoria das probabilidades e estatística, a distribuição F de Fisher-Snedecor, também conhecida como distribuição F, distribuição F de Fisher e distribuição F de Snedecor, em homenagem ao biólogo e estatístico britânico Ronald Fisher e ao matemático norte-americano George Waddel Snedecor,[1] é uma distribuição de probabilidade contínua que surge frequentemente como a distribuição nula da estatística de um teste, mais notadamente na análise de variância, como no teste F.[2][3][4][5]

Definição

Se uma variável aleatória X tiver uma distribuição F com parâmetros d1 e d2, escrevemos XF(d1,d2). Então, a função densidade de probabilidade de X é dada por

f(x;d1,d2)=(d1x)d1d2d2(d1x+d2)d1+d2xB(d12,d22)=1B(d12,d22)(d1d2)d12xd121(1+d1d2x)d1+d22

para x real e maior que zero. Aqui, B é uma função beta. Em muitas aplicações, os parâmetros d1 e d2 são números inteiros positivos, mas a distribuição é bem definida para valores reais positivos destes parâmetros.

A função distribuição acumulada é

F(x;d1,d2)=Id1xd1x+d2(d12,d22),

em que I é a função beta incompleta regularizada.

O valor esperado, a variância e outros detalhes sobre F(d1,d2) são dados na caixa ao lado. Para d2>8, a curtose de excesso é

γ2=12d1(5d222)(d1+d22)+(d24)(d22)2d1(d26)(d28)(d1+d22).

O k-ésimo momento de uma distribuição F(d1,d2) existe e é finita somente quando 2k<d2 e é igual a[6]

μX(k)=(d2d1)kΓ(d12+k)Γ(d12)Γ(d22k)Γ(d22)

A distribuição F é uma parametrização particular da distribuição beta prima, também chamada de distribuição beta de segundo tipo.

A função característica é[7]

φd1,d2F(s)=Γ(d1+d22)Γ(d22)U(d12,1d22,d2d1ıs)

em que U(a,b,z) é a função hipergeométrica confluente do segundo tipo.

Caracterização

O valor observado de uma variável aleatória de distribuição F com parâmetros d1 e d2 surge como a razão de dois valores observados de distribuição qui-quadrado apropriadamente escalados:[8]

X=U1/d1U2/d2

em que

  • U1 e U2 têm distribuições qui-quadrado com graus de liberdade d1 e d2 respectivamente e
  • U1 e U2 são independentes.

Em instâncias em que a distribuição F é usada, por exemplo, na análise de variância, a independência de U1 e U2 pode ser demonstrada pela aplicação do teorema de Cochran.

Equivalentemente, a variável aleatória da distribuição F também pode ser escrita como

X=s12σ12/s22σ22

em que s12 e s22 são as somas dos quadrados S12 e S22 de dois processos normais com variâncias σ12 e σ22 divididas pelo número correspondente de χ2 graus de liberdades. d1 e d2 são respectivamente s12=S12d1 e s22=S22d2.

Em um contexto frequencista, uma distribuição F escalada dá portanto a probabilidade p(s12/s22|σ12,σ22), ela própria com distribuição F, sem qualquer escala, o que se aplica onde σ12 é igual σ22. Este é o contexto em que a distribuição F aparece de forma mais generalizada em testes F: em que a hipótese nula é de que duas variâncias normais independentes são iguais e as somas observadas de alguns quadrados apropriadamente selecionados são então examinadas a fim de verificar se sua razão é significantemente incompatível com esta hipótese nula.

A quantidade X tem a mesma distribuição na estatística bayesiana, se um método de Jeffreys não informativo, de rescalamento invariante for tomado para as probabilidades a priori de σ12 e σ22.[9] Neste contexto, uma distribuição F escalada dá assim a probabilidade a posteriori p(σ12,σ22|s12/s22), em que as somas agora observadas s12 e s22 são tomadas como conhecidas.

De forma geral, resumida e simplificada, a distribuição F tem como características básicas:

  • É uma família de curvas, cada uma, determinada por dois tipos de graus de liberdade, os correspondentes à variância no numerador, e os que correspondem à variância no denominador.
  • É uma distribuição positivamente assimétrica.
  • A área total sob cada curva de uma distribuição F é igual a 1.
  • Todos os valores de X são maiores ou iguais a 0.
  • Para todas as distribuições F, o valor médio de X é aproximadamente igual a 1.[10]

Equação diferencial

A função densidade de probabilidade da distribuição F é uma solução da seguinte equação diferencial:

{2x(d1x+d2)f(x)+(2d1x+d2d1xd2d1+2d2)f(x)=0,f(1)=d1d12d2d22(d1+d2)12(d1d2)B(d12,d22)}

Propriedades e distribuições relacionadas

  • Se Xχd12 e Yχd22 forem independentes, então X/d1Y/d2F(d1,d2);
  • Se XkΓ(αk,βk) forem independentes, então α2β1X1α1β2X2F(2α1,2α2);
  • Se XBeta(d1/2,d2/2)(distribuição beta), então d2Xd1(1X)F(d1,d2);
  • Equivalentemente, se XF(d1,d2), então d1X/d21+d1X/d2Beta(d1/2,d2/2);
  • Se XF(d1,d2), então Y=limd2d1X tem a distribuição qui-quadrado χd12;
  • F(d1,d2) é equivalente a distribuição T-quadrado de Hotelling escalada d2d1(d1+d21)T2(d1,d1+d21);
  • Se XF(d1,d2), então X1F(d2,d1);
  • Se Xt(n) (distribuição t de Student), então:
X2F(1,n)
X2F(n,1)
  • A distribuição F é um caso especial de distribuição de Pearson de tipo 6;
  • Se X e Y forem independentes com X,YLaplace(μ,b), então:
|Xμ||Yμ|F(2,2);
  • Se XF(n,m), então logX2FisherZ(n,m) (distribuição z de Fisher);
  • A distribuição F não central simplifica à distribuição F se λ=0;
  • A distribuição F não central dupla simplifica à distribuição F se λ1=λ2=0;
  • Se QX(p) for o quantil p para XF(d1,d2) e QY(1p) for o quantil 1p para YF(d2,d1), então
QX(p)=1QY(1p).

Ver também

Predefinição:Referências

Ligações externas

Predefinição:Estatística