Distribuição F de Fisher-Snedecor
Predefinição:Info/Distribuições de probabilidade Em teoria das probabilidades e estatística, a distribuição F de Fisher-Snedecor, também conhecida como distribuição F, distribuição F de Fisher e distribuição F de Snedecor, em homenagem ao biólogo e estatístico britânico Ronald Fisher e ao matemático norte-americano George Waddel Snedecor,[1] é uma distribuição de probabilidade contínua que surge frequentemente como a distribuição nula da estatística de um teste, mais notadamente na análise de variância, como no teste F.[2][3][4][5]
Definição
Se uma variável aleatória tiver uma distribuição F com parâmetros e , escrevemos . Então, a função densidade de probabilidade de é dada por
para real e maior que zero. Aqui, é uma função beta. Em muitas aplicações, os parâmetros e são números inteiros positivos, mas a distribuição é bem definida para valores reais positivos destes parâmetros.
A função distribuição acumulada é
em que é a função beta incompleta regularizada.
O valor esperado, a variância e outros detalhes sobre são dados na caixa ao lado. Para , a curtose de excesso é
- .
O -ésimo momento de uma distribuição existe e é finita somente quando e é igual a[6]
A distribuição F é uma parametrização particular da distribuição beta prima, também chamada de distribuição beta de segundo tipo.
em que é a função hipergeométrica confluente do segundo tipo.
Caracterização
O valor observado de uma variável aleatória de distribuição F com parâmetros e surge como a razão de dois valores observados de distribuição qui-quadrado apropriadamente escalados:[8]
em que
- e têm distribuições qui-quadrado com graus de liberdade e respectivamente e
- e são independentes.
Em instâncias em que a distribuição F é usada, por exemplo, na análise de variância, a independência de e pode ser demonstrada pela aplicação do teorema de Cochran.
Equivalentemente, a variável aleatória da distribuição F também pode ser escrita como
em que e são as somas dos quadrados e de dois processos normais com variâncias e divididas pelo número correspondente de graus de liberdades. e são respectivamente e .
Em um contexto frequencista, uma distribuição F escalada dá portanto a probabilidade , ela própria com distribuição F, sem qualquer escala, o que se aplica onde é igual . Este é o contexto em que a distribuição F aparece de forma mais generalizada em testes F: em que a hipótese nula é de que duas variâncias normais independentes são iguais e as somas observadas de alguns quadrados apropriadamente selecionados são então examinadas a fim de verificar se sua razão é significantemente incompatível com esta hipótese nula.
A quantidade tem a mesma distribuição na estatística bayesiana, se um método de Jeffreys não informativo, de rescalamento invariante for tomado para as probabilidades a priori de e .[9] Neste contexto, uma distribuição F escalada dá assim a probabilidade a posteriori , em que as somas agora observadas e são tomadas como conhecidas.
De forma geral, resumida e simplificada, a distribuição F tem como características básicas:
- É uma família de curvas, cada uma, determinada por dois tipos de graus de liberdade, os correspondentes à variância no numerador, e os que correspondem à variância no denominador.
- É uma distribuição positivamente assimétrica.
- A área total sob cada curva de uma distribuição F é igual a 1.
- Todos os valores de X são maiores ou iguais a 0.
- Para todas as distribuições F, o valor médio de X é aproximadamente igual a 1.[10]
Equação diferencial
A função densidade de probabilidade da distribuição F é uma solução da seguinte equação diferencial:
Propriedades e distribuições relacionadas
- Se e forem independentes, então ;
- Se forem independentes, então ;
- Se (distribuição beta), então ;
- Equivalentemente, se , então ;
- Se , então tem a distribuição qui-quadrado ;
- é equivalente a distribuição T-quadrado de Hotelling escalada ;
- Se , então ;
- Se (distribuição t de Student), então:
- A distribuição F é um caso especial de distribuição de Pearson de tipo 6;
- Se e forem independentes com , então:
- ;
- Se , então (distribuição z de Fisher);
- A distribuição F não central simplifica à distribuição F se ;
- A distribuição F não central dupla simplifica à distribuição F se ;
- Se for o quantil para e for o quantil para , então
- .