Distribuição beta

Fonte: testwiki
Revisão em 02h58min de 16 de janeiro de 2024 por imported>Leo4580 (growthexperiments-addlink-summary-summary:2|0|0)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa

Predefinição:Info/Distribuições de probabilidade

Em teoria da probabilidade e estatística, a distribuição beta é uma família de distribuições de probabilidade contínuas definidas no intervalo [0,1] parametrizado por dois parâmetros positivos, denotados por α e β, que aparecem como expoentes da variável aleatória e controlam o formato da distribuição.

A distribuição beta tem sido aplicada para modelar o comportamento de variáveis aleatórias limitadas a intervalos de tamanho finito em uma grande quantidade de disciplinas.

Em Inferência bayesiana, a distribuição beta é a distribuição conjugada a priori da distribuição de Bernoulli, distribuição binomial, distribuição binomial negativa e distribuição geométrica. Por exemplo, a distribuição beta pode ser usada na análise bayesiana para descrever conhecimentos iniciais sobre a probabilidade de sucesso assim como a probabilidade de que um veículo espacial vai completar uma missão especificada. A distribuição beta é um modelo conveniente para comportamento aleatório de porcentagens e proporções.

Caracterização

Função densidade de probabilidade

A função densidade de probabilidade (f.d.p.) da distribuição beta, para 0x1 e parâmetros α e β >0 é uma função exponencial da variável x e de sua reflexão (1x) como segue:

f(x;α,β)=constantexα1(1x)β1=xα1(1x)β101uα1(1u)β1du=Γ(α+β)Γ(α)Γ(β)xα1(1x)β1=1B(α,β)xα1(1x)β1

onde Γ(z) é a função gama. A função beta, B, é uma constante de normalização para assegurar que a probabilidade total integre a 1. Nas equações acima x é uma realização - um valor observado que de fato ocorreu - de um processo aleatório X.

Esta definição inclui os dois extremos x=0 e x=1, que é consistente com as definições para outras distribuições contínuas suportadas em um intervalo limitado que são casos especiais da distribuição beta, por exemplo a distribuição arcoseno, e consistente com diversos autores, como N. L. Johnson e S. Kotz.[1][2][3][4] Entretanto, a inclusão de x=0 e x=1 não funciona para α,β<1; diversos autores, incluindo W. Feller,[5][6][7] escolheram excluir os extremos x=0 e x=1 (portanto, os dois extremos não são realmente parte do domínio da função de densidade) e considerar ao invés 0<x<1.

Diversos autores, incluindo N. L. Johnson e S. Kotz,[1] usam os símbolos p e q (ao invés de α e β) para os parâmetros da distribuição de beta, reminiscente dos símbolos tradicionalmente usados dos parâmetros da distribuição de Bernoulli, porque a distribuição beta se aproxima da distribuição de Bernoulli no limite quando os dois parâmetros α e β aproxima o valor de zero.

No seguinte, a variável aleatória X distribuída sob a distribuição beta com parâmetros α e β irá ser denotada por :[8][9]

XBeta(α,β)

Outras notações são Xe(α,β)[10] e Xβα,β.[5]

Equação diferencial

A função densidade de probabilidade satisfaz a equação diferencial

f(x)=f(x)(α+β2)x(α1)(x1)x.
f.d.a. para a distribuição beta simétrica vs. x e α = β

Função distribuição acumulada

A função distribuição acumulada é

F(x;α,β)=B(x;α,β)B(α,β)=0xta1(1t)b1dtB(α,β)=Ix(α,β)

onde B(x;α,β) é a função beta incompleta e Ix(α,β) é a função beta incompleta regularizada.

Propriedades

Medidas de tendência central

Moda para distribuição beta para 1α5 e 1β5

Moda

A moda da variável aleatória X de distribuição beta com α, β >1 é o valor mais provável da distribuição (correspondendo ao pico na f.d.p.), e é dado pela seguinte expressão:[1]

Mo(X)=α1α+β2

Quando os dois parâmetros são menores que 1 (α, β <1), isto é a anti-moda: o menor ponto da curva densidade de probabilidade.[3]

Quando α=β, a expressão para a moda é simplificada para 12, mostrando que para α=β>1 a moda está no centro da distribuição: que é simétrica nesse caso. Veja a seção "Formas" nesse artigo para uma lista completa de casos de moda, para valores arbitrários de α e β. Para vários desses casos, o valor máximo da função densidade ocorre em um dos dois extremos. Em alguns casos, o valor máximo da função densidade ocorrendo num extremo é finito. Por exemplo, no caso de α=2, β=1 (ou α=1, β=2), a função densidade se torna uma distribuição triangular que é finita nos dois extremos. Em diversos outros casos existe uma singularidade em um dos extremos, onde o valor da função densidade se aproxima do infinito. Por exemplo, no caso α, β=12, a distribuição beta simplifica-se para se tornar a distribuição arcoseno. Existe um debate entre matemáticos sobre alguns desses casos e se os extremos (x=0 e x=1) pode ser chamados de modas ou não.[6][8]

  • Se os extremos são parte do domínio da função densidade
  • Se uma singularidade pode alguma vez ser chamada de moda
  • Se os casos com dois máximos deveriam ser chamados de bimodais
Mediana para a distribuição beta para 0α5 e 0β5
(Média - Mediana) para distribuição beta vs. α e β indo de 0 a 2

Mediana

A mediana da distribuição beta é o único número real x=I12[1](α,β) para o qual a função beta incompleta regularizada Ix(α,β)=12. Não existe uma forma fechada para a mediana da distribuição beta para valores arbitrários de α e β. Algumas formas fechadas para valores particulares dos parâmetros α e β seguem:

  • Para casos simétricos, onde α=β, a mediana é igual a 12
  • Para α=1 e β>0, a mediana é igual a 121β
  • Para α>0 e β=1, a mediana é igual a 21α
  • Para α=3 e β=2, a mediana é igual a solução real da função de quarto grau 18x3+6x4=0, que se encontra no intervalo [0,1].

Os seguintes são os limites para a mediana da variável aleatória X tem um parâmetro finito (não nulo) e o outro se aproximando desses limites:

limβ0Md(X)=limαMd(X)=1,limα0Md(X)=limβMd(X)=0.

Uma aproximação razoável do valor da mediana da distribuição beta, para ambos α e β maiores ou iguais a 1, é dado pela fórmula:[11]

Md(X)α13α+β23 for α,β1.

Quando α, β1, o erro relativo (o erro absoluto dividido pela mediana) nessa aproximação é menor que 4% e para ambos α,β2 é menor que 1%. O erro absoluto dividido pela diferença entre a média e a moda é similarmente pequeno:

|Mediana - aproximaçãoMediana| para distribuição beta para 1α5 e 1β5
|Mediana - aproximaçãoMédia - Moda| para distribuição beta para 1α5 e 1β5


Média para a distribuição beta para 1α5 e 1β5

Média

O valor esperado (média) μ da variável aleatória X sob a distribuição beta com parâmetros α e β é uma função apenas da razão βα desses parâmetros:[1]

μ=E[X]=01xf(x;α,β)dx=01xxα1(1x)β1B(α,β)dx=αα+β=11+βα

Fazendo α=β na expressão acima, obtém-se μ=12, mostrando que para α=β, a média está no centro da distribuição, que é simétrica. Além dissoos seguintes limites podem ser obtidos da expressão acima:

limβα0μ=1limβαμ=0

Portanto, para βα0 ou para αβ, a média está localizada no extremo direito, x=1. Para esses limites, a distribuição beta se torna uma distribuição degenerada de um ponto com um pico de função delta de Dirac no extremo direito x=1, com probabilidade 1; e probabilidade 0 em todo o resto do intervalo.

Analogamente, para βα, ou para αβ0, a média é localizada no extremo esquerdo, x=0. A distribuição beta se torna uma distribuição degenerada de um ponto com um pico de função delta de Dirac no extremo esquerdo x=0 com probabilidade 1, e 0 em todo o resto do intervalo.

Enquanto para distribuições unimodais típicas (com modas centradas, pontos de inflexão nos dois lados da moda e caudas longas) é conhecido que a média amostral (como uma estimativa de local) não é tão robusta como a mediana amostral, o oposto é o caso para distribuições bimodais uniformes ou "em forma de U" com Beta(α,β) tal que α, β1, isto é, com as modas localizadas nos extremos da distribuição. Como Mosteller e Tukey frizam[12] "a média das duas observações extremas usa toda a informação amostral. Isto ilustra como, para distribuições de cauda curta, as observações extremas devem receber maior peso". Por contraste, segue que a mediana de uma distribuição bimodal em forma de U com modas nas fronteiras da distribuição (com Beta(α,β) tal que α, β1 não é robusta, conforme a mediana amostral desconsidera as observações amostrais extremas. Uma aplicação prática disso ocorre por exemplo para passeios aleatórios, uma vez que a probabilidade para o tempo da última visita a origem em um passeio aleatório é distribuído como uma distribuição arco seno Beta(12,12):[5][13] a média de um número de realizações de um passeio aleatório é um estimador muito mais robusto que a mediana (que é uma medida estimativa amostral inapropriada neste caso).

Média geométrica

(Média- Média geométrica) para distribuição beta versus α e β de 0 a 2, mostrando a assimetria entre α e β para a média geométrica
Médias geométricas para distribuição beta. Roxo = G(x), amarelo = G(1x), com os menores valores α e β na frente
Médias geométricas para distribuição beta. Roxo = G(x), amarelo = G(1x), com os maiores valores α e β na frente

O logaritmo da média geométrica GX de uma distribuição da variável aleatória X é a média aritmética de ln(X) ou, equivalentemente, seu valor esperado:

lnGX=E[lnX]

Para a distribuição beta, o valor esperado da integral é:

E[lnX]=01lnxf(x;α,β)dx=01lnxxα1(1x)β1B(α,β)dx=1B(α,β)01xα1(1x)β1αdx=1B(α,β)α01xα1(1x)β1dx=1B(α,β)B(α,β)α=lnB(α,β)α=lnΓ(α)αlnΓ(α+β)α=ψ(α)ψ(α+β)

onde ψ é a função digama.

Assim sendo, a média geométrica de uma distribuição beta com parâmetros α e β é a exponencial da função digama de α e β como segue:

GX=eE[lnX]=eψ(α)ψ(α+β)

Enquanto para a distribuição beta com parâmetros α=β, segue que a curtose = 0 e a moda = média = mediana = 12, a média geométrica é menor que 12 (isto é: GX<12). A razão para isso é que a transformação logarítmica faz os valores de | próximos de zero pesarem muito, enquanto ln(X) tende rapidamente para menos infinito conforme X se aproxima de zero, enquanto ln(X) aplaina perto de zero quando X1.

Ao longo de uma linha α=β, os seguintes limites se aplicam:

limα=β0GX=0limα=βGX=12

Seguindo há os limites com um parâmetro finito (não-nulo) e o outro se aproximando desses limites:

limβ0GX=limαGX=1limα0GX=limβGX=0

O gráfico que acompanha mostra a diferença entre a média aritmética e a média geométrica para os parâmetros de forma α e β de 0 a 2. Apesar do fato de que a diferença entre elas aproxima-se de zero conforme α e β aproximam-se do infinito e que a diferença se torna larga para valores de α e β aproximando-se de zero, pode-se observar uma assimetria evidente da média geométrica com respeito aos parâmetros α e β. A diferença entre a média geométrica e a média aritmética é maior para valores pequenos de α em relação a β do que quando trocando as magnitudes de α e β.

Medidas de dispersão estatísticas

Variança[14]

A variança é o valor de uma distribuição beta com uma distribuição aleatória de variável X com os parâmetros α e β é

var(X)=E[xμ2]=αβ(α+β)2(α+β+1)

Tendo que α=β e através da expressão anterior tem-se que:

var(X)=14(2β+1)

Quanto mais próximo de zero for α = β a variança tende a diminuir. Quando α = β = 0 tem se que o ponto máximo da variança, var(x)=1/4. A distribuição beta é parametrizada através de sua média μ (0 <μ <1) e tamanho de amostra: ν = α + β (ν> 0), usando estás variáveis tem-se que a variança é dada por:

var(X)=μ(1μ)1+ν

Como ν = (α + β) > 0 e var(X) < μ(1 − μ). Então uma distribuição simétrica (média) é quando μ=1/2, tendo então:

var(X)=14(1+ν)ifμ=12Predefinição:Referências

Predefinição:Estatística Predefinição:Portal3