Ponto de alavanca (estatística)

Fonte: testwiki
Revisão em 04h56min de 29 de julho de 2023 por imported>Lunix Zero (growthexperiments-addlink-summary-summary:1|0|1)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa

Em estatística, em particular, na análise de regressão, o ponto de alavanca é uma medida dos valores de observação da variável independente.

Os computadores modernos para análise estatística incluem, como parte das instalações para a análise de regressão, algumas medidas quantitativas que identificam as influências dos dados: entre essas medidas esta a o ponto de alavancagem parcial, uma medida de como uma variável contribui para alavancar o ponto de referência.[1][2]

Modelo de Regressão Linear

No modelo de regressão linear , o ponto de alavanca para a i-ésima unidade de dados é definido como:

hii=[𝐇]ii,

o elemento da matriz de projeção 𝐇=𝐗(𝐗𝖳𝐗)1𝐗𝖳, onde 𝐗 é a matriz de projeto.

hii=y^iyi,

y^i e yi são as medida de ajustes e observação, respectivamente.

Limites do ponto de alavanca

0hii1.

Prova

Primeiro, note que H é uma matriz idempotente: H2=X(XX)1XX(XX)1X=XI(XX)1X=H. Como também, observe que a H é simétrica. Desse nodo, quando igualamos a ii elemento de H ao H 2, nos temos

hii=hii2+jihij20
ehiihii2hii1.

Efeitos do desvio residual

Se temos uma ordinário dos mínimos quadrados com uma configuração fixa de X, erros de regressão ϵi, e

Y=Xβ+ϵ
Var(ϵ)=σ2I

em seguida, Var(ei)=(1hii)σ2 onde ei=YiY^i (onde o i-ésimo é a regressão residual).

Em outras palavras, se o modelo de erros ϵ é homoscedástico, a observação do ponto de alavancagem determina o grau de diferenças no modelo de desvio de ramo dessa observação.

Antecipadamente, observe que IH é idempotente e simétrica. Isso significa,

Var(ei)=(1hii)σ2.

Resíduos de studentizados

Os resíduos de studentizados — são resíduos ajustados para sua observação específica residual de variância e, em seguida, é

ti=eiσ^1hii 

onde σ^ é uma estimativa apropriada de σ.

  • Matriz de projeção – one as entradas da diagonal principal são os pontos de alavancagens de observações
  • Mahalanobis a distância – uma medida de alavancagem de um ponto de referência
  • Distância de Cook– uma medida de alterações nos coeficientes de regressão quando uma observação é eliminado
  • DFFITS
  • Os Outliers – extremos valores de Y nas observações

Predefinição:Referências