Coeficiente de determinação

Fonte: testwiki
Revisão em 18h18min de 7 de agosto de 2024 por imported>WiKniss (Removi os dois pontos do título e subtítulo)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa

O coeficiente de determinação, também chamado de , é uma medida de ajuste de um modelo estatístico linear generalizado, como a regressão linear simples ou múltipla, aos valores observados de uma variável aleatória. O R² varia entre 0 e 1, por vezes sendo expresso em termos percentuais. Nesse caso, expressa a quantidade da variância dos dados que é explicada pelo modelo linear. Assim, quanto maior o R², mais explicativo é o modelo linear, ou seja, melhor ele se ajusta à amostra. Por exemplo, um R² = 0,8234 significa que o modelo linear explica 82,34% da variância da variável dependente a partir do regressores (variáveis independentes) incluídas naquele modelo linear.

Método

SQtot=i=1n(yiy¯)2, onde n é o numero de observações;

Partindo de que yi é o valor observado e y¯ é a média das observações, esta equação dá-nos a Soma Total dos Quadrados, ou seja, a soma dos quadrados das diferenças entre a média e cada valor observado. SQres=i=1n(yiyi^)2, onde yi^ é o valor estimado (previsão) de yi.

Esta equação é a soma dos quadrados dos resíduos, que calcula a parte que não é explicada pelo modelo.

SQexp=i=1n(yi^y¯)2,

onde yi^ é o valor estimado (previsão) de yi.

Esta equação, a soma dos quadrados explicada, indica-nos a diferença entre a média das observações e o valor estimado para cada observação, e soma os respectivos quadrados. Quanto menor for a diferença, maior poder explicativo detém o modelo.

Em alguns casos temos: SQtot=SQexp+SQres. E normalizando a equação de cima, temos que: R2=SQexpSQtot=1SQresSQtot.

R² ajustado

A inclusão de inúmeras variáveis, mesmo que tenham muito pouco poder explicativo sobre a variável dependente, aumentarão o valor de . Isto incentiva a inclusão indiscriminada de variáveis, prejudicando o princípio da parcimônia (ver de forma mais ampla em navalha de Ockhan). Para combater esta tendência, podemos usar uma medida alternativa do coeficiente de determinação, que penaliza a inclusão de regressores pouco explicativos. Trata-se do R² ajustado: R2¯=1n1n(k+1)(1R2), onde (k+1) representa o número de variáveis explicativas mais a constante.

Note que a inclusão de mais variáveis com pouco poder explicativo prejudica o valor do R² ajustado, porque aumenta k uma unidade, sem aumentar substancialmente o R2.

Relação entre Coeficiente de Determinação (R²) e Coeficiente de Correlação (R)

Para provarmos que o Coeficiente de Determinação equivale ao quadrado do Coeficiente de Correlação, precisamos provar inicialmente:

Teorema 1

SQtot=n.(y2y2)

Prova

SQtot=(y1y)2+(y2y)2++(yny)2

=(y122.y1.y+y2)++(yn22.yn.y+y2)

=(y2)(2.y.y)+(n.y2)

=(n.y2)2.y.(n.y)+n.y2

=n.(y22.y2+y2)

=n.(y2y2)     c.q.d.

Teorema 2

SQres=n.(x.yxy)2x2x2+SQtot

Prova

Inicialmente, precisamos reescrever a expressão do valor estimado pela Regressão Linear:

y^k=A.xk+B

=A.xk+(yA.x)

=A.(xkx)+y


SQres=(y^1y1)2+(y^2y2)2++(y^nyn)2

=[A.(x1x)+yy1]2++[A.(xnx)+yyn]2

=[A.(x1x)+(yy1)]2++[A.(xnx)+(yyn)]2=A2.(x1x)2+2.A.(x1x).(yy1)+(yy1)2++A2.(xnx)2+2.A.(xnx).(yyn)+(yyn)2=A2.(x122.x1.x+x2)+2.A.(x1.yx1.y1x.y+x.y1)+(y22.y.y1+y12)+=A2.x122A2.x1.x+A2.x2+2.A.x1.y2.A.x1.y12.A.x.y+2.A.x.y1+y22.y.y1+y12+

=A2.(x2)2A2.x.(x)+n.A2.x2+2.A.y.(x)2.A.(x.y)2.A.n.x.y+2.A.x.(y)+n.y22.y.(y)+(y2)

=A2.(n.x2)2A2.x.(n.x)+n.A2.x2+2.A.y.(n.x)2.A.(n.xy)2.A.n.x.y+2.A.x.(n.y)+n.y22.y.(n.y)+(n.y2)

=n.(A2.x22.A2.x2+A2.x2+2.A.x.y2.A.xy2.A.x.y+2.A.x.y+y22.y2+y2)

=n.(A2.x2A2.x2+2.A.x.y2.A.xyy2+y2)

=n.[A2.(x2x2)+2A.(x.yxy)+y2y2]

=n.[(x.yxyx2x2)2.(x2x2)+2.x.yxyx2x2.(x.yxy)]+n.(y2y2)

=n.[(x.yxy)2.(x2x2)(x2x2)2+2.(x.yxy)2x2x2]+SQtot

=n.[(x.yxy)2x2x2+2.(x.yxy)2x2x2]+SQtot

=n.(x.yxy)2x2x2+SQy      c.q.d.


Teorema 3: R2=(x.yxy)2(x2x2).(y2y2)


Prova: R2=1SQresSQtot=SQtotSQtotSQresSQtot=SQtotSQresSQtot=SQtot[n.(x.yxy)2x2x2+SQtot]SQtot


=n.(x.yxy)2x2x2.1SQtot=n.(x.yxy)2(x2x2).n.(y2y2)=(x.yxy)2(x2x2).(y2y2)      c.q.d.


Teorema 4: (Coeficiente de Correlação)² = Coeficiente de Determinação


Prova: Coeficiente de Correlação = R=(xx).(yy)(xx)2.(yy)2

Para elevá-lo ao quadrado, façamos separadamente numerador e denominador:

Quadrado do numerador: [ (xx).(yy) ]2

=[ (x.yx.yx.y+x.y) ]2

=[ (x1.y1x1.yx.y1+x.y)++(xn.ynxn.yx.yn+x.y) ]2

=[ (x.y)y.(x)x.(y)+n.x.y ]2

=[ (n.x.y)y.(n.x)x.(n.y)+n.x.y ]2

=[ n.(x.yx.y) ]2

=n2.(x.yx.y)2


Agora, façamos o quadrado do denominador:

[ (xx)2.(yy)2 ]2

=[ (xx)2 ].[ (yy)2 ]

=[ (x22.x.x+x2) ].[ (y22.y.y+y2) ]

=[ (x2)2.x.(x)+n.x2 ].[ (y2)2.y.(y)+n.y2 ]

=[ (n.x2)2.x.(n.x)+n.x2 ].[ (n.y2)2.y.(n.y)+n.y2 ]

=(n.x2n.x2).(n.y2n.y2)

=[ n.(x2x2) ].[ n.(y2y2) ]

=n2.(x2x2).(y2y2)


Juntando, temos:

(Coeficiente de Correlação)² = (R)2=n2.(x.yx.y)2n2.(x2x2).(y2y2)

=(x.yxy)2(x2x2).(y2y2) = Coeficiente de Determinação (R²) c.q.d.

Predefinição:Controle de autoridade

Predefinição:Econometria