Coeficiente de correlação de Pearson

Fonte: testwiki
Revisão em 19h12min de 28 de fevereiro de 2025 por imported>Francieli Triches (Cálculo)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa

Predefinição:Mais-notas Em estatística descritiva, o coeficiente de correlação de Pearson, também chamado de "coeficiente de correlação produto-momento" ou simplesmente de "ρ de Pearson" mede o grau da correlação (e a direcção dessa correlação - se positiva ou negativa) entre duas variáveis de escala métrica (intervalar ou de rácio/razão).

Este coeficiente, normalmente representado por ρ assume apenas valores entre -1 e 1.

  • ρ=1 Significa uma correlação perfeita positiva entre as duas variáveis.
  • ρ=1 Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma aumenta, a outra sempre diminui.
  • ρ=0 Significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado ρ=0 deve ser investigado por outros meios.

Cálculo

Calcula-se o coeficiente de correlação de Pearson segundo a seguinte fórmula:

ρ=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2=cos(X,Y)var(X)var(Y)

onde x1,x2,,xn e y1,y2,,yn são os valores medidos de ambas as variáveis. Para além disso

x¯=1ni=1nxi

e

y¯=1ni=1nyi são as médias aritméticas de ambas as variáveis.[1]

A análise correlacional indica a relação entre 2 variáveis lineares e os valores sempre serão entre +1 e -1. O sinal indica a direção, se a correlação é positiva ou negativa, e o tamanho da variável indica a força da correlação.

Cabe observar que, como o coeficiente é concebido a partir do ajuste linear, então a fórmula não contém informações do ajuste, ou seja, é composta apenas dos dados.

Interpretando ρ[2]

  • 0.9 para mais ou para menos indica uma correlação muito forte.
  • 0.7 a 0.9 positivo ou negativo indica uma correlação forte.
  • 0.5 a 0.7 positivo ou negativo indica uma correlação moderada.
  • 0.3 a 0.5 positivo ou negativo indica uma correlação fraca.
  • 0 a 0.3 positivo ou negativo indica uma correlação desprezível.

Interpretação geométrica

As duas séries de valores X(x1,,xn) e Y(y1,,yn) podem ser consideradas como vetores em um espaço de n dimensões. X(x1x¯,,xnx¯) e Y(y1y¯,,yny¯).

O cosseno do ângulo α entre estes vetores é dado pela fórmula (produto escalar normado):

cos(α)=i=1N(xix¯)(yiy¯)i=1N(xix¯)2i=1N(yiy¯)2

Portanto cos(α)=ρ

O coeficiente de correlação não é outro senão o cosseno do ângulo α entre os dois vetores!

Se ρ = 1, o ângulo α = 0, os dois vetores são colineares (paralelos).
Se ρ = 0, o ângulo α = 90°, os dois vetores são ortogonais.
Se ρ = -1, o ângulo α = 180°, os dois vetores são colineares com sentidos opostos.
Mais geralmente : α=arccos(ρ), (arccos é a inversa da função cosseno).

Predefinição:Referências

Ver também

Predefinição:Estatística

Predefinição:Portal3