Modelo linear
Predefinição:Estatística sidebar Em estatística, o termo modelo linear é usado de diferentes formas de acordo com o contexto. A ocorrência mais comum se dá em conexão com modelos de regressão e o termo é frequentemente assumido como sinônimo de modelo de regressão linear. Entretanto, o termo é também usado em análise de séries temporais com um significado diferente. Em cada caso, a designação "linear" é frequentemente usada para identificar uma subclasse de modelos para os quais uma redução substancial na complexidade da teoria estatística relacionada é possível.[1]
Modelos de regressão linear
Para o caso da regressão, o modelo estatístico é como segue. Dada uma amostra (aleatória)
, a relação entre as observações
é formulada como:
em que
podem ser funções não lineares. Acima, as quantidades
são variáveis aleatórias que representam os erros na relação. A parte "linear" da designação se relaciona com o aparecimento dos coeficientes de regressão
em uma forma linear na relação acima. Alternativamente, pode-se dizer que os valores previstos correspondentes ao modelo acima, mais precisamente:
são funções lineares dos
. Dado que a estimativa é realizada com base em um análise de mínimos quadrados, estimativas dos parâmetros desconhecidos
são determinadas ao minimizar uma função de soma de quadrados:
A partir disto, pode-se ver prontamente que o aspecto "linear" do modelo significa o seguinte:
- A função a ser minimizada é uma função quadrática dos , para a qual a minimização é um problema relativamente simples;
- As derivadas da função são funções lineares dos , o que torna mais fácil encontrar os valores minimizantes;
- Os valores minimizantes são funções lineares das observações ;
- Os valores minimizantes são funções lineares dos erros aleatórios , o que torna relativamente fácil determinar as propriedades estatísticas dos valores estimados dos .[3]
Modelos de séries temporais
Um exemplo de um modelo linear de série temporal é um modelo ARMA. Aqui, o modelo para valores
em uma série temporal pode ser escrito na forma:
em que novamente as quantidades
são variáveis aleatórias que representam inovações, que são novos efeitos aleatórios que aparecem em um certo tempo, mas que também afetam valores de
em tempos posteriores. Neste exemplo, o uso do termo "modelo linear" se refere à estrutura da relação acima ao representar
como uma função linear dos valores passados da mesma série temporal e dos valores presentes e passados das inovações. Este aspecto particular da estrutura significa que é relativamente simples derivar relações para as propriedades de média e covariância da série temporal. Nota-se que aqui a parte "linear" do termo "modelo linear" não está se referindo ao coeficientes
e
, como seria no caso de um modelo de regressão, que parece estruturalmente semelhante.[4]
Outros usos em estatística
Há algumas outras instâncias em que "modelo não linear" é usado para contrastar com um modelo linearmente estruturado, embora o termo "modelo linear" não seja usualmente aplicado. Um exemplo disto é a redução de dimensionalidade não linear.[5]