Modelo linear generalizado misto

Fonte: testwiki
Saltar para a navegação Saltar para a pesquisa

Em estatística, um modelo linear generalizado misto (GLMM) é uma extensão do modelo linear generalizado (GLM) em que o preditor linear contém efeitos aleatórios além dos efeitos fixos usuais.[1][2][3] Eles também herdam dos GLMs a ideia de estender os modelos lineares mistos a dados não normais.

O GLMM fornecem uma ampla gama de modelos para a análise de dados agrupados, uma vez que as diferenças entre os grupos podem ser modeladas como um efeito aleatório. Esses modelos são úteis na análise de muitos tipos de dados, incluindo dados longitudinais.[4]

Modelo

O GLMM é geralmente definido de modo que, condicionados aos efeitos aleatórios u, a variável dependente y é distribuída de acordo com a família exponencial com sua expectativa relacionada ao preditor linear Xβ+Zu através de uma função de link g :

g(E[y|u])=Xβ+Zu .

Aqui, X e β são a matriz de design de efeitos fixos e os efeitos fixos, respectivamente; Z e u são a matriz de design de efeitos aleatórios e os efeitos aleatórios, respectivamente. Para entender esta definição muito breve, você primeiro precisará entender a definição de um modelo linear generalizado e de um modelo misto .

Modelos lineares generalizados mistos são casos especiais de modelos lineares generalizados hierárquicos nos quais os efeitos aleatórios são normalmente distribuídos.

A probabilidade completa[5]

lnp(y)=lnp(y|u)p(u)du

não tem uma forma geral fechada e a integração sobre os efeitos aleatórios costuma ser extremamente intensiva em termos de computação. Além de aproximar numericamente essa integral (por exemplo, via quadratura de Gauss-Hermite), métodos motivados pela aproximação de Laplace foram propostos.[6] Por exemplo, o método de quase-verossimilhança penalizado, que envolve essencialmente o ajuste repetido (isto é, duplamente iterativo) de um modelo combinado normal ponderado com uma variável de trabalho,[7] é implementado por vários programas estatísticos comerciais e de código aberto.

Ajustando um modelo

Ajustar GLMMs por meio de probabilidade máxima (como via AIC) envolve a integração sobre os efeitos aleatórios. Em geral, essas integrais não podem ser expressas de forma analítica. Vários métodos aproximados foram desenvolvidos, mas nenhum tem boas propriedades para todos os modelos e conjuntos de dados possíveis (por exemplo, dados binários desagrupados são particularmente problemáticos). Por esta razão, os métodos que envolvem quadratura numérica ou cadeia de Markov Monte Carlo têm aumentado em uso, à medida que o aumento do poder de computação e os avanços nos métodos os tornam mais práticos.

O critério de informação de Akaike (AIC) é um critério para seleção de modelo. As estimativas de AIC para GLMMs com base em certas distribuições de famílias exponenciais foram recentemente obtidas.[8]

Programas

  • Vários pacotes contribuídos em R fornecem funcionalidade GLMM[9][10]
  • O GLMM pode ser instalado usando SAS e SPSS[11]
  • O Matlab também fornece uma função chamada "fitglme" para ajustar os modelos GLMM.
  • O pacote Python Statsmodels suporta implementação binomial e poisson[12]
  • O pacote Julia MixedModels.jl fornece uma função chamada GeneralizedLinearMixedModel que se ajusta a um GLMM para os dados fornecidos.[13]

Ver também

  • Equação de estimativa generalizada
  • Modelo linear generalizado hierárquico

Predefinição:Referências