Método do gradiente

O método do gradiente (ou método do máximo declive) é um método numérico usado em otimização. Para encontrar um mínimo (local) de uma função usa-se um esquema iterativo, onde em cada passo se toma a direção (negativa) do gradiente, que corresponde à direção de declive máximo. Pode ser encarado como o método seguido por um curso da água, na sua descida pela força da gravidade.

Descrição

Começando com um vetor inicial $𝐱_{0}$ visando alcançar um ponto de mínimo de $F$ , consideramos a sucessão definida por $𝐱_{0}, 𝐱_{1}, 𝐱_{2}, \dots$ onde a pesquisa linear é dada pela direção de descida $𝐝_{n}$

𝐱_{n + 1} = 𝐱_{n} + ω_{n} 𝐝_{n}

.

No caso do método do gradiente a condição de descida verifica-se tomando

𝐝_{n} = - \nabla F (𝐱_{n})

ficando a iteração definida por

𝐱_{n + 1} = 𝐱_{n} - ω_{n} \nabla F (𝐱_{n})

.

Pesquisa exata e inexata

Um dos problemas habituais nos métodos de pesquisa linear é determinar o passo $ω_{n}$ a ser considerado na iteração.

Há duas abordagens possíveis:

Pesquisa exata - onde $ω_{n}$ será o valor otimal numa otimização unidimensional.
Pesquisa inexata - onde $ω_{n}$ será apenas um valor aproximado.

Isto tem que ser feito a cada passo, pelo que a Pesquisa Exata pode ser incomportável em tempo computacional, sendo preferível usar uma Pesquisa Inexata.

No caso da pesquisa exata, procura-se o ponto de mínimo de uma nova função

g (ω) = F (𝐱_{n} - ω \nabla F (𝐱_{n}))

notando que $𝐱_{n}$ está fixo e apenas $ω > 0$ está a variar.

Se for possível encontrar esse ponto de mínimo, então obtemos:

ω_{n} =

arg min

_{ω > 0} g (ω)

por exemplo, calculando os zeros da derivada da função g.

Sendo moroso ou impraticável minimizar g considera-se um valor aproximado, dado por exemplo pelo Critério de Wolfe, que é um dos critérios mais usados na pesquisa inexata.

Algoritmo

Um algoritmo em pseudo-código pode definir-se assim:

Define-se o vector inicial $𝐱_{0}$
Ciclo em n
- calcula-se a direção de descida $𝐝_{n} = - \nabla F (𝐱_{n})$
- define-se a função $g (ω) = F (𝐱_{n} + ω 𝐝_{n})$
- determina-se ωn = arg minω>0g(ω)
  - (por pesquisa exata ou inexata)
- define-se $𝐱_{n + 1} = 𝐱_{n} + ω_{n} 𝐝_{n}$
Até que ||∇F(𝐱n+1)||<ϵ
- (onde $ϵ$ , pequeno, define o critério de paragem)

Solução de um sistema linear

O método do gradiente pode ser usado para resolver sistemas lineares, usando minimização quadrática, i.e. usando o método dos mínimos quadrados.

Fórmulas explícitas para encontrar o passo ótimo podem ser encontradas neste caso.^[1]

Equações diferenciais ordinárias

Seja $F (x)$ , uma função dada, em que $x \in ℝ^{m}$ e $F (x) \in ℝ$ .

Supondo que a função $F (x)$ possua derivada contínua, podemos considerar a equação diferencial ordinária

${\begin{matrix} v^{'} (t) & = & - \nabla F (v (t)) \\ v (0) & = & x_{0} \end{matrix} . (*)$

Pode-se mostrar que a única solução $v (t)$ dessa equação é tal que $F (v (t))$ é decrescente^[2], enquanto $\nabla F (v (t)) \neq 0$ . Na verdade $v (t)$ é a curva na direção de maior decrescimento de $F (x)$ , iniciando em $x_{0} .$

O uso do método de Euler para determinar uma aproximação a solução $v (t)$ (da equação $(*)$ ) é equivalente ao método do gradiente (quando o tamanho de passo é variável).

Observamos que o ponto de mínimo de $F (x)$ é um ponto crítico dessa função. Por isso, podemos procurar os pontos de mínimo de $F (x)$ por meio das soluções da equação $g (x) = 0$ , em que

$g (x) = \nabla F (x) .$

Isso pode ser feito resolvendo a equação diferencial ordinária

${\begin{matrix} J g (u (t)) u^{'} (t) & = & - g (u (t)) \\ u (0) & = & x_{0} \end{matrix} (* *)$ ,

em que

$J g (x) = H F (x)$ ,

é a matriz Jacobiana de $g (x)$ e $H F (x)$ é a matriz Hessiana de $F (x)$ .

Pode-se mostrar, sob certas condições, que a única solução $u (t)$ dessa equação $(* *)$ é tal que que

$ϕ (u (t)) = \frac{‖ g (u (t)) ‖^{2}}{2}$

decresce, enquanto $\nabla F (u (t)) \neq 0$ ^[2].

O uso do método de Euler para determinar uma aproximação para $u (t)$ , com tamanho de passo $h = 1$ , é equivalente ao método de Newton para otimização.Predefinição:Referências

↑ David G. Luenberger, Yinyu Ye: Linear and Nonlinear Programming. International Series in Operations Research & Management Science. Volume 116. Springer (2008) [Basic Descent Methods, pág 215]
↑ ^2,0 ^2,1 Predefinição:Citar periódico

[1] David G. Luenberger, Yinyu Ye: Linear and Nonlinear Programming. International Series in Operations Research & Management Science. Volume 116. Springer (2008) [Basic Descent Methods, pág 215]

[:0-2] 2,0 ^2,1 Predefinição:Citar periódico

[1]

[2]

Método do gradiente

Índice

Descrição

Pesquisa exata e inexata

Algoritmo

Solução de um sistema linear

Equações diferenciais ordinárias

Menu de navegação

Método do gradiente

Descrição

Pesquisa exata e inexata

Algoritmo

Solução de um sistema linear

Equações diferenciais ordinárias

Menu de navegação

Procurar