Difusão de Itō

Fonte: testwiki
Revisão em 19h16min de 13 de fevereiro de 2024 por imported>AMdeOliveira (growthexperiments-addlink-summary-summary:2|1|0)
(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Saltar para a navegação Saltar para a pesquisa

Em matemática, especificamente em análise estocástica, uma difusão de Itō é uma solução para um tipo específico de equação diferencial estocástica. Esta equação é semelhante à equação de Langevin usada em física para descrever o movimento browniano de uma partícula sujeita a um potencial em um fluido viscoso. As difusões de Itō recebem este nome em homenagem ao matemático japonês Kiyoshi Itō.[1]

Visão geral

Este processo de Wiener (movimento browniano) em um espaço tridimensional (com um caminho amostral exibido) é um exemplo de difusão de Itō.

Uma difusão de Itō homogênea em tempo em um espaço euclidiano de

n

dimensões

n

é um processo

X:[0,+)×Ωn

definido em um espaço de probabilidade

(Ω,Σ,P)

e que satisfaz uma equação diferencial estocástica da forma:

dXt=b(Xt)dt+σ(Xt)dBt,

em que

B

é um movimento browniano de

m

dimensões e

b:nn

e

σ:nn×m

satisfazem a condição de continuidade de Lipschitz usual:

|b(x)b(y)|+|σ(x)σ(y)|C|xy|

para alguma constante

C

e todo

x,yn

.[2] Esta condição garante a existência de uma única solução forte

X

à equação diferencial estocástica dada acima. O campo vetorial

b

é conhecido como coeficiente de deriva de

X

. O campo tensorial

σ

é conhecido como o coeficiente de difusão de

X

. É importante notar que

b

e

σ

não dependem do tempo. Se dependessem do tempo,

X

seria apenas considerado um processo de Itō, não uma difusão. Difusões de Itō têm uma série de propriedades importantes, que incluem:

Em particular, uma difusão de Itō é um processo contínuo e fortemente markoviano de tal modo que o domínio de seu operador característico inclui todas as funções dupla e continuamente diferenciáveis, sendo uma difusão no sentido definido pelo matemático soviético-americano Eugene Dynkin.

Continuidade

Continuidade amostral

Um difusão de Itō

X

é um processo contínuo amostral, isto é, para quase todas as realizações

Bt(ω)

do ruído,

Xt(ω)

é uma função contínua do parâmetro de tempo

t

. Mais precisamente, há uma "versão contínua" de

X

, um processo contínuo

Y

tal que:

𝐏[Xt=Yt]=1 para todo t.

Isto se segue da existência padrão e da teoria da unicidade para soluções fortes de equações diferenciais estocásticas.[3]

Continuidade de Feller

Além de ser contínua e amostral, uma difusão de Itō X satisfaz o requisito mais forte da continuidade de Feller.

Para um ponto xn, considere que P x denota a lei de X, sendo o dado inicial X0=x, e considere que 𝐄xdenota o valor esperado em relação a P x.

Considere que

f:n

é uma função mensurável de Borel limitada abaixo e defina, para

t0

fixo,

u:n

por:

u(x)=𝐄x[f(Xt)].
  • Semicontinuidade inferior: se f for semicontínua inferior, então, u é semicontínua inferior.
  • Continuidade de Feller: se f for limitada e contínua, então, u é contínua.

O comportamento da função u acima quando o tempo t é variado foi abordado pela equação regressiva de Kolmogorov, pela equação de Fokker–Planck, entre outras.[4]

Propriedade de Markov

Propriedade de Markov

Uma difusão de Itō tem a importante propriedade de ser markoviana: o futuro comportamento de X, dado o que aconteceu até o tempo t, é o mesmo como se o processo tivesse sido iniciado na posição Xt no tempo 0. A formulação matemática precisa desta afirmação exige alguma notação adicional.

Considere que

Σ*

denota a filtração natural de

(Ω,Σ)

gerada pela movimento browniano

B

. Para

t0

,

Σt=ΣtB=σ{Bs1(A)Ω:0st,A𝐑nBorel}.

É fácil mostrar que

X

é adaptada a

Σ*

(isto é, que cada

Xt

é

Σt

-mensurável), de modo que a filtração natural

F*=F*X

de

(Ω,Σ)

gerada por

X

tem

FtΣt

para cada

t0

. Considere que

f:n

é uma função limitada e mensurável de Borel. Então, para todo

t

e

h0

, o valor esperado condicional condicionado na σ-álgebra

Σt

e o valor esperado do processo "reiniciado" a partir de

Xt

satisfazem a propriedade de Markov:

𝐄x[f(Xt+h)|Σt](ω)=𝐄Xt(ω)[f(Xh)].

De fato,

X

é também um processo de Markov no que se refere à filtração

F*

, como mostra o que segue:

𝐄x[f(Xt+h)|Ft]=𝐄x[𝐄x[f(Xt+h)|Σt]|Ft]=𝐄x[𝐄Xt[f(Xh)]|Ft]=𝐄Xt[f(Xh)].

[5]

Propriedade forte de Markov

A propriedade forte de Markov é uma generalização da propriedade de Markov acima em que t é substituído por um tempo aleatório adequado T:Ω[0,+] conhecido como tempo de parada. Então, por exemplo, em vez de "reiniciar" o processo X no tempo t=1, pode-se "reiniciar" quando quer que X alcance pela primeira vez algum ponto especificado p de n.

Como antes, considere

f:n

uma função limitada e mensurável de Borel. Considere

τ

um tempo de parada no que se refere à filtração

Σ*

com

τ<+

quase certamente. Então, para todo

h0

,

𝐄x[f(Xτ+h)|Στ]=𝐄Xτ[f(Xh)].

[4]

Gerador

Definição

Associado a cada difusão de Itō, há um operador diferencial parcial de segunda ordem conhecido como o gerador de difusão. O gerador é muito útil em muitas aplicações e codifica uma grande quantidade de informação sobre o processo

X

. Formalmente, o gerador infinitesimal de uma difusão de Itō

X

é o operador

A

, que é definido como agindo em funções adequadas

f:n

por:

Af(x)=limt0𝐄x[f(Xt)]f(x)t.

O conjunto de todas as funções

f

para as quais este limite existe em um ponto

x

é denotado como

DA(x)

, enquanto

DA

denota o conjunto de todas as

f

para as quaIS o limite existe para todo

xn

. Pode-se mostrar que qualquer função

f

compactamente suportada

C2

(duplamente diferenciável com segunda derivada contínua) repousa em

DA

e que:

Af(x)=ibi(x)fxi(x)+12i,j(σ(x)σ(x))i,j2fxixj(x),

ou, em termos de gradiente, escalar e produto interno de Frobenius,

Af(x)=b(x)xf(x)+12(σ(x)σ(x)):xxf(x).

[3]

Exemplo

O gerador

A

para o movimento browniano

B

padrão de

n

dimensões, que satisfaz a equação diferencial estocástica

dXt=dBt

, é dado por

Af(x)=12i,jδij2fxixj(x)=12i2fxi2(x),

isto é,

A=Δ/2

, em que

Δ

denota o operador de Laplace.

Equações de Kolmogorov e de Fokker–Planck

Predefinição:MainO gerador é usado na formulação da equação regressiva de Kolmogorov. Intuitivamente, esta equação diz como o valor esperado de qualquer estatística adequadamente suave de

X

evolui no tempo: ele deve resolver uma certa equação diferencial parcial em que o tempo

t

e a posição inicial

x

são variáveis independentes. Mais precisamente, se

fC2(n;)

tiver suporte compacto e

u:[0;+)×n

for definida por:

u(t,x)=𝐄x[f(Xt)],

então,

u(t,x)

é diferenciável no que diz respeito a

t,u(t,)DA

para todo

t

e

u

satisfaz a seguinte equação diferencial parcial, conhecida como equação regressiva de Kolmogorov:

{ut(t,x)=Au(t,x),t>0,xn;u(0,x)=f(x),xn.

A equação de Fokker–Planck (também conhecida como equação progressiva de Kolmogorov) é, em algum sentido, a "adjunta" da equação regressiva e diz como as funções densidade de probabilidade de

Xt

evoluem com o tempo

t

. Considere que

ρ(t,)

é a densidade de

Xt

no que diz respeito à medida de Lebesgue em

n

, isto é, para qualquer conjunto mensurável de Borel

Sn

:

𝐏[XtS]=Sρ(t,x)dx.

Considere que

A*

denota o adjunto hermitiano de

A

(no que diz respeito ao produto interno L2). Então, dado que a posição inicial

X0

tem a densidade prescrita

ρ0

,

ρ(t,x)

é diferenciável no que diz respeito a

t

,

ρ(t,)DA*

para todo

t

e

ρ

satisfaz a seguinte equação diferencial parcial, conhecida como a equação de Fokker–Planck:

{ρt(t,x)=A*ρ(t,x),t>0,xn;ρ(0,x)=ρ0(x),xn.

[6]

Fórmula de Feynman–Kac

Predefinição:MainA fórmula de Feynman–Kac é uma generalização útil da equação regressiva de Kolmogorov. Novamente,

f

está em

C2(n;)

e tem suporte compacto e assume-se que

q:n

é uma função contínua que é limitada abaixo. Define-se uma função

v:[0,+)×n

por:

v(t,x)=𝐄x[exp(0tq(Xs)ds)f(Xt)].

A fórmula de Feynman–Kac afirma que

v

satisfaz a equação diferencial parcial:

{vt(t,x)=Av(t,x)q(x)v(t,x),t>0,xn;v(0,x)=f(x),xn.

Além disso, se

w:[0,+)×n

for

C1

em tempo,

C2

em espaço, limitada como

K×n

para todo

K

compacto e satisfizer a equação diferencial parcial acima, então,

w

deve ser

v

como definida acima.

A equação regressiva de Kolmogorov é o caso especial da fórmula de Feynman–Kac em que q(x)=0 para todo xn.[3]

Operador característico

Definição

O operador característico de uma difusão de Itō X é um operador diferencial parcial intimamente relacionado com o gerador, mas de certa forma mais geral. É mais adequado para certos problemas, por exemplo na solução do problema de Dirichlet.

O operador característico

𝒜

de uma difusão de Itō

X

é definido por:

𝒜f(x)=limUx𝐄x[f(XτU)]f(x)𝐄x[τU],

em que os conjuntos

U

formam uma sequência de conjuntos abertos

Uk

que decrescem ao ponto

x

no sentido em que:

Uk+1Uk e k=1Uk={x}

e

τU=inf{t0 : Xt∉U}

é o primeiro tempo de saída a partir de

U

para

X

.

D𝒜

denota o conjunto de todas as

f

para as quais este limite existe para todo

xn

e todas as sequências

{Uk}

. Se

𝐄x[τu]=+

para todos os conjuntos abertos

U

contendo

x

, define-se:

𝒜f(x)=0.

[4]

Relação com o gerador

O operador característico e o gerador infinitesimal estão muito intimamente relacionados e até mesmo concordam para uma grande classe de funções. Pode-se mostrar que:Predefinição:Quotee que

Af=𝒜f para todo fDA.

Em particular, o gerador e o operador característico concordam para todas as funções

f C2

e nesse caso:

𝒜f(x)=ibi(x)fxi(x)+12i,j(σ(x)σ(x))i,j2fxixj(x).

Aplicação do movimento browniano em uma variedade de Riemann

O operador característico de um movimento browniano é uma vez e meia o operador de Laplace-Beltrami. Aqui está o operador de Laplace-Beltrami em uma esfera bimensional.

Acima, o gerador (e assim o operador característico) do movimento browniano em

n

foi calculado como sendo

Δ/2

, em que

Δ

denota o operador de Laplace. O operador característico é útil ao definir o movimento browniano em uma variedade de Riemann

(M,g)

de

m

dimensões: um movimento browniano em

M

é definido como sendo uma difusão em

M

cujo operador característico

𝒜

em coordenadas locais

xi

,

1im

, é dado por

ΔLB/2

, em que

ΔLB

é operador de Laplace–Beltrami dado em coordenadas locais por:

ΔLB=1det(g)i=1mxi(det(g)j=1mgijxj),

em que

[gij]=[gij]1

no sentido do inverso da matriz quadrada.[7]

Operador resolvente

Em geral, o gerador A de uma difusão de Itō X não é um operador limitado. Entretanto, se um múltiplo positivo do operador identidade 𝐈 for subtraído a partir de A, então, o operador resultante é invertível. O inverso deste operador pode ser expresso em termos do próprio X usando o operador resolvente.

Para

α>0

, o operador resolvente

Rα

, agindo em funções limitadas, contínuas

g:n

, é definido como:

Rαg(x)=𝐄x[0eαtg(Xt)dt].

Pode-se mostrar, usando a continuidade de Feller da difusão

X

, que

Rαg

é ele mesmo uma função limitada, contínua. Também,

Rα

e

α𝐈A

são operadores mutuamente inversos:

  • Se f:n for C2 com suporte compacto, então, para todo α>0,
Rα(α𝐈A)f=f;
  • Se g:n for limitada e contínua, então, Rαg repousa em DA, para todo α>0,
(α𝐈A)Rαg=g.

[3]

Medidas invariantes

Algumas vezes, é necessário encontrar uma medida invariante para uma difusão de Itō

X

, isto é, uma medida em

n

que não muda sob o "fluxo" de

X

, ou seja, se

X0

for distribuída de acordo com tal medida invariante

μ

, então,

Xt

é também distribuída de acordo com

μ

para qualquer

t0

. A equação de Fokker–Planck oferece uma maneira de encontrar tal medida, pelo menos se tiver uma função densidade de probabilidade

ρ

: se

X0

for de fato distribuída de acordo com uma medida invariante

μ

com densidade

ρ

, então, a densidade

ρ(t,)

de

Xt

não muda com

t

, de modo que

ρ(t,)=ρ

, e então

ρ

deve resolver a equação diferencial parcial (independente de tempo):

A*ρ(x)=0,xn.

Isto ilustra uma das conexões entre a análise estocástica e o estudo das equações diferenciais parciais. Reciprocamente, uma dada equação diferencial parcial linear de segunda ordem da forma

Λf=0

pode ser difícil de resolver diretamente, mas se

Λ=A*

para alguma difusão de Itō

X

e uma medida invariante para

X

for fácil de computar, então, a densidade daquela medida oferece uma solução para a equação diferencial parcial.

Medidas invariantes para fluxos de gradiente

Uma medida invariante é comparativamente fácil de computar quando o processo

X

é um fluxo de gradiente estocástico de forma:

dXt=Ψ(Xt)dt+2β1dBt,

em que

β>0

desempenha o papel de uma temperatura inversa e

Ψ:n

é um potencial escalar que satisfaz a suavidade adequada e as condições de crescimento. Neste caso, a equação de Fokker–Planck tem uma única solução estacionária

ρ

(isto é,

X

tem uma única medida invariante

μ

com densidade

ρ

) e é dada pela distribuição de Gibbs:

ρ(x)=Z1exp(βΨ(x)),

em que a função de partição

Z

é dada por:

Z=nexp(βΨ(x))dx.

Além disso, a densidade

ρ

satisfaz um princípio variacional: isto minimiza sobre todas as densidades de probabilidade

ρ

em

n

a energia livre funcional

F

dada por:

F[ρ]=E[ρ]+1βS[ρ],

em que

E[ρ]=𝐑nΨ(x)ρ(x)dx

desempenha o papel de uma energia funcional e

S[ρ]=𝐑nρ(x)logρ(x)dx

é a negativa da funcional de entropia de Gibbs–Boltzmann. Mesmo quando o potencial

Ψ

não é bem comportado o bastante para a função de partição

Z

e a medida de Gibbs

μ

a serem definidas, a energia livre

F[ρ(t,)]

ainda faz sentido para cada tempo

t0

, desde que a condição inicial tenha

F[ρ(0,)]<+

. A energia livre funcional

F

é, na verdade, uma função de Lyapunov para a equação de Fokker–Planck:

F[ρ(t,)]

pode decrescer conforme

t

aumenta. Assim,

F

é uma função H para a dinâmica X.[8]

Exemplo

Considere o processo Ornstein–Uhlenbeck

X

em

n

que satisfaz a equação diferencial estocástica:

dXt=κ(Xtm)dt+2β1dBt,

em que

mn

e

β,κ>0

são constantes dadas. Neste caso, o potencial

Ψ

é dado por:

Ψ(x)=12κ|xm|2,

e, então, a medida invariante para

X

é uma medida gaussiana com densidade

ρ

dada por:

ρ(x)=(βκ2π)n2exp(βκ|xm|22).

Heuristicamente, para um

t

grande,

Xt

é aproximadamente normalmente distribuída com média

m

e variância

(βκ)1

. A expressão para a variância pode ser interpretada como se segue: grandes valores de

κ

significam que o poço de potencial

Ψ

tem "lados muito íngremes", de modo que é improvável que

Xt

se mova para longe do mínimo de

Ψ

em

m

; de forma semelhante, grandes valores de

β

significam que o sistema é muito "frio" com pouco ruído, de modo que, novamente, é improvável que

Xt

se mova para longe de

m

.

Propriedade martingale

Em geral, uma difusão de Itō não é um martingale. Entretanto, para qualquer

fC2(2;)

com suporte compacto, o processo

M:[0,+)×Ω

definido por:

Mt=f(Xt)0tAf(Xs)ds,

em que

A

é o gerador de

X

, é um martingale no que diz respeito à filtração natural

F*

de

(Ω,Σ)

por

X

. A prova é simples: segue-se da expressão usual da ação do gerador em funções

f

suficientemente suaves e do lema de Itō (a regra da cadeia estocástica) que:

f(Xt)=f(x)+0tAf(Xs)ds+0tf(Xs)σ(Xs)dBs.

Já que as integrais de Itō são martingales no que diz respeito à filtração natural

F*

de

(Ω,Σ)

por

B

, para

t>s

,

𝐄x[Mt|Σs]=Ms.

Assim, como exigido,

𝐄x[Mt|Fs]=𝐄x[𝐄x[Mt|Σs]|Fs]=𝐄x[Ms|Fs]=Ms,

já que

Ms

é

Fs

-mensurável.

Fórmula de Dynkin

Predefinição:MainA fórmula de Dynkin, que recebe este nome em homenagem ao matemático russo-americano Eugene Dynkin, dá o valor esperado de qualquer estatística adequadamente suave de uma difusão de Itō

X

(com gerador

A

) em um tempo de parada. Precisamente, se

τ

for um tempo de parada com

𝐄[τ]<+

e se

f:n

for

C2

com suporte compacto, então:

𝐄x[f(Xτ)]=f(x)+𝐄x[0τAf(Xs)ds].

A fórmula de Dynkin pode ser usada para calcular muitas estatísticas úteis de tempos de parada. Por exemplo, o movimento browniano canônico na reta real começando em 0 sai do intervalo

(R,+R)

em um tempo aleatório

τR

com valor esperado:

𝐄0[τR]=R2.

A fórmula de Dynkin oferece informação sobre o comportamento de

X

em um tempo de parada razoavelmente geral. Para mais informações sobre a distribuição de

X

em um tempo de chegada, pode-se estudar a medida harmônica do processo.[9]

Medidas associadas

Medida harmônica

Em muitas situações, é suficiente saber quando uma difusão de Itō

X

deixará pela primeira vez um conjunto mensurável

Hn

, isto é, estudar o primeiro tempo de saída:

τH(ω)=inf{t0|Xt∉H}.

Algumas vezes, entretanto, pode-se querer saber a distribuição dos pontos nos quais

X

deixa o conjunto. Por exemplo, o movimento browniano canônico

B

na reta real começando em 0 deixa o intervalo

(1,1)

em -1 com probabilidade

1/2

e em 1 com probabilidade

1/2

, de modo que

Bτ(1,1)

é uniformemente distribuído no conjunto

{1,1}

Em geral, se

G

for compactamente encaixado em

n

, então, a medida harmônica (ou distribuição de chegada) de

X

na fronteira

G

de

G

é a medida

μGx

definida por:

μGx(F)=𝐏x[XτGF]

para

xG

e

FG

.

Retornando ao exemplo anterior do movimento browniano, pode-se mostrar que, se B for um movimento browniano em n começando em xn e Dn for uma bola aberta centrada em x, então, a medida harmônica de B em D é invariante sob todas as rotações de D sobre x e coincide com a medida de superfície normalizada em D.

A medida harmônica satisfaz uma interessante propriedade de valor médio: se

f:2

for qualquer função limitada e mensurável de Borel e

φ

for dado por:

φ(x)=𝐄x[f(XτH)],

então, para todos os conjuntos de Borel

GH

e todo

xG

,

φ(x)=Gφ(y)dμGx(y).

A propriedade de valor médio é muito útil na solução de equações diferenciais parciais usando processos estocásticos.[10]

Medida de Green e fórmula de Green

Considere

A

um operador diferencial parcial em um domínio

Dn

e considere

X

uma difusão de Itō com

A

como seu gerador. Intuitivamente, a medida de Green de um conjunto de Borel

H

é o comprimento esperado do tempo em que

X

permanece em

H

antes de deixar o domínio

D

. Em outras palavras, a medida de Green de

X

no que diz respeito a

D

em

x

, denotada

G(x,)

, é definida para conjuntos de Borel

Hn

por:

G(x,H)=𝐄x[0τDχH(Xs)ds],

ou para funções limitadas, contínuas

f:D

, por:

Df(y)G(x,dy)=𝐄x[0τDf(Xs)ds].

A nome "medida de Green" vem do fato de que, se

X

for um movimento browniano, então:

G(x,H)=HG(x,y)dy,

em que

G(x,y)

é a função de Green para o operador

Δ/2

no domínio

D

. Suponha que

𝐄x[τD]<+

para todo

xD

. Então, a fórmula de Green se aplica para toda

fC2(2;)

com suporte compacto:

f(x)=𝐄x[f(XτD)]DAf(y)G(x,dy).

Em particular, se o suporte de

f

for compactamente encaixado em

D

,

f(x)=DAf(y)G(x,dy).

[1][4]

Referências

Predefinição:Reflist

Predefinição:Processos estocásticos