Projeção (álgebra linear)

Fonte: testwiki
Saltar para a navegação Saltar para a pesquisa
A transformação P é a projeção ortogonal na linha m

Em álgebra linear e análise funcional, uma projeção é uma transformação linear P de um espaço vetorial em si mesmo, de modo que P2=P, ou seja, sempre que P é aplicado duas vezes a algum vetor, o resultado é o mesmo que se tivesse sido aplicado uma única vez (uma propriedade conhecida como idempotência). Embora abstrata, esta definição de "projeção" formaliza e generaliza adequadamente a ideia de projeção gráfica. Também se pode considerar o efeito de uma projeção em um objeto geométrico, examinando o efeito que a projeção tem nos pontos do objeto.

Definições

Uma projeção em um espaço vetorial V é um operador linear P:VV tal que P2=P.

Quando o espaço V é munido de um produto interno e é completo (ou seja, quando V é um espaço de Hilbert), o conceito de ortogonalidade pode ser usado. Uma projeção P em um espaço Hilbert V é chamada de projeção ortogonal se satisfaz P𝐱,𝐲=𝐱,P𝐲 para quaisquer 𝐱,𝐲V. Uma projeção em um espaço de Hilbert que não é ortogonal é chamada de projeção oblíqua.

Matriz de projeção

  • No caso de dimensões finitas, uma matriz quadrada P é chamada de matriz de projeção se for igual a seu quadrado, isto é, se P2=P.[1] Predefinição:Rp
  • Uma matriz quadrada P é chamada de matriz de projeção ortogonal se P2=P=PT para uma matriz real, e respectivamente P2=P=P* para uma matriz complexa, onde PT denota a transposição de P e P* denota a transposição adjunta, ou hermitiana, de P.[1] Predefinição:Rp
  • Uma matriz de projeção que não é ortogonal é chamada de matriz de projeção oblíqua.

Os autovalores de uma matriz de projeção devem ser 0 ou 1.

Exemplos

Projeção ortogonal

Por exemplo, a função que leva o ponto (x,y,z) do espaço tridimensional 3 ao ponto (x,y,0) é uma projeção ortogonal no plano xy. Esta função pode ser representada pela matriz

P=[100010000].

A ação desta matriz em um vetor arbitrário pode ser expressa por

P[xyz]=[xy0].

Para ver que P é de fato uma projeção, ou seja, que vale a relação P=P2, podemos calcular

P2[xyz]=P[xy0]=[xy0]=P[xyz].

Observando também que PT=P, vemos que a projeção é uma projeção ortogonal.

Projeção oblíqua

Um exemplo simples de uma projeção não-ortogonal (oblíqua) pode ser dado por

P=[00α1].

Pela multiplicação de matrizes, vê-se logo que

P2=[00α1][00α1]=[00α1]=P.

provando que P é de fato uma projeção. Porém, a projeção só será ortogonal se, e somente se, tivermos α=0; pois somente para este caso será válida a relação PT=P.

Propriedades e classificação

A transformação T é a projeção ao longo de k, sobrejetivamente em m. A imagem de t é m, e seu núcleo é k.

Idempotência

Por definição, uma projeção P é idempotente (ou seja, P2=P)

Complementariedade da imagem e do núcleo

Seja W um espaço vetorial de dimensão finita e P uma projeção em W. Suponha que os subespaços U e V são o imagem e o núcleo de P, respectivamente. Então P tem as seguintes propriedades:

  1. P é o operador identidade em U 𝐱U:P𝐱=𝐱
  2. Temos a soma direta W=UV. Cada vetor 𝐱W pode ser decomposto unicamente como 𝐱=𝐮+𝐯 com 𝐮=P𝐱 e 𝐯=𝐱P𝐱=(IP)𝐱, onde 𝐮U,𝐯V e I é o operador identidade.

A imagem e o núcleo de uma projeção são complementares, assim como P e Q=IP. O operador Q também é uma projeção, visto que a imagem e o núcleo de P são o núcleo e imagem de Q, e vice-versa.

Espectro

Em espaços vetoriais de dimensão infinita, o espectro de uma projeção está contido em {0,1}, pois

(λIP)1=1λI+1λ(λ1)P.

Apenas 0 ou 1 podem ser autovalores de uma projeção. Isso significa que uma projeção ortogonal P é sempre uma matriz positiva semi-definida. Em geral, os autoespaços correspondentes são o núcleo e a imagem da projeção, respectivamente. A decomposição de um espaço vetorial em somas diretas não é única. Portanto, dado um subespaço V, pode haver muitas projeções cuja imagem (ou núcleo) é V.

Se a projeção é não-trivial, ela possui um polinômio mínimo x+y, que se fatora em raízes distintas, e assim P é diagonalizável.

Produto de projeções

O produto de projeções não é, em geral, uma projeção, mesmo que ambas sejam ortogonais. Se duas projeções comutam, então seu produto é uma projeção, mas o inverso não é verdadeiro: o produto de duas projeções que não comutam pode sim ser uma projeção.

Se duas projeções ortogonais comutam, então seu produto é uma projeção ortogonal. Se o produto de duas projeções ortogonais é uma projeção ortogonal, então as duas projeções ortogonais comutam (de maneira mais geral: dois endomorfismos autoadjuntos comutam se, e somente se, seu produto é também autoadjunto).

Projeções ortogonais

Quando o espaço vetorial W tem um produto interno e é completo (é um espaço de Hilbert) o conceito de ortogonalidade pode ser usado. Uma projeção ortogonal é uma projeção para a qual o intervalo U e o espaço nulo V são subespaços ortogonais. Assim, para cada 𝐱 e 𝐲 em W, P𝐱,(𝐲P𝐲)=(𝐱P𝐱),P𝐲=0. Equivalentemente:

𝐱,P𝐲=P𝐱,P𝐲=P𝐱,𝐲.

Uma projeção é ortogonal se, e somente se, for autoadjunta. Usando as propriedades autoadjunta e idempotente de P, para qualquer 𝐱 e 𝐲 em W temos P𝐱U, 𝐲P𝐲V, e

P𝐱,𝐲P𝐲=P2𝐱,𝐲P𝐲=P𝐱,P(IP)𝐲=P𝐱,(PP2)𝐲=0

onde , é o produto interno associado a W. Portanto, P e IP são projeções ortogonais.[2] A volta, ou seja, se P é ortogonal, então é auto-adjunta, segue de

𝐱,P𝐲=P𝐱,𝐲=𝐱,P*𝐲

para qualquer x e y em W ; portanto P=P*.

Propriedades e casos especiais

Uma projeção ortogonal é um operador limitado. Isso ocorre porque para cada 𝐯 no espaço vetorial temos, pela desigualdade de Cauchy-Schwarz :

P𝐯2=P𝐯,P𝐯=P𝐯,𝐯P𝐯𝐯

Assim, P𝐯𝐯.

Para espaços vetoriais, reais ou complexos, de dimensão finita, o produto interno padrão pode ser substituído por ,.

Projeções oblíquas

O termo projeção oblíqua é algumas vezes usado para se referir a projeções não-ortogonais. Essas projeções também são usadas para representar figuras espaciais em desenhos bidimensionais, embora não com tanta frequência quanto as projeções ortogonais. Enquanto o cálculo do ajuste em uma regressão de mínimos quadrados requer uma projeção ortogonal, o cálculo do valor ajustado de uma regressão de variáveis instrumentais requer uma projeção oblíqua.

As projeções são definidas por seu núcleo e os vetores da base usados para caracterizar sua imagem (que é o complemento do núcleo). Quando os vetores da base são ortogonais ao núcleo, a projeção é uma projeção ortogonal. Quando os vetores de base não são ortogonais ao espaço nulo, a projeção é uma projeção oblíqua. Sejam os vetores 𝐮1,,𝐮k uma base para a imagem da projeção, e monte esses vetores em uma matriz A, de ordem n×k. A imagem e o núcleo são espaços complementares, logo o núcleo tem dimensão nk. Segue que o complemento ortogonal do espaço nulo tem dimensão k. Seja 𝐯1,,𝐯k uma base para o complemento ortogonal do núcleo da projeção, e monte uma matriz B com esses vetores. Então a projeção é definida por

P=A(B𝖳A)1B𝖳.

Esta expressão generaliza a fórmula para projeções ortogonais dada anteriormente.[3][4]

Encontrando a projeção com um produto interno

Seja V um espaço vetorial (neste exemplo, um plano) gerado por vetores ortogonais 𝐮1,𝐮2,,𝐮p. Seja y um vetor qualquer. Podemos definir uma projeção de 𝐲 para V como

projV𝐲=𝐲𝐮i𝐮i𝐮i𝐮i

na qual índices repetidos são somados (seguindo a convenção de Einstein). O vetor 𝐲 pode ser escrito como uma soma ortogonal de modo que 𝐲=projV𝐲+𝐳. O operador projV𝐲 é às vezes denotado como 𝐲^. Há um teorema em álgebra linear que afirma que este 𝐳 é a distância mais curta de 𝐲 para V, e é frequentemente usado em áreas como aprendizado de máquina.

y está sendo projetado no espaço vetorial V

Formas canônicas

Qualquer projeção P=P2 em um espaço vetorial de dimensão d é uma matriz diagonalizável, uma vez que seu polinômio mínimo divide x2x, que se separa em fatores lineares distintos. Portanto, existe uma base na qual P tem a forma

P=Ir0dr

Onde r é a ordem de P. Aqui Ir é a matriz de identidade de ordem r, e 0dr é a matriz nula de ordem dr. Se o espaço vetorial é complexo e munido de um produto interno, então existe uma base ortonormal na qual a matriz de P é dada por[5]

P=[1σ100][1σk00]Im0s.

onde σ1σ2σk>0. Os números inteiros k,s,m e os números reais σi estão determinados de forma única. Observe que 2k+s+m=d. O fator Im0s corresponde ao subespaço invariante máximo no qual P atua como uma projeção ortogonal (de modo que o próprio P seja ortogonal se, e somente se, k=0) e os blocos σi correspondem às componentes oblíquas.

Projeções em espaços vetoriais normados

Quando o espaço vetorial subjacente X é um espaço vetorial normado (não necessariamente de dimensão finita), questões analíticas, irrelevantes no caso de dimensão finita, precisam ser consideradas. Suponhamos então que X é um espaço de Banach.

Muitos dos resultados algébricos discutidos acima sobrevivem à passagem para este contexto. Uma determinada decomposição de soma direta de X em subespaços complementares ainda especifica uma projeção, e vice-versa. Se X é a soma direta X=UV, então o operador definido por P(u+v)=u ainda é uma projeção com imagem U e núcleo V. Também é claro que P2=P. Por outro lado, se P é a projeção em X, i.e., P2=P, então é facilmente verificado que (1P)2=(1P). Em outras palavras, 1P também é uma projeção. A relação P2=P implica 1=P+(1P) e X é a soma direta rg(P)rg(1P).

No entanto, diferentemente do caso de dimensão finita, as projeções não precisam ser contínuas, em geral. Se um subespaço U de X não é fechado na topologia normal, então a projeção em U não é contínua. Em outras palavras, a imagem de uma projeção contínua P deve ser um subespaço fechado. Além disso, o núcleo de uma projeção contínua (na verdade, de um operador linear contínuo qualquer) é fechado. Portanto, uma projeção contínua P leva a uma decomposição de X em dois subespaços fechados complementares: X=rg(P)ker(P)=ker(1P)ker(P).

O inverso também vale, com uma hipótese adicional. Suponha ser U um subespaço fechado de X. Se existe um subespaço fechado V tal que X=UV, então a projeção P com imagem U e núcleo V é contínua. Isso segue do teorema do gráfico fechado. Suponha que xnx e Pxny. É preciso mostrar que Px=y. Já que U é fechado e {Pxn}U, y encontra-se em U, isto é, Py=y. Além disso, xnPxn=(IP)xnxy. Por V ser fechado e {(IP)xn}V, temos que xyV, i.e., P(xy)=PxPy=Pxy=0, o que demonstra a afirmação.

O argumento acima faz uso da hipótese de que ambos U e V são fechados. Em geral, dado um subespaço fechado U, não é necessário que exista um subespaço fechado complementar V, embora para espaços de Hilbert isso sempre possa ser feito tomando o complemento ortogonal. Para espaços de Banach, um subespaço unidimensional sempre tem um subespaço complementar fechado. Esta é uma consequência imediata do teorema de Hahn-Banach. Seja U ser o subespaço gerado por u. Por Hahn-Banach, existe um funcional linear limitado φ tal que Predefinição:Nowrap. O operador P(x)=φ(x)u satisfaz P2=P, logo é uma projeção.A limitação de φ implica a continuidade de P e portanto ker(P)=rg(IP) é um subespaço complementar fechado de U.

Aplicações e outras considerações

As projeções (ortogonais ou não) desempenham um papel importante em algoritmos para certos problemas de álgebra linear:

Como mencionado acima, as projeções são um caso especial de operadores idempotentes. Analiticamente, as projeções ortogonais são generalizações não-comutativas de funções características. Operadores idempotentes são usados na classificação, por exemplo, de álgebras semisimples, enquanto a teoria da medida tem seu início em funções características de conjuntos mensuráveis. Portanto, como se pode imaginar, as projeções são frequentemente encontradas no contexto de álgebras de operadores. Em particular, uma álgebra de von Neumann é gerada por sua rede completa de projeções.

Generalizações

De maneira mais geral, dado um mapa entre espaços vetoriais normados T:VW, pode-se exigir analogamente que este mapa seja uma isometria no complemento ortogonal do núcleo: que (kerT)W ser uma isometria; em particular, ela deve ser sobrejetora. O caso de uma projeção ortogonal ocorre quando W é um subespaço de V. Na geometria Riemanniana, isso é usado na definição de uma submersão Riemanniana.

Ver também

  • Matriz de centralização, que é um exemplo de matriz de projeção.
  • Ortogonalização
  • Subespaço invariável
  • Propriedades do traço
  • O algoritmo de projeção de Dykstra para calcular a projeção em uma interseção de conjuntos

Notas

Predefinição:Reflist

Referências

Predefinição:Controle de autoridade