Matemática Essencial

Ensino Fundamental, Médio e Superior no Brasil

Superior >> Álgebra Linear
Autovalores e Autovetores
Ulysses Sodré

Material desta página

1 Introdução

Seja \(V\) um espaço vetorial de dimensão \(n\) sobre um corpo \(K\), A uma matriz quadrada de ordem \(n\) e \(T:V\to V\) uma transformação linear, definida por

\[T(v) = Av\]

Pergunta: Será que existe algum vetor \(v\in V\), cuja imagem pela transformação \(T\) tenha a mesma direção que o vetor \(v\), ou seja, será que existe um escalar \(k\in K\) tal que

\[T(v) = k v\]

É claro que o vetor nulo tem essa propriedade para qualquer escalar, mas notamos que o vetor nulo não pode ser utilizado em uma base do espaço vetorial \(V\), objetivo fundamental no contexto do estudo de autovalores e autovetores.

Estamos procurando escalares \(k\in K\) para os quais

\[T(v) = Av = k v\]

Subjacente ao processo de descoberta desses escalares e vetores estão as soluções de muitos problemas aplicados da Matemática, Física, Engenharias Civil e Elétrica, etc.

2 Autovalor e Autovetor

Seja \(A\) uma matriz quadrada de ordem \(n\) sobre um corpo \(K\). Se existe um escalar \(k\in K\) e um vetor \(v\neq\theta\) tal que

\[Av = kv\]

este escalar \(k\) é denominado um autovalor de \(A\) e \(v\) é um autovetor associado a este escalar \(k\).

Sinônimos para a palavra autovalor são: valor próprio e valor característico.

Exemplo 1: Seja uma matriz \(A\) e um vetor genérico \(v\) tal que:

\[A = \begin{pmatrix} 1&0&0 \cr 0&2&0 \cr 0&0&3 \end{pmatrix} \quad e \quad v = \begin{pmatrix} x \cr y \cr z \end{pmatrix}\]

Observamos que:

\[A v = \begin{pmatrix} 1&0&0 \cr 0&2&0 \cr 0&0&3 \end{pmatrix} \begin{pmatrix} x \cr y \cr z \end{pmatrix} = \begin{pmatrix} 1x \cr 2y \cr 3z \end{pmatrix}\]

Procuramos escalares \(k\) tal que \(Av=kv\), isto é:

\[\begin{pmatrix} 1x \cr 2y \cr 3z \end{pmatrix} = k \begin{pmatrix} x \cr y \cr z \end{pmatrix}\]

Na verdade, devemos resolver o sistema de equações:

\[\begin{pmatrix} (1-k)x=0 \cr (2-k)y=0 \cr (3-k)z=0 \end{pmatrix}\]

com a condição que \(v=(x,y,z)\neq (0,0,0)\).

Temos três possibilidades para os autovalores:

  1. Se \(x\neq 0\) então \(k=1\) e usando este valor nas outras equações, obtemos \(y=0\) e \(z=0\). Um vetor simples com estas propriedades é \(v_1=(1,0,0)^t\).
  2. Se \(y\neq 0\) obtemos \(k=2\), o que implica que \(x=0\) e \(z=0\). Um vetor simples com estas propriedades é \(v_2=(0,1,0)^t\).
  3. Se \(z\neq 0\) então \(k=3\), garantindo que \(x=0\) e \(y=0\). Um vetor simples com estas propriedades é \(v_3=(0,0,1)^t\).

Neste caso específico, concluímos que para cada autovalor existe um único autovetor associado.

Exemplo 2: Seja agora uma matriz \(A\) e um vetor genérico \(v\) tal que:

\[A = \begin{pmatrix} 1&0&0 \cr 0&2&0 \cr 0&0&2 \end{pmatrix}\quad e \quad v = \begin{pmatrix} x \cr y \cr z \end{pmatrix}\]

Procuramos escalares \(k\) tal que \(Av=kv\), isto é:

\[\begin{pmatrix} 1x \cr 2y \cr 2z \end{pmatrix} = k \begin{pmatrix} x \cr y \cr z \end{pmatrix}\]

Basta resolver o sistema de equações

\[\begin{pmatrix} (1-k)x = 0 \cr (2-k)y =0 \cr (2-k)z =0 \end{pmatrix}\]

exigindo que \(v=(x,y,z)\neq (0,0,0)\).

Existem duas possibilidades para os autovalores.

  1. Se \(x\neq 0\) então \(k=1\), logo \(y=0\) e \(z=0\). Um vetor com estas propriedades é \(v_1=(1,0,0)^t\).
  2. Se \(y\neq 0\) então \(k=2\) e obtemos \(x=0\) mas existem infinitos valores para \(z\), inclusive \(z=0\). Um vetor simples que satisfaz a estas propriedades é \(v_2=(0,1,0)^t\).
  3. Se \(z\neq 0\) então \(k=2\) e segue que \(x=0\) mas existem muitos valores para \(y\), inclusive \(y=0\). Um vetor simples que satisfaz a estas propriedades é \(v_3=(0,0,1)^t\).

Neste caso, notamos que para o autovalor \(k=1\) existe apenas um autovetor, mas para o autovalor \(k=2\) existem dois autovetores.

Exemplo 3: Seja agora uma matriz \(A\) e um vetor genérico \(v\) tal que:

\[A = \begin{pmatrix} 2 & 0 & 0 \cr 0 & 2 & 0 \cr 0 & 0 & 2 \end{pmatrix} \quad e \quad v = \begin{pmatrix} x \cr y \cr z \end{pmatrix}\]

Procuramos escalares \(k\) tal que \(Av=kv\), isto é:

\[\begin{pmatrix} 2x \cr 2y \cr 2z \end{pmatrix} = k \begin{pmatrix} x \cr y \cr z \end{pmatrix}\]

Basta resolver o sistema de equações

\[\begin{matrix} (2-k)x = 0 \cr (2-k)y =0 \cr (2-k)z =0 \end{matrix}\]

com a condição que \(v=(x,y,z)\neq (0,0,0)\).

Existe um único autovalor \(k=2\). Realmente, se \(x\neq 0\) ou \(y\neq 0\) ou \(z\neq 0\) ou \(xyz\neq 0\) então \(k=2\), garantindo que existem infinitas opções para \(x\), \(y\) e \(z\), mas vamos escolher três bastante simples:

  1. Se \(x=1\), \(y=0\) e \(z=0\), obtemos \(v_1=(1,0,0)^t\).
  2. Se \(x=0\), \(y=1\) e \(z=0\), obtemos \(v_2=(0,1,0)^t\).
  3. Se \(x=0\), \(y=0\) e \(z=1\), obtemos \(v_3=(0,0,1)^t\).

Neste caso, observamos que o mesmo autovalor \(k=2\) gerou três autovetores.

Levando em consideração os três exemplos, tem sentido definir o conceito de autoespaço associado a cada autovalor.

3 Autoespaço associado ao autovalor

Se \(k\) é um autovalor de uma matriz \(A\), definimos o auto-espaço associado a \(k\) como o conjunto de todos os vetores obtidos pela combinação linear dos autovetores associados a \(k\). Denotamos este conjunto por:

\[S_k = \{v\in V: Av=kv \}\]

Proposição: O conjunto \(S_k\) é um subespaço vetorial de \(V\) gerado pelos autovetores associados a \(k\).

Demonstração: O vetor nulo não é um autovetor mas \(0\in S_k\) pois \(A\theta=k\theta=\theta\).

Se \(v\in S_k\) e \(w\in S_k\), então \(Av=kv\) e \(Aw=kw\), logo

\[A(v+w) = Av+Aw = kv+kw = k(v+w)\]

e concluímos que \(v+w\in S_k\).

Analogamente, se \(v\in S_k\) e \(k\in K\), então:

\[A(kv) = k(kv)\]

e concluímos que \(kv\in S_k\).

Ao invés de trabalhar diretamente com a resolução de sistemas como nos exemplos, existe um processo mais simples para obter os autovalores de \(A\).

4 Polinômio característico

Seja \(A\) uma matriz \(n{\times}n\) sobre \(K\). Definimos o polinômio característico de \(A\) como:

\[f(k)=\det(kI-A)\]

Exemplo: Seja a matriz definida por:

\[A = \begin{pmatrix} 1 & 2 \cr 4 & 9 \end{pmatrix}\]

Assim:

\[f(k) = \begin{vmatrix} k-1 & -2 \cr -4 & k-9 \end{vmatrix} = k^2-10k+1\]

Algumas vezes vemos na literatura o polinômio característico da matriz A definido na forma trocada

\[f(k)=\det(A-kI)\]

Lema: Seja \(M\) uma matriz quadrada de ordem \(n{\times}n\). Um sistema \(Mv=0\) tem solução não trivial se, e somente se, \(\det(M)=0\).

Teorema: Os autovalores de uma matriz quadrada \(A\) de ordem \(n{\times}n\) são zeros do polinômio característico de \(A\), isto é, são escalares \(k\) para os quais \(f(k)=0\).

Demonstração: Os autovalores da matriz \(A\) podem ser obtidos a partir da existência de escalares \(k\) e vetores não nulos \(v=(x,y,z)^t\) para os quais

\[Av = k v\]

Este sistema pode ser reescrito como:

\[Av = kIv\]

ou seja

\[(kI-A)v = 0\]

e este sistema tem uma solução não trivial se, e somente se, o determinante da matriz \(kI-A\) é nulo (consequência da Regra de Cramer), isto é:

\[\det(A-kI) = 0\]

Notamos que \(\det(A-kI)\) é uma função polinomial na variável \(k\), daí indicarmos esta expressão por:

\[f(k)=\det(A-kI)\]

A partir deste Teorema podemos obter os autovetores se resolvermos o sistema

\[(kI-A)v=0\]

Exemplo: Seja a matriz dada por

\[A = \begin{pmatrix} 0 & 1 & 1 \cr -1 & 2 & 1 \cr -1 & 1 & 2 \end{pmatrix}\]

O polinômio característico associado à matriz \(A\) é

\[f(k) = k^3-4k^2+5k-2\]

Como a soma dos coeficientes deste polinômio é igual a zero, segue que \(k=1\) é um zero de \(f=f(k)\) e temos que \(f(1)=0\). Assim dividimos este polinômio por \((k-1)\) para obter a forma decomposta:

\[f(k) = (k-1)(k^2-3k+2)\]

e usando a fórmula quadrática (que não é de Bhaskara), obtemos:

\[f(k) = (k-1)(k-1)(k-2)\]

o que significa que os autovalores de \(A\) são \(k=1\), \(k=1\) e \(k=2\).

Em geral, o sistema \((kI-A)v=0\) toma a forma

\[(kI-A) \begin{pmatrix} x \cr y \cr z \end{pmatrix} = \begin{pmatrix} k & -1 & -1 \cr 1 & k-2 & -1 \cr 1 & -1 & k-2 \end{pmatrix} \begin{pmatrix} x \cr y \cr z \end{pmatrix} = \begin{pmatrix} 0 \cr 0 \cr 0 \end{pmatrix}\]

Para \(k=1\), o sistema toma a forma:

\[\begin{pmatrix} 1 & -1 & -1 \cr 1 & -1 & -1 \cr 1 & -1 & -1 \end{pmatrix} \begin{pmatrix} x \cr y \cr z \end{pmatrix} = \begin{pmatrix} 0 \cr 0 \cr 0 \end{pmatrix}\]

e este sistema se reduz a apenas uma equação \(x-y-z=0\).

Como temos duas variáveis livres, podemos escrever \(x=y+z\), para obter valores para \(x\) em função de \(y\) e de \(z\).

Se \(y=1\) e \(z=0\) então \(x=1\) e \(v_1=(1,1,0)^t\) é um autovetor. Se \(y=0\) e \(z=1\) então \(x=1\) e \(v_2=(1,0,1)^t\) é outro autovetor.

Para \(k=2\), o sistema toma a forma:

\[\begin{pmatrix} 2 & -1 & -1 \cr 1 & 0 & -1 \cr 1 & -1 & 0 \end{pmatrix} \begin{pmatrix} x \cr y \cr z \end{pmatrix} = \begin{pmatrix} 0 \cr 0 \cr 0 \end{pmatrix}\]

e este sistema se reduz a apenas uma relação \(x=y=z\) e tomando \(x=y=z=1\), obtemos o terceiro autovetor de \(A\): \(v_3=(1,1,1)^t\).

5 Matrizes Semelhantes

Duas matrizes \(A\) e \(B\) são semelhantes, se existe uma matriz inversível \(P\) tal que

\[A = P^{-1}BP\]

Exercício: Seja a matriz \(A\) do exemplo anterior:

\[A = \begin{pmatrix} 0 & 1 & 1 \cr -1 & 2 & 1 \cr -1 & 1 & 2 \end{pmatrix}\]
  1. Construir uma matriz \(P\) que tem como colunas os autovetores \(v_1\), \(v_2\) e \(v_3\) da matriz \(A\).
  2. Obter a inversa da matriz \(P\).
  3. Calcular a matriz \(D\) semelhante a \(A\), definida por \(D=P^{-1}AP\).
  4. Tirar alguma conclusão sobre a posição dos autovalores na matriz \(D\).
  5. Verificar que \(\text{traço}(D)=\text{traço}(A)\).
  6. Verificar que \(\det(D)=\det(A)\).

Exercício: Considere uma matriz \(A\) (com autovalores complexos) definida por:

\[A = \begin{pmatrix} 1 & 2 & -1 \cr 0 & 0 & 1 \cr 1 & 1 & 0 \end{pmatrix}\]
  1. Mostrar que o polinômio característico de \(A\) é dado por: \(f(k)=k^3-k^2-1\).

  2. Para obter os autovalores de \(A\), devemos resolver a equação \(f(k)=0\), cujos zeros são:

    \begin{align} k_1 &= 1.4655712 \cr k_2 &= -0.232786 + 0.792552 i \cr k_3 &= -0.232786 - 0.792552 i \end{align}
    1. Obter os autovetores da matriz \(A\).
    2. Construir uma matriz \(P\) que tem como colunas os autovetores \(v_1\), \(v_2\) e \(v_3\) da matriz \(A\).
    3. Obter a inversa da matriz \(P\).
    4. Calcular a matriz \(D\) semelhante a \(A\), definida por \(D=P^{-1}AP\).
    5. Tirar alguma conclusão sobre os autovalores da matriz \(D\).
    6. Mostrar que o operador traço possui a propriedade: \(\text{traço}(D)\approx\text{traço}(A)\).
    7. Verificar que \(\det(D)\approx\det(A)\).

6 Matriz ortogonal

Uma matriz \(M\) é ortogonal se \(M^{-1}=M^t\).

Exemplo: Uma típica matriz ortogonal é a matriz de rotação de \(\theta\) radianos, definida por:

\[R_{\theta}=\begin{pmatrix} \cos(\theta) & -\sin(\theta) \cr \sin(\theta) & \cos(\theta) \end{pmatrix}\]

pois a inversa de \(R_{\theta}\) é igual à transposta de \(R_{\theta}\).

7 Aplicações de autovalores em Geometria

Seja a curva plana determinada pela forma quadrática \(ax^2+2bxy+cy^2=d\) onde \(a^2+b^2+c^2\neq 0\).

Podemos reescrever o membro da esquerda da equação acima como:

\[ax^2+2bxy+cy^2= \begin{pmatrix} x & y \end{pmatrix} \begin{pmatrix} a & b \cr b & c \end{pmatrix} \begin{pmatrix} x \cr y \end{pmatrix} = v^t A v\]

onde

\[A = \begin{pmatrix} a & b \cr b & c \end{pmatrix} \quad e \quad v = \begin{pmatrix} x \cr y \end{pmatrix}\]

Pergunta: Será que podemos escrever \(x\) e \(y\) em função de duas novas variáveis \(x_1\) e \(y_1\) de modo que a nova forma quadrática nas novas variáveis \(x_1\) e \(y_1\) não possui o termo misto \(x_1y_1\) para que a forma quadrática esteja na forma canônica?

Uma resposta adequada é dada pela rotação de eixos, uma vez que o termo em \(xy\) que aparece na equação acima é responsável pela inclinação dos eixos principais associados à curva no sistema cartesiano.

Como a matriz de rotação de radianos é dada por:

\[R_{\theta} = \begin{pmatrix} \cos(\theta) & -\sin(\theta) \cr \sin(\theta) & \cos(\theta) \end{pmatrix}\]

podemos realizar a mudança de variáveis com:

\[v = \begin{pmatrix} x \cr y \end{pmatrix} = \begin{pmatrix} \cos(\theta) & -\sin(\theta) \cr \sin(\theta) & \cos(\theta) \end{pmatrix} \begin{pmatrix} x_1 \cr y_1 \end{pmatrix}\]

Tomando a relação acima, podemos escrever:

\[Y = \begin{pmatrix} x_1 \cr y_1 \end{pmatrix} = \begin{pmatrix} \cos(\theta) & \sin(\theta) \cr -\sin(\theta) & \cos(\theta) \end{pmatrix} \begin{pmatrix} x \cr y \end{pmatrix} = R_{\theta}^{-1} v\]

Para simplificar um pouco, tomamos \(P=R_{\theta}\) e como esta matriz \(P\) é ortogonal, podemos escrever a relação na forma:

\[v^t A v = (PY)^t A (PY) = Y^t P^t A P Y = Y^t (P^{-1} A P) Y = b\]

Escolhendo adequadamente o valor de \(\theta\) em função das constantes \(a\), \(b\) e \(c\) da forma quadrática, podemos escrever a matriz:

\[P^{-1}AP = D = \begin{pmatrix} k_1 & 0 \cr 0 & k_2 \end{pmatrix}\]

e a nova forma quadrática não contém o termo misto \(x_1y_1\), pois:

\[k_1 x_1^2 + k_2 y_1^2 = c_1\]

Conclusão: Os valores \(k_1\) e \(k_2\) são os autovalores da matriz \(A\) e a matriz \(P\) é a matriz cujas colunas são os autovetores obtidos a partir da matriz \(A\).

8 Aplicações de autovalores em EDO

Seja a equação diferencial ordinária (EDO)

\[2y''(x)-6y'(x)+4y(x)=0\]

O polinômio característico associado a esta EDO é dado por:

\[p(k)=2k^2-6k+4\]

cujos zeros (autovalores) são \(k_1=1\) e \(k_2=2\). Assim, as autofunções (autovetores) são: \(y_1(x)=\exp(k_1 x)\) e \(y_2(x)=\exp(k_2 x)\), garantindo que o conjunto de autofunções (autovetores) é:

\[W = \{y_1(x), y_2(x)\} = \{\exp(1x), \exp(2x)\}\]

e a solução geral da EDO é a combinação linear dos elementos de W:

\[y(x) = C_1 \exp(1x) + C_2 \exp(2x)\]