Introdução

Nesta página definimos potências de matrizes, polinômios de matrizes, polinômio característico e a partir de exemplos numéricos, construímos as demonstrações preliminares para n=2 e para n=3, para gerar a demonstração geral para uma matriz quadrada arbitrária.

Elementos históricos

William Rowan Hamilton (1805-1865), nasceu em Dublin na Irlanda. O teorema de Cayley-Hamilton é um resultado dado em 1858.

Definição de potência de matriz

Seja A=An×n uma matriz com n linhas e n colunas. Definimos recursivamente as potências da matriz A com expoente natural n in{0,1,2,3,...} através de

n+1 = An . A

sendo A 0=In a matriz identidade com n linhas e n colunas.

Exemplo: Se

A =
1 2
0 3

então A 0=I, A 1=A e

A² =
1 2
0 3
.
1 2
0 3
=
1 8
0 9

Para obter A³, basta usar a recursividade, como:

A³ = A² . A =
1 8
0 9
.
1 2
0 3
=
1 26
0 27

Observação: Se uma matriz A tem ordem 2, então A² pode ser escrita como combinação linear das matrizes A e I2, isto é, existem escalares p0 e p1 do corpo que estamos trabalhando tal que

A² = p0 A + p1 I2

Da mesma forma, se a matriz A tem ordem 3, então A³ pode ser escrita como uma combinação linear das matrizes A², A e I2, isto é, existem escalares p0, p1 e p2 no corpo tal que

A³ = p0 A² + p1 A + p2 I2

Polinômios de matrizes

Seja a função polinomial da variável x, definida por

p(x) = a0 + a11 + a2 x² + ... + an xn

Definimos a função polinomial de uma matriz A, relativa a esta função p=p(x) através de

p(A) = a0 I + a11 + a2 A² + ... + an An

De um ponto de vista elementar, é como substituir a variável x pela matriz A.

Exemplo: Se p(x)=x²−4x+5 uma função polinomial associada à matriz quadrada A, então p(A)=A²−4A+5I. Se tomarmos a matriz

A =
1 2
0 3

então

p(A)=A²−4A+5I =
1 8
0 9
−4
1 2
0 3
+5
1 0
0 1
=
2 0
0 2

Se aplicarmos a matriz A ao polinômio p(x)=x²−4x+3, obteremos a função polinomial de matrizes

p(A)=A²−4A+3I =
1 8
0 9
−4
1 2
0 3
+3
1 0
0 1
=
0 0
0 0

Observação: Como A²−4A+3I=0, podemos expressar A² como uma combinação linear das matrizes A e I2, isto é: A²=4A−3I2, como já tínhamos observado antes.

Polinômio Característico

Você pode encontrar mais detalhes sobre este assunto vendo o nosso link sobre Autovalores.

Exemplo: Seja a matriz de ordem 2 definida por:

A =
1 2
0 3

Por definição, o polinômio característico associado à matriz A é:

p(x) = det(A−x I2) = det
1−x 2
0 3−x
= (1−x)(3−x)= x²−4x+3

O polinômio p(x)=x²−4x+3 associado à matriz A tem a forma

p(A) = A² − 4 A + 3 I

e observamos que

p(A) =
1 8
0 9
4 8
0 12
+
3 0
0 3
=
0 0
0 0

e verificamos que A é um zero deste polinômio de matrizes, que é um caso particular de um dos mais importantes teoremas da Álgebra Linear.

Exemplo (caso n=2): Mostraremos que se

A =
a b
c d

e p=p(x) é o polinômio característico associado à matriz A, então p(A)=0.

O polinômio característico p=p(x) associado à matriz A pode ser escrito como:

p(x) = det(A−x I2) = x² + x p1 + p2

onde I2 é a matriz identidade de ordem 2.

Ao substituir x por A em p=p(x), podemos garantir a existência de escalares p1 e p2 tal que p(A) pode ser escrito como uma combinação linear de A², A e de I2, logo

p(A) = A² + p1 A + p2 I2

Tomando a matriz B(x) como a transposta da matriz dos cofatores de A−x I2, isto é, B(x)=adj(A−x I2). Como cada cofator é obtido como um determinante da matriz A−x I2, pela eliminação de uma linha e uma coluna, segue que cada elemento da matriz B=B(x) só poderá possuir potências de x com expoentes menores ou iguais a 1 e a matriz matriz B=B(x) será escrita como uma combinação linear das matrizes quadradas B1, B0 de ordem 2 com coeficientes escalares na variável x, da forma:

B(x) = x B1 + B0

sendo que as matrizes B1 e B0 são independentes de x.

Pela definição de matriz adjunta, segue que

Z.adj(Z) = adj(Z).Z = det(Z) In

Tomando Z=A−x I2 e p(x)=det(A−x I2), segue que

(A−x I2).adj(A−x I2) = p(x) . I2

Como B(x)=adj(A−x I2), segue que

(A−x I2)B(x) = (A−x I2).adj(A−x I2) = p(x) I2

O desenvolvimento de (A−x I2).B(x), que é o membro da esquerda da igualdade acima, fornece:

(A−x I2).B(x) = (A−x I2)(x B1 + B0)
  = A (x B1 + B0) −x I2 (x B1 + B0)
  = x A B1 + A B0 −x² B1 − x B0
  = x² [−B1] + x[A B1 − B0] + [A B0]

Como o membro da direita da igualdade anterior é dado por:

p(x) I2 = [x² + x p1 + p2] I2 = x² I2 + x p1 I2 + p2 I2

Pela identidade de polinômios matriciais, obtemos a igualdade de diversas matrizes:

I2 = −B1
p1 I2 = A B1 − B0
p2 I2 = A B0

Multiplicando a primeira igualdade por A², a segunda por A e a terceira por I2, obtemos

A² I2 = −A² B1
p1 A I2 = +A² B1 −A B0
p2 I2 = +A B0

Somando membro a membro, obtemos à esquerda a expressão de p(A) e à direita a matriz nula, em virtude do cancelamento que ocorre entre as matrizes, isto é,

p(A) = A² + p1 A + p2 I2 = 0

Exemplo (caso n=3): Mostraremos que se

A =
a b c
d e f
g h i

e p=p(x) é o polinômio característico associado à matriz A, então p(A)=0.

O polinômio característico p=p(x) associado à matriz A pode ser escrito como:

p(x) = det(A−x I3) = −x³ + x² p1 + x p2 + p3

onde I3 é a matriz identidade de ordem 3.

Ao substituir x por A em p=p(x), podemos garantir que existem escalares p1, p2 e p3 tal que a matriz p(A) pode ser escrita como uma combinação linear de A³, A², A e de I2, logo

p(A) = −A³ + p1 A² + p2 A + p3 I3

Tomaremos a matriz B(x) como a transposta da matriz dos cofatores de A−x I3, isto é, B(x)=adj(A−x I3). Como cada elemento cofator da matriz B=B(x) é obtido como um determinante da matriz A−x I3, pela eliminação de uma linha e uma coluna, segue que cada elemento da matriz B=B(x) só poderá possuir potências de x com expoentes menores ou iguais a 2 e a matriz matriz B=B(x) será escrita como uma combinação linear de matrizes quadradas B2, B1, B0 de ordem 3 com coeficientes escalares na variável x, da forma:

B(x) = x² B2 + x B1 + B0

Observamos que as matrizes B2, B1 e B0 são independentes de x.

Pela definição de matriz adjunta, segue que

Z . adj(Z) = adj(Z) . Z = det(Z) In

Tomando Z=A−x I3 e p(x)=det(A−x I3), segue que

(A−x I3) . adj(A−x I3) = p(x) . I3

Como B(x)=adj(A−x I3), segue que

(A−x I3)B(x) = (A−x I3) . adj(A−x I3) = p(x) I3

O membro esquerdo da igualdade acima é o desenvolvimento de (A−x I3)B(x), isto é:

(A−x I3).B(x) = (A−x I3)(x² B2 + x B1 + B0)
  = A (x² B2 + x B1 + B0) −x I3 (x² B2 + x B1 + B0)
  = x² A B2 + x A B1 + A B0 −x³ B2 − x² B1 − x B0
  = x³ [−B2] + x²[A B2 − B1] + x[A B1 − B0] + [A B0]

O membro da direita da igualdade anterior, obtido pelo desenvolvimento de p(x) I3 é:

p(x)I3=[−x³ + x² p1 + x p2 + p3] I3 = −x³ I3 + x² p1 I3 + x p2 I3 + p3 I3

Pela identidade de polinômios matriciais, obtemos a igualdade de diversas matrizes:

−I3 = −B2
p1 I3 = A B2 − B1
p2 I3 = A B1 − B0
p3 I3 = A B0

Multiplicando a primeira igualdade por A³, a segunda por A², a terceira por A e a quarta por I3, obtemos

−A³ I3 = −A³ B2
p1 A² I3 = +A³ B2 − A² B1
p2 A I3 = +A² B1 − A B0
p3 I3 = +A B0

Somando membro a membro, obtemos à esquerda a expressão de p(A) e à direita a matriz nula, em virtude do cancelamento que ocorre entre as matrizes, isto é,

p(A) = −A³ + p1 A² + p2 A + p3 I3 = 0

Teorema de Cayley-Hamilton

Se p=p(x) é o polinômio característico associado à matriz A, então p(A)=0, onde 0 é a matriz nula de mesma ordem de A.

Demonstração: Demonstraremos que toda matriz quadrada A é um zero do seu próprio polinômio característico p=p(x).

Seja a matriz quadrada A=aij de ordem n:

A =
a11 a12 ... a1n
a21 a22 ... a2n
... ... ... ...
an1 an2 ... ann

e p=p(x) o polinômio característico associado à matriz A. Assim

p(A) = det(A−x In) = det
a11−x a12 ... a1n
a21 a22−x ... a2n
... ... ... ...
an1 an2 ... ann−x

Este polinômio pode ser escrito na forma

p(x) = det(A−x In) = (−1) n xn + p1n−1 + p2n−2 + ... + pn−1 x + pn

O polinômio de matrizes p(A) associado a p=p(x) é obtido ao substituir x por A, significando que existem escalares p1, p2,...,pn tal que p(A) pode ser expresso como uma combinação linear das potências Ak com k=0,1,2,...,n, assim

p(A)=det(A−x In)=(−1) n An + p1n−1 + p2n−2 + ... + pn−1 A + pn In

onde In é a matriz identidade de ordem n.

Se tomarmos a matriz B(x) como a transposta da matriz dos cofatores de A−x In, obteremos, B(x)=adj(A−x In). Como cada cofator é obtido como um determinante da matriz A−x In, pela eliminação de uma linha e uma coluna, segue que cada elemento da matriz B=B(x) só poderá possuir potências da forma xk com k<n.

A matriz B=B(x) pode ser escrita como uma combinação linear de matrizes quadradas Bn−1, Bn−2,...,B2, B1 e B0 de ordem n com coeficientes escalares na variável x, da forma:

B(x) = x n−1 Bn−1 + x n−2 Bn−2 + ... + x² B2 + x B1 + B0

sendo as matriz Bi independentes de x.

Pela definição de matriz adjunta, segue que

Z . adj(Z) = adj(Z) . Z = det(Z) In

Tomando Z=A−x In e p(x)=det(A−x In), segue que

(A−x In) . adj(A−x In) = p(x) . In

Como B(x)=adj(A−x In), segue que

(A−x In) . B(x) = (A−x In) . adj(A−x In) = p(x) In

O desenvolvimento de (A−x In)B(x), que é o membro da esquerda da igualdade acima, fornece:

(A−x In).B(x) = (A−x In).(x n−1 Bn−1 + x n−2 Bn−2 + ... + x B1 + B0)
  = A.(x n−1 Bn−1 + x n−2 Bn−2 + ... + x B1 + B0)
    −x In (x n−1 Bn−1 + x n−2 Bn−2 + ... + x B1 + B0)
  = n−1 ABn−1 + x n−2 ABn−2 + ... + x AB1 + AB0
    −x n Bn−1 − x n−1 Bn−2 − ... − x² B1 − x B0
  = −x n Bn−1 +x n−1[−Bn−2+ABn−1] +x n−2[−Bn−3+ABn−2]
    + ...
    + x² [−B1 +AB2] +x [−B0 + AB1] +A B0

Como o membro da direita da igualdade anterior é dado por:

p(x) In = [(−1) n xn + p1n−1 + p2n−2 + ... + pn−1 x + pn] In

Pela identidade de polinômios matriciais, obtemos a igualdade de diversas matrizes cujos coeficientes são os mesmos, isto é:

(−1) n In = −Bn−1  
p1 In = −Bn−2 +ABn−1
p2 In = −Bn−3 +ABn−2
p3 In = −Bn−4 +ABn−3
... = ... ...
pn−2 In = −B1 + AB2
pn−1 In = −B0 + AB1
pn In =   + AB0

Multiplicando a primeira igualdade por An, a segunda por A n−1, a terceira por A n−2 e contínuando até a última potência A 0=In, obtemos

(−1) n An = −A n Bn−1  
p1n−1 = −A n−1 Bn−2 +A n Bn−1
p2n−2 = −A n−2 Bn−3 +A n−1 Bn−2
p3n−3 = −A n−3 Bn−4 +A n−2 Bn−3
... = ... ...
pn−3 A = −A³ B2 + A 4 B3
pn−2 A = −A² B1 + A³ B2
pn−1 A = −A 1 B0 + A² B1
pn In =   + A 1 B0

Somando membro a membro, obtemos a expressão de p(A) à esquerda da igualdade, enquanto que a soma à direita gera a matriz nula, em virtude do cancelamento que ocorre entre as matrizes, isto é,

p(A)=(−1) n An + p1n−1 + p2n−2 + ... + pn−1 A + pn In = 0

Referências bibliográficas

  1. F. Ayres Jr. Matrizes. McGraw-Hill do Brasil. Rio de Janeiro. 1971

  2. C. Boyer. História da Matemática. Edgard Blücher. S.Paulo. Pag.424-427. 1974

  3. H. Eves. Introdução à História da Matemática. 3a.ed. Pag.552-556. Editora da UNICAMP. Campinas-SP. 2002

  4. P. R. Halmos. Finite-Dimensional Vector Spaces. Van Nostrand Reinhold. 2nd.edition. New York. 1958

  5. P. J. Kahn. Introducción al álgebra lineal. Harper and Row. Madrid. 1970

  6. A. G. Kurosh. Curso de Álgebra Superior. Editorial Mir. Moscu. 1968

  7. S. Lipschitz. Álgebra Linear. McGraw-Hill do Brasil. 2a.ed. S.Paulo. 1974

  8. L. H. Jacy Monteiro. Álgebra Linear. vol.1. Livraria Nobel. 4a.ed. S.Paulo. 1969

  9. L. H. Jacy Monteiro. Álgebra Linear. vol.2. Livraria Nobel. 2a.ed. S.Paulo. 1970

  10. F. Reza. Los espacios lineales en la ingeniería. Editorial Reverté. Barcelona. 1977

  11. G. C. Shepard. Vector Spaces of Finite Dimension. Oliver and Boyd. London. 1966

Construída por Carolina da Silva Gonçalves e Ulysses Sodré.