Polinomio mínimo de un endomorfismo

Para el polinomio mínimo de un elemento algebraico de un cuerpo, véase Polinomio mínimo (teoría de cuerpos).

En álgebra lineal, el polinomio mínimo μ f {\displaystyle \mu _{f}} de un endomorfismo f {\displaystyle f} de un espacio vectorial E {\displaystyle E} sobre un cuerpo F {\displaystyle \mathbb {F} } (o m A {\displaystyle m_{A}} de una matriz A {\displaystyle A} de dimensión n × n {\displaystyle n\times n} interpretando A {\displaystyle A} como la matriz en cierta base de E {\displaystyle E} , pues se verá que el polinomio es independiente de la elección de esta base) es el polinomio mónico p {\displaystyle p} sobre F {\displaystyle \mathbb {F} } de menor grado tal que p ( f ) = 0 {\displaystyle p(f)=0} (o p ( A ) = 0 {\displaystyle p(A)=0} ). Cualquier otro polinomio q {\displaystyle q} con q ( f ) = 0 {\displaystyle q(f)=0} (o q ( A ) = 0 {\displaystyle q(A)=0} ) es un (polinomio) múltiplo de μ f {\displaystyle \mu _{f}} . La demostración de que esto es cierto está en el apartado dedicado a la definición formal.

Características

Las siguientes tres declaraciones son equivalentes:

  1. λ {\displaystyle \lambda } es una raíz de μ f {\displaystyle \mu _{f}} ,
  2. λ {\displaystyle \lambda } es una raíz del polinomio característico χ f {\displaystyle \chi _{f}} de f {\displaystyle f} ,
  3. λ {\displaystyle \lambda } es un valor propio de f {\displaystyle f} .

La multiplicidad de una raíz λ {\displaystyle \lambda } de μ f {\displaystyle \mu _{f}} es la potencia más grande m {\displaystyle m} de manera que ker ( ( f λ I ) m ) {\displaystyle \ker((f-\lambda I)^{m})} estrictamente contiene ker ( ( f λ I ) m 1 ) {\displaystyle \ker((f-\lambda I)^{m-1})} . En otras palabras, aumentar el exponente hasta m {\displaystyle m} dará núcleos cada vez más grandes, pero aumentar aún más el exponente más allá de m {\displaystyle m} solo dará el mismo núcleo.

Si el cuerpo F {\displaystyle \mathbb {F} } no es algebraicamente cerrado, entonces los polinomios mínimos y característicos no necesitan factorizarse solo de acuerdo con sus raíces (en F {\displaystyle \mathbb {F} } ), en otras palabras, pueden tener como factores polinomios irreducibles de grado mayor que 1 {\displaystyle 1} . Para polinomios irreducibles P {\displaystyle P} se tienen equivalencias similares:

  1. P {\displaystyle P} divide μ f {\displaystyle \mu _{f}}
  2. P {\displaystyle P} divide χ f {\displaystyle \chi _{f}}
  3. El núcleo de P ( f ) {\displaystyle P(f)} tiene dimensión al menos 1 {\displaystyle 1}
  4. El núcleo de P ( f ) {\displaystyle P(f)} tiene dimensión al menos gr ( P ) {\displaystyle \operatorname {gr} (P)}

Al igual que el polinomio característico, el polinomio mínimo no depende del cuerpo base, es decir, considerar la matriz como una con coeficientes en un cuerpo mayor no cambia el polinomio mínimo. La razón es algo diferente a la del polinomio característico (donde es inmediato de la definición de determinantes), es decir, el hecho de que el polinomio mínimo está determinado por las relaciones de dependencia e independencia lineal entre las potencias de f {\displaystyle f} : extender el cuerpo base no introducirá ninguna nueva relación de este tipo (ni, por supuesto, eliminará las existentes).

El polinomio mínimo suele ser el mismo que el polinomio característico, pero no siempre. Por ejemplo, si f {\displaystyle f} es un a I {\displaystyle aI} múltiple del endomorfismo identidad, entonces su polinomio mínimo es x a {\displaystyle x-a} ya que el núcleo de a I f = 0 {\displaystyle aI-f=0} ya es el espacio completo; por otro lado su polinomio característico es ( x a ) n {\displaystyle (x-a)^{n}} (el único valor propio es a {\displaystyle a} , y el grado del polinomio característico es siempre igual a la dimensión del espacio). El polinomio mínimo siempre divide el polinomio característico, que es una forma de formular el teorema de Cayley-Hamilton (para el caso de matrices sobre un cuerpo).

Definición formal

Dado un endomorfismo f {\displaystyle f} en un espacio vectorial E {\displaystyle E} de dimensión finita sobre un cuerpo F {\displaystyle \mathbb {F} } , sea I f {\displaystyle I_{f}} el conjunto definido como

I f = { p F [ t ] p ( f ) = 0 } {\displaystyle {\mathit {I}}_{f}=\{p\in \mathbb {F} [t]\mid p(f)=0\}}

donde F [ t ] {\displaystyle \mathbb {F} [t]} es el espacio de todos los polinomios sobre el cuerpo F {\displaystyle \mathbb {F} } . Si p I f {\displaystyle p\in I_{f}} , diremos que p {\displaystyle p} es anulador de f {\displaystyle f} . I f {\displaystyle I_{f}} es un ideal propio de F [ t ] {\displaystyle \mathbb {F} [t]} . Dado que F {\displaystyle \mathbb {F} } es un cuerpo, F [ t ] {\displaystyle \mathbb {F} [t]} es un dominio de ideales principales, por lo que cualquier ideal es generado por un solo polinomio, que es único salvo las unidades en F {\displaystyle \mathbb {F} } . Se puede hacer una elección particular entre los generadores, ya que precisamente uno de los generadores es mónico. El polinomio mínimo se define así como el polinomio mónico que genera I f {\displaystyle I_{f}} . Es el polinomio mónico de menor grado en I f {\displaystyle I_{f}} .

Sin utilizar términos de teoría de anillos, podemos demostrar que el polinomio mínimo está bien definido (es el único polinomio mónico anulador de f {\displaystyle f} de grado mínimo y el resto de polinomio anuladores son múltiplos suyos) de la manera siguiente. La demostración es esencialmente la misma que la anterior:

Todos los polinomios anuladores de  f  son múltiplos de un único polinomio mónico anulador de  f , {\displaystyle {\text{Todos los polinomios anuladores de }}f{\text{ son múltiplos de un único polinomio mónico anulador de }}f,}

 al que llamaremos polinomio mínimo de  f . {\displaystyle {\text{ al que llamaremos polinomio mínimo de }}f.}

Observamos en primer lugar que seguro que existen polinomios anuladores. Como f {\displaystyle f} es un endomorfismo de un espacio vectorial E {\displaystyle E} de dimensión finita n {\displaystyle n} , podemos considerar una base B {\displaystyle {\mathcal {B}}} del espacio y la matriz A M n ( F ) {\displaystyle A\in {\mathcal {M}}_{n}(\mathbb {F} )} , la matriz de f {\displaystyle f} en base B {\displaystyle {\mathcal {B}}} .

Como dim ( M n ( F ) ) = n 2 {\displaystyle {\text{dim}}({\mathcal {M}}_{n}(\mathbb {F} ))=n^{2}} , el conjunto de matrices { A i } i = 0 n 2 {\displaystyle \{A^{i}\}_{i=0}^{n^{2}}} , de cardinal n 2 + 1 {\displaystyle n^{2}+1} , es necesariamente linealmente dependiente, es decir,

{ a i } i = 0 n 2 F {\displaystyle \exists \{a_{i}\}_{i=0}^{n^{2}}\subseteq \mathbb {F} } tales que a 0 I + a 1 A + . . . + a n 2 A n 2 = 0 p ( t ) = a 0 + a 1 t + . . . + a n 2 t n 2 F [ t ] {\displaystyle a_{0}I+a_{1}A+...+a_{n^{2}}A^{n^{2}}=0\Rightarrow \exists p(t)=a_{0}+a_{1}t+...+a_{n^{2}}t^{n^{2}}\in \mathbb {F} [t]} anulador de A {\displaystyle A\Rightarrow }

p ( t ) = a 0 + a 1 t + . . . + a n 2 t n 2 {\displaystyle \Rightarrow \exists p(t)=a_{0}+a_{1}t+...+a_{n^{2}}t^{n^{2}}} anulador de f {\displaystyle f} .

Esto último por ser A {\displaystyle A} la matriz de f {\displaystyle f} en base B {\displaystyle {\mathcal {B}}} .

Por tanto, existen polinomios anuladores y podemos tomar, pues, uno que sea de grado mínimo. Si lo dividimos por el coeficiente del término de grado máximo, sigue siendo anulador y ahora también es mónico. Este polinomio, al que denotaremos por m ( t ) F [ t ] {\displaystyle m(t)\in \mathbb {F} [t]} , es nuestro candidato a polinomio mínimo.

Sea pues p ( t ) F [ t ] {\displaystyle p(t)\in \mathbb {F} [t]} un polinomio anulador de f {\displaystyle f} . Queremos ver que m {\displaystyle m} divide a p {\displaystyle p} . Hacemos la división entera de p {\displaystyle p} entre m {\displaystyle m} :

p ( t ) = m ( t ) c ( t ) + r ( t ) {\displaystyle p(t)=m(t)\cdot c(t)+r(t)} , con c , r F [ t ] , r = 0 {\displaystyle c,r\in \mathbb {F} [t],r=0} o gr   r < gr   m ( ) {\displaystyle {\text{gr}}~r<{\text{gr}}~m\quad (*)}

Si aplicamos la igualdad a f {\displaystyle f} , obtenemos que

p ( f ) = m ( f ) c ( f ) + r ( f ) {\displaystyle p(f)=m(f)\circ c(f)+r(f)} ,

pero como p {\displaystyle p} y m {\displaystyle m} son anuladores de f {\displaystyle f} por definición,

0 = 0 c ( f ) + r ( f ) r ( f ) = 0 r {\displaystyle 0=0\circ c(f)+r(f)\Rightarrow r(f)=0\Rightarrow r} es anulador de f {\displaystyle f} .

Pero, por definición, m {\displaystyle m} es el polinomio anulador de grado mínimo, luego gr   r gr   m {\displaystyle {\text{gr}}~r\geq {\text{gr}}~m} , de forma que, por ( ) {\displaystyle (*)} , necesariamente r = 0 m {\displaystyle r=0\Rightarrow m} divide a p {\displaystyle p} .

Para ver la unicidad, supongamos que hubiera dos polinomios m {\displaystyle m} y m {\displaystyle m'} mónicos de grado mínimo tales que fueran anuladores de f . {\displaystyle f.} Por lo anterior, uno tiene que dividir al otro. Podemos suponer que m {\displaystyle m} divide a m {\displaystyle m'} . Pero como son mónicos y tienen el mismo grado, necesariamente m = m {\displaystyle m=m'} . {\displaystyle \quad \square }

Aplicaciones

Un endomorfismo φ {\displaystyle \varphi } de un espacio vectorial de dimensión finita sobre un cuerpo F {\displaystyle \mathbb {F} } posee una matriz diagonalizable si y solo si su polinomio mínimo se factoriza completamente sobre F {\displaystyle \mathbb {F} } en factores lineales distintos. El hecho de que solo haya un factor x λ {\displaystyle x-\lambda } para cada valor propio λ {\displaystyle \lambda } significa que el autoespacio generalizado para λ {\displaystyle \lambda } es el mismo que el espacio propio para λ {\displaystyle \lambda } : cada bloque de Jordan tiene un tamaño 1. De manera más general, si φ {\displaystyle \varphi } satisface una ecuación polinómica P ( φ ) = 0 {\displaystyle P(\varphi )=0} donde P {\displaystyle P} se factoriza en distintos factores lineales sobre F {\displaystyle \mathbb {F} } , entonces será diagonalizable: su polinomio mínimo es un divisor de P {\displaystyle P} y, por lo tanto, también se factoriza en distintos factores lineales. En particular, se tiene que:

  • P = x k 1 {\displaystyle P=x^{k}-1} : los endomorfismos de orden finito de espacios vectoriales complejos son diagonalizables. Para el caso especial k = 2 {\displaystyle k=2} de involuciones, esto es incluso cierto para endomorfismos de espacios vectoriales sobre cualquier cuerpo de característica que no sea 2, ya que x 2 1 = ( x 1 ) ( x + 1 ) {\displaystyle x^{2}-1=(x-1)(x+1)} es una factorización con factores distintos sobre dicho cuerpo. Esto es parte de la teoría de representación de grupos cíclicos.
  • P = X 2 X = X ( X 1 ) {\displaystyle P=X^{2}-X=X(X-1)} : los endomorfismos que satisfacen φ 2 = φ {\displaystyle \varphi ^{2}=\varphi } se denominan proyecciones y siempre son diagonalizables (además, sus únicos valores propios son 0 y 1).
  • Por el contrario, si μ φ = x k {\displaystyle \mu _{\varphi }=x^{k}} con k 2 {\displaystyle k\geq 2} , φ {\displaystyle \varphi } (un endomorfismo nilpotente) no es necesariamente diagonalizable, ya que x k {\displaystyle x^{k}} tiene una raíz repetida 0.

Estos casos también se pueden probar directamente, pero el polinomio mínimo proporciona una perspectiva y una prueba unificadas.

Los polinomios mínimos de 2 cos ( 2 π / n ) {\displaystyle 2\cos(2\pi /n)} tienen conexiones con los polinomios ciclotómicos.[1]

Computación

Para un vector v en V, se define:

I T , v = { p F [ t ] | p ( T ) ( v ) = 0 } . {\displaystyle {\mathit {I}}_{T,v}=\{p\in \mathbf {F} [t]\;|\;p(T)(v)=0\}.}

Esta definición satisface las propiedades de un ideal propio, siendo μT,v el polinomio mónico que lo genera.

Propiedades

  • Dado que IT,v contiene el polinomio mínimo μT, este último es divisible por μT,v.
  • Si d es el número natural negativo tal que v, T(v), ..., Td(v) son linealmente dependiente, entonces existe a0, a1, ..., ad−1 único en F, no todo cero, de modo que
    a 0 v + a 1 T ( v ) + + a d 1 T d 1 ( v ) + T d ( v ) = 0 {\displaystyle a_{0}v+a_{1}T(v)+\cdots +a_{d-1}T^{d-1}(v)+T^{d}(v)=0}
    y para estos coeficientes se tiene
    μ T , v ( t ) = a 0 + a 1 t + + a d 1 t d 1 + t d . {\displaystyle \mu _{T,v}(t)=a_{0}+a_{1}t+\ldots +a_{d-1}t^{d-1}+t^{d}.}
  • Sea el subespacio W la imagen de μT,v(T), que es estable para T. Dado que μT,v(T) anula al menos los vectores v, T(v), ..., Td-1(v), la codimensión de W es al menos d.
  • El polinomio mínimo μT es el producto de μT,v y el polinomio mínimo Q de la restricción de T a W. En el (probable) caso de que W tenga la dimensión 0, se tiene que Q = 1 y, por lo tanto, μT = μT,v; de lo contrario, un cálculo recursivo de Q es suficiente para encontrar μT.

Ejemplo

Sea T el endomorfismo de R3 con matriz, sobre una base canónica,

( 1 1 1 1 2 1 0 1 3 ) . {\displaystyle {\begin{pmatrix}1&-1&-1\\1&-2&1\\0&1&-3\end{pmatrix}}.}

Tomando el primer vector de base canónica e1 y sus imágenes repetidas por T se obtiene

e 1 = [ 1 0 0 ] , T e 1 = [ 1 1 0 ] . T 2 e 1 = [ 0 1 1 ]  and T 3 e 1 = [ 0 3 4 ] {\displaystyle e_{1}={\begin{bmatrix}1\\0\\0\end{bmatrix}},\quad T\cdot e_{1}={\begin{bmatrix}1\\1\\0\end{bmatrix}}.\quad T^{2}\cdot e_{1}={\begin{bmatrix}0\\-1\\1\end{bmatrix}}{\mbox{ and}}\quad T^{3}\cdot e_{1}={\begin{bmatrix}0\\3\\-4\end{bmatrix}}}

de los cuales los tres primeros se ven fácilmente como linealmente independientes y, por lo tanto, abarcan todo R3. El último entonces es necesariamente una combinación lineal de los tres primeros, de hecho

T 3e1 = −4T 2e1Te1 + e1,

así que:

μT,e1 = X 3 + 4X 2 + XI.

De hecho, este es también el polinomio mínimo μT y el polinomio característico χT: efectivamente μT,e1 divide a μT que divide a χT, y como el primero y el último son de grado 3 y todos son monicos, todos deben ser iguales. Otra razón es que en general si algún polinomio en T anula un vector v, entonces también anula Tv (basta con aplicar T a la ecuación que dice que anula v), y por tanto por iteración anula todo el espacio generado por las imágenes iteradas por T de v; en el caso actual, se ve que para v = e1 ese espacio es todo R3, entonces μT,e1(T) = 0. De hecho, se verifica para la matriz completa que T 3 + 4T 2 + TI3 es la matriz nula:

[ 0 1 3 3 13 23 4 19 36 ] + 4 [ 0 0 1 1 4 6 1 5 10 ] + [ 1 1 1 1 2 1 0 1 3 ] + [ 1 0 0 0 1 0 0 0 1 ] = [ 0 0 0 0 0 0 0 0 0 ] {\displaystyle {\begin{bmatrix}0&1&-3\\3&-13&23\\-4&19&-36\end{bmatrix}}+4{\begin{bmatrix}0&0&1\\-1&4&-6\\1&-5&10\end{bmatrix}}+{\begin{bmatrix}1&-1&-1\\1&-2&1\\0&1&-3\end{bmatrix}}+{\begin{bmatrix}-1&0&0\\0&-1&0\\0&0&-1\end{bmatrix}}={\begin{bmatrix}0&0&0\\0&0&0\\0&0&0\end{bmatrix}}}

Referencias

  1. D. H. Lehmer (1933). «A note on trigonometric algebraic numbers». American Mathematical Monthly 40 (3): 165-166. JSTOR 2301023. doi:10.2307/2301023. 

Bibliografía

  • Lang, Serge (2002). Algebra, Graduate Texts in Mathematics (3ª revisada edición). Nueva York: Springer-Verlag. ISBN 978-0-387-95385-4. MR 1878556. 
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q1163608
  • Wd Datos: Q1163608