Álgebra Lineal II: Formas sesquilineales

Por Diego Ligani Rodríguez Trejo

Introducción

Como mencionamos anteriormente, las formas bilineales que hemos estudiado son restringidas en el sentido de que sólo pueden ser definidas en espacios vectoriales sobre los reales. En este curso estudiaremos una noción muy relacionada, que en algunos sentidos extiende lo que hemos visto a espacios vectoriales sobre los complejos.

Probablemente en estas entradas tengas una sensación de ya haber visto todo. Como un déjà vu. Es bastante normal. Los resultados son casi análogos a los del caso real. Sin embargo, hay algunas diferencias importantes en las que haremos énfasis.

Formas sesquilineales

La palabra «bilineal» tiene que ver con que ambas entradas de una forma bilineal son lineales. ¿A qué se refiere «sesquilineal»? La raíz latina sesqui que significa uno y medio, y precisamente veremos esto reflejado en la definición.

Definición. Sea $V$ un espacio vectorial sobre $\mathbb{C}$. Una forma sesquilineal en $V$ es una función $\varphi: V \times V \rightarrow \mathbb{C} $ tal que:

  • Para cualesquiera $x_1,x_2,y \in V$ y para cualquier $\lambda \in \mathbb{C}$, se tiene que $$\varphi (\lambda x_1+x_2, y) = \overline{\lambda} \varphi (x_1,y)+ \varphi(x_2 , y).$$
  • Para cualesquiera $y_1,y_2,x \in V$ y para cualquier $\lambda \in \mathbb{C}$, se tiene que $$\varphi (x,\lambda y_1+y_2) = \lambda\varphi (x,y_1)+ \varphi(x, y_2).$$

De esta manera, la «media» linealidad se refiere a que en la primera entrada de $\varphi$ las sumas sí se abren, pero los escalares «salen conjugados». Debido a esto, no es tan común que una forma sesquilineal sea simétrica. Sin embargo, tenemos una noción similar que resultará fundamental.

Definición. Una forma sesquilineal $\varphi$ se llamará hermitiana si $\overline{ \varphi(y,x) }= \varphi(x,y)$ para cualesquiera $x, y \in V$.

Como comentario, en algunos contextos las formas sesquilineales son lineales en la primer coordenada y semi-lineales en la segunda. Asegúrate de verificar la definición cada que cambies de contexto. A las formas sesquilineales hermitianas también se les conoce como conjugadas simétricas.

Propiedades de formas sesquilineales

Las formas sesquilineales son parecidas a las formas bilineales en el sentido de que basta saber cómo son en parejas de elementos de una base para conocerlas por completo. De hecho, como en el caso de formas bilineales tenemos un resultado un poco más general. Sin embargo, ten cuidado. Observa que todo el tiempo debemos cuidar que los escalares de la primera entrada salen conjugados.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{C}$. Sean $m,n$ enteros positivos, $a_1, \cdots a_n, b_1, \cdots b_m$ vectores en $V$, $\lambda_1, \cdots \lambda_n, \mu_1, \cdots \mu_m$ números complejos y $\varphi$ una forma sesquilineal. Se cumple que:
\begin{align*}
\varphi\left(\sum_{i=1}^n \lambda_ia_i , \sum_{j=1}^m\mu_jb_j\right)=\sum_{i=1}^n\sum_{j=1}^m\overline{\lambda_i}\mu_j\varphi(a_i,b_j)
\end{align*}

La demostración queda como ejercicio. Usando esta proposición se puede demostrar un resultado en términos de bases.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{C}$ de dimensión $n$ y $e_1,\ldots,e_n$ una base de $V$. Sean $a_{ij}$ números complejos para $i,j=1,\ldots,n$. Existe una y sólo una forma sesquilineal $\varphi:V\times V\to \mathbb{C}$ tal que $\varphi(e_i,e_j)=a_{ij}$.

Los espacios de formas sesquilineales y hermitianas

Dado un espacio vectorial complejo $V$, podemos definir los siguientes dos conjuntos, de todas las formas sesquilineales y todas las formas hermitianas, respectivamente:

\begin{align*} S(V) &:= \{ \varphi: V \times V \rightarrow \mathbb{C} \; | \; \varphi \text{ es sesquilineal} \}\\
H(V) &:= \{ \varphi \in S(V) \; | \; \varphi \text{ es hermitiana}\}
\end{align*}
Los conjuntos son no vacíos, pues la función constante $0$ es forma sesquilineal y hermitiana.

De manera análoga a lo que sucedía con las formas bilineales, el conjunto $S(V)$ es un subespacio vectorial del espacio complejo de todas las funciones de $V \times V $ en $\mathbb{C}$. Esto puedes verificarlo por tu cuenta. Sin embargo, $H(V)$ no es un subespacio vectorial de dicho subespacio. De hecho, ni siquiera es un espacio vectorial sobre $\mathbb{C}$. En los problemas puedes encontrar un contraejemplo de que sea cerrado bajo multiplicación escalar.

Sin embargo, no todo está perdido. Podemos pensar a $S(V)$ como un espacio vectorial sobre los reales. Simplemente limitamos los productos escalares a números reales. En este contexto, resulta que $H(V)$ sí es un subespacio de $S(V)$ (y por lo tanto un espacio vectorial sobre $\mathbb{R}$). Veamos esto.

Proposición. El conjunto $H(V)$ es un subespacio vectorial de $S(V)$, pensando a este último como espacio vectorial sobre $\mathbb{R}$.

Demostración. Sabemos que $H(V) \subseteq S(V)$ y que ambos son distintos del vacío, así que basta probar que $H(V)$ es cerrado bajo la suma y multiplicación por escalares reales.

Sean $\varphi_1, \varphi_2 \in H(V)$, $x,y \in V$ y $\lambda \in \mathbb{R}$. Sabemos por cómo está definida la suma que

\begin{align*} (\varphi_1 + \varphi_2) (x,y)= \varphi_1(x,y) + \varphi_2 (x,y) \end{align*}

Además, como $\varphi_1, \varphi_2 \in H(V)$, tenemos que

\begin{align*} \varphi_1(x,y) &= \overline{\varphi_1(y,x)}\\\varphi_2(x,y) &= \overline{\varphi_2(y,x)} \end{align*}

por lo que

\begin{align*} (\varphi_1 + \varphi_2) (x,y) &= \overline{\varphi_1(y,x)} + \overline{\varphi_2(y,x)}\\&= \overline{ (\varphi_1+\varphi_2) (y,x) }
\end{align*}

De aquí se concluye que $\varphi_1 + \varphi_2 \in H(V)$.

Para la multiplicación tenemos la siguiente cadena de igualdades, en donde estamos usando $\overline(\lambda)=\lambda$ (¿por qué?):

\begin{align*}
(\lambda \varphi_1) (x,y) &= \lambda (\varphi_1(x,y))\\
&=\lambda (\overline{ \varphi_1(y,x)})\\
&= \overline{\lambda\varphi_1(y,x)}
\end{align*}

Se concluye que $\lambda \varphi_1 \in H(V)$.

Con las dos propiedades mostradas basta para afirmar que $H(V)$ es un subespacio vectorial de $S(V)$ como espacio vectorial sobre $\mathbb{R}$.

$\square$

El espacio $H(V)$ no es únicamente un subespacio de $S(V)$. De hecho es un subespacio importante, pues nos permite escribir a $S(V)$ fácilmente como suma directa de dos subespacios.

Proposición. Sea $V$ un espacio vectorial sobre $\mathbb{C}$. Tomemos a $S(V)$ como espacio vectorial sobre $\mathbb{R}$. Tenemos la siguiente descomposición: $$S(V)=H(V)\oplus iH(V).$$

Un recordatorio de la suma directa lo puedes encontrar aquí.

Demostración. Empecemos probando que $S(V)$ efectivamente se puede descomponer como la suma de $H(V)$ e $iH(V)$.
Para esto, basta demostrar que cualquier forma sesquilineal se puede expresar como suma de una forma hermitiana e $i$ veces otra forma hermitiana. Para ello, dada $\varphi \in S(V)$ definimos $h_1, h_2$ como sigue:

\begin{align*} h_1(x,y)&=\frac{\varphi(x,y)+ \overline{\varphi(y,x)}}{2}\\h_2(x,y)&=\frac{\varphi(x,y)- \overline{\varphi(y,x)}}{2i}\end{align*}

Claramente $\varphi=h_1+ih_2$, así que basta mostrar que $h_1$ y $h_2$ son hermitianas. Lo haremos para $h_2$ y $h_1$ quedará como ejercicio.

Tomemos cualesquiera $x,y$ en $V$. Calculemos $\overline{h_2(y,x)}$:

\begin{align*}
\overline{h_2(y,x)}=\overline{\left(\frac{\varphi(y,x)- \overline{\varphi(x,y)}}{2i}\right)} \end{align*}

Nota que se cumple la siguiente identidad:
\begin{align*} \frac{\varphi(y,x)- \overline{\varphi(x,y)}}{2i}=\frac{-\varphi(y,x)i+ \overline{\varphi(x,y)}i}{2} \end{align*}

Así,

\begin{align*} \overline{h_2(y,x)}=\overline{\left(\frac{-\varphi(y,x)i + \overline{\varphi(x,y)}i}{2}\right)}\end{align*}

Además, para cualquier $c \in \mathbb{C}$ tenemos que $\overline{ci}=-\overline{c}i$, por lo que

\begin{align*} \overline{h_2(y,x)}= \frac{\overline{\varphi (y,x)}i -\varphi (x,y)i}{2}\end{align*}

Finalmente multiplicando por $\frac{i}{i}:$

\begin{align*} \overline{h_2(y,x)}&= \frac{-\overline{\varphi (y,x)} + \varphi (x,y)}{2i}\\&=\frac{ \varphi (x,y)- \overline{ \varphi (y,x)}}{2i}\\&=h_2(x,y) \end{align*}

Concluimos que $h_2 \in H(V)$. Hasta ahora, hemos mostrado que $$S(V)=H(V)+iH(V).$$ Demostrar que $H(V)$ y $iH(V)$ están en posición de suma directa es más sencillo.

Sea $h \in H(V) \cap iH(V)$. En particular $h \in iH(V)$ por lo que existe $h_1 \in H(V)$ tal que $h=ih_1$ así, para cualesquiera $x,y \in \mathbb{C}$

\begin{align*} h(x,y)&=\overline{h(y,x)}\\&=\overline{ih_1(y,x)}\\&=-i\overline{h_1(y,x)}\\&=-ih_1(x,y)\\&=-h(x,y).\end{align*}

De esta cadena concluimos que $h(x,y)=-h(x,y)$ y sabemos que el único complejo que cumple esto es el $0$. Por lo tanto $h(x,y)=0$, así que $h=0$ y entonces $H(V) \cap iH(V)= \{ 0 \}$. Esto es suficiente para saber qué $H(V)$ y $iH(V)$ están en posición de suma directa. Concluimos que
\begin{align*} S(V)= H(V) \oplus iH(V).\end{align*}

$\square$

Más adelante…

En esta entrada definimos a las formas sesquilineales como un análogo en $\mathbb{C}$ a las formas bilineales. Como es de esperarse, también definiremos un análogo a las formas cuadráticas. Las «nuevas» formas cuadráticas que definiremos también tendrán su teorema de Gauss.

Un poco después de eso podremos hablar de las formas matriciales para formas bilineales y para formas sesquilineales.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso. Sin embargo, sirven de ayuda para repasar los conceptos vistos en esta entrada.

  1. Muestra que $H(V)$ en general no es un espacio vectorial sobre $\mathbb{C}$. Para ello, muestra que si $V$ es $\mathbb{C}^2$ y $\varphi((x_1,x_2),(y_1,y_2))=\overline{x_1}x_1+\overline{x_2}y_2$, entonces $\varphi$ es hermitiana, pero $i\varphi$ no lo es.
  2. Demuestra la proposición sobre aplicar una forma sesquilineal en combinaciones lineales.
  3. Demuestra la proposición sobre formas sesquilineales y bases. En ese contexto, ¿cómo deben ser los $a_{ij}$ para que la forma sea hermitiana?
  4. Sea $\varphi$ una forma hermitiana en un espacio vectorial complejo $V$. Demuestra que:
    • Para todo $x\in V$ la expresión $\varphi(x,x)$ es un número real.
    • Para todo $x\in V$ y $a\in \mathbb{C}$ se tiene que $\varphi(ax,ax) = |a|^2\varphi(x,x)$.
  5. En el contexto de la proposición de descomposición de $S(V)$ como suma directa de $H(V)$ y $iH(V)$, demuestra que $h_1$ es hermitiana.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»

Geometría Analítica I: Parábolas

Por Héctor Morales

Introducción

La última de las secciones cónicas que abordaremos en esta unidad es la parábola. De las tres cónicas que hemos revisado, probablemente es la que conoces mejor de forma intuitiva: ya sea que hayas escuchado sobre «las antenas parabólicas», «los espejos parabólicos» o «el tiro parabólico», estamos tan familiarizados con las propiedades de las parábolas que en esta unidad, más allá de introducir la figura como algo nuevo, nos encargaremos de formalizar sus propiedades .

¿Qué hace que la imagen mental que tenemos de las parábolas corresponda tan bien a la figura que podemos obtener a partir de una definición formal? Podrás recordar de tus clases de mecánica de la preparatoria que la Tierra ejerce una fuerza sobre cada uno de los objetos sobre su superficie que les da una aceleración constante, usualmente denotada por la letra $g$. Entonces, la trayectoria de un objeto, asumiendo condiciones ideales, que se mueve con velocidad constante en el eje horizontal y con movimiento acelerado en el eje vertical está descrita por:

\begin{equation}
\begin{aligned}
&x(t)=v_{0} t \cos (\theta) \
&y(t)=v_{0} t \sin (\theta)-\frac{1}{2} g t^{2}
\end{aligned}
\end{equation}

No es necesario que en este momento entiendas totalmente de dónde vienen estas dos ecuaciones; por el momento quédate con la idea de que es un buen modelo matemático de un proyectil en la Tierra que se mueve sobre un plano; es decir, estas dos ecuaciones describen bastante bien el movimiento de una bala de cañón al ser disparada, una pelota de fútbol después de ser pateada, etc. Resulta que estas dos ecuaciones son la parametrización de una parábola, de modo que una parábola es una descripción bastante buena de la trayectoria de un objeto cuando «lo lanzamos». Entonces, aunque estemos por abordar por primera vez el estudio formal de la parábola, verás que tanto sus elementos, como sus propiedades te resultarán bastante familiares.

240
La trayectoria de un objeto que tiene un movimiento rectilineo y uniforme en $x$ y un movimiento acelerado en $y$ describe una parábola.

Sin más preámbulo, pasaremos a la definición de una parábola: además de la definición como conjunto de puntos, obtendremos una ecuación canónica al igual que como lo hicimos para la elipse y la hipérbola y nos familiarizaremos con sus elementos más importantes. Dejaremos la descripción detallada de todos sus elementos y la exposición de sus propiedades para la siguiente entrada.

Definición de Parábola

Una parábola es el lugar geométrico de los puntos que equidistan de un punto $\mathbf{p}$ (llamado su foco) y una recta $\ell$, llamada su directriz, donde $\mathbf{p} \notin \ell$. Es decir, está definida por la ecuación

\begin{equation}
\mathrm{d}(\boldsymbol{x}, \boldsymbol{p})=\mathrm{d}(\boldsymbol{x}, \ell).
\end{equation}

En el siguiente recuadro interactivo de GeoGebra juega un poco con esta definición. Observa cómo una parábola, a primera vista, podría parecerte una elipse «cortada», pero date cuenta que es una curva que se dibuja a partir de una condición muy específica que se impone a una distancia entre la recta directriz y el foco ¿Puedes encontrar los casos degenerados de la parábola?¿Qué pasa si haces $p=0$?

Tomando un ejemplo sencillo con el foco en el eje $\mathbf{y}$, la directriz paralela al eje $\mathbf{x}$, y que además pase por el origen. Tenemos entonces $\mathbf{p}=(0, \mathrm{c})$, donde $\mathrm{c}>0$ digamos, y $\ell: \mathrm{y}=-\mathrm{c}$; de tal manera que la parábola queda determinada por la ecuación

\begin{equation}
\sqrt{x^{2}+(y-c)^{2}}=|y+c|.
\end{equation}

Como te puedes dar cuenta, lo único que hicimos fue aplicar la definición de norma en $\mathbb{R}^{2}$ tal como la estudiamos en la primera unidad. Como ambos lados de la ecuación son positivos, ésta es equivalente a la igualdad de sus cuadrados que da

\begin{equation}
\begin{aligned}
x^{2}+y^{2}-2 c y+c^{2} &=y^{2}+2 c y+c^{2} \
x^{2} &=4 c y.
\end{aligned}
\end{equation}

De tal manera que la gráfica de la función $x^{2}$ ($y=x^{2}$) es una parábola con foco $(0,\frac{1}{4})$ y directriz $y=-\frac{1}{4}$. Veremos ahora que cualquier parábola cumple la propiedad de «ser gráfica de una función» respecto de su directriz.

Sea $\mathcal{P}$ la parábola con foco p y directriz $\ell$ (donde $\mathbf{p} \notin \ell)$. Dado un punto $\mathbf{y}_{0} \in \ell$, es claro que los puntos del plano cuya distancia a $\ell$ coincide con (o se mide por) su distancia a $\mathbf{y}_{0}$ son precisamente los de la normal a $\ell$ que pasa por $\mathbf{y}_{0}$, llamémosla $v_{0} .$ Ver la figura.

Cualquier parábola cumple la propiedad de ser gráfica de una función respecto a su directriz.

Por otro lado, la mediatriz entre $\mathbf{y}_{0}$ y $\mathbf{p}$, llamémosla $\eta_{0}$, consta de los puntos cuyas distancias a $\mathbf{p}$ y $\mathbf{y}_{0}$ coinciden. Por lo tanto, la intersección de $\eta_{0}$ y $v_{0}$ está en la parábola $\mathcal{P}$, es decir $\boldsymbol{x}_{0}=v_{0} \cap \eta_{0} \in \mathcal{P}$ pues $\mathrm{d}\left(\boldsymbol{x}_{0}, \ell\right)=\mathrm{d}\left(\boldsymbol{x}_{0}, \mathbf{y}_{0}\right)=\mathrm{d}\left(\boldsymbol{x}_{0}, \boldsymbol{p}\right)$. Pero además $\mathbf{x}_{0}$ es el único punto en la normal $v_{0}$ que está en $\mathcal{P}$. Ésta es «la propiedad de la gráfica» a la que nos referíamos.

Podemos concluir aún más: que la mediatriz $\eta_{0}$ es la tangente a $\mathcal{P}$ en $\mathbf{x}_{0}$. Pues para cualquier otro punto $x \in \eta_{0}$ se tiene que su distancia a $\ell$ es menor que su distancia a $\mathbf{y}_{0}$ que es su distancia a $\mathbf{p}\left(\mathrm{d}(\mathbf{x}, \ell)<\mathrm{d}\left(\mathbf{x}, \mathbf{y}_{0}\right)=\mathrm{d}(\mathbf{x}, \mathbf{p})\right)$, y entonces $x \notin \mathcal{P}$. De hecho, la parábola $\mathcal{P}$ parte el plano en dos pedazos, los puntos más cerca de $\mathbf{p}$ que de $\ell$ (lo de adentro, digamos, definidos por la desigualdad $d(\mathbf{x}, \mathbf{p}) \leq d(\mathbf{x}, \ell)$) y los que están más cerca de $\ell$ que de $\mathbb{p}$ (lo de afuera, dado por $d(\mathbf{x}, \ell) \leq d(\mathbf{x}, \mathbf{p})$ en donde está $\eta_{0}$), que comparten la frontera donde estas distancias coinciden (la parábola $\mathcal{P}$). Así que $\eta_{0}$ pasa tangente a $\mathcal{P}$ en $\mathbf{x}_{0}$, pues $\mathbf{x}_{0} \in \eta_{0} \cap \mathcal{P}$ y además $\eta_{0}$ se queda de un lado de $\mathcal{P}$.

En el siguiente recuadro interactivo de GeoGebra familiarizate con la expresión analítica de la parábola y nota una cosa muy importante: ¿qué pasa cuando, contrario al caso «sencillo» que vimos en esta entrada, el vértice de la parábola está fuera del origen? Nota cómo una traslación de nuestro caso sencillo introduce un término lineal en la ecuación de la parábola y date cuenta qué papel juega cada uno de los coeficientes modificando la forma de la parábola.

Más adelante…

En esta entrada iniciamos nuestro estudio de las parábolas: a partir de su definición como el conjunto de puntos que equidistan de una recta y un punto construimos la curva y nos familiarizamos con su expresión analítica. Así como lo hicimos para las cónicas anteriores, le dedicaremos la siguiente sección a estudiar sus propiedades y a nombrar cada uno de sus elementos; posteriormente, haremos algunos ejercicios para tener práctica leyendo la información geométrica que contiene la ecuación de la parábola.

Tarea moral

  • Construye la curva y da el dominio y codominio de las siguientes curvas: $y^{2}=16x$, $x^{2}=-16y$, $x^{2}=10y$, $y^{2}=7x$, $3x^{2}+5y=0$, $5x^{2}-2y=0$, $y^{2}+6x=0$, $x^{2}=11y$.
  • A partir de la definición de parábola, encuentre la ecuación de la parábola de foco $(0,-5)$ y directriz $y=3$.
  • Cuáles son los puntos de intersección de la línea que tiene la ecuación $2x+3y=7$ y la parábola con ecuación $y=-2x^{2}+2x+5$

Entradas relacionadas

  • Ir a Geometría Analítica I
  • Entrada anterior del curso: Problemas con hipérbolas
  • Siguiente entrada del curso: Propiedades de parábolas

Cálculo Diferencial e Integral I: Intervalos y desigualdades en los números reales

Por Karen González Cárdenas

Introducción

Ahora veremos los intervalos de los números reales, su definición y su representación en la recta real. Para ello nos apoyaremos de varios ejemplos y ejercicios. Recordemos que al representar gráficamente a los números reales lo hacemos por medio de una recta, donde un punto será la representación de un número y la recta todo el conjunto $\r$.

De igual manera, abordaremos en esta entrada la resolución de desigualdades en los reales, donde los intervalos están íntimamente relacionados.

Intervalos en los reales

Definición: Sean $a,b \in \r$. Definimos, haciendo uso de la siguiente notación, los siguientes intervalos en $\RR$ de la siguiente manera:

  • Intervalo cerrado:
    \[
    [a,b]:=\left\{x : a \leq x \leq b\right\} \quad\text{.}
    \]
  • Intervalo abierto
    \[
    (a,b):=\left\{x : a < x < b\right\}\quad\text{.}
    \]
  • Abierto por la izquierda/ Cerrado por la derecha
    \[
    (a,b]:=\left\{x : a < x \leq b\right\}\quad\text{.}
    \]
  • Abierto por la derecha/Cerrado por la izquierda
    \[
    [a,b):=\left\{x : a \leq x < b\right\}\quad\text{.}
    \]

Casos especiales

Sea $a\in \r$. Para los intervalos que involucran al infinito tenemos las siguientes definiciones:

  • \[
    (-\infty ,a):=\left\{x : x < a \right\}\quad\text{.}
    \]
  • \[
    (-\infty ,a]:=\left\{x : x \leq a \right\}\quad\text{.}
    \]
  • \[
    (a, \infty) :=\left\{x : a < x\right\}\quad\text{.}
    \]
  • \[
    [a, \infty) :=\left\{x : a \leq x\right\}\quad\text{.}
    \]
  • \[
    (- \infty, \infty) :=\r\quad\text{.}
    \]

Cabe mencionar que los símbolos $- \infty$ y $\infty$ son solamente notación, ya que no existe ningún número «$\infty$» tal que cumpla $\infty \geq x$ para todo $x\in \r$.

Representación gráfica

A continuación veremos la representación de cada uno de los intervalos anteriores en la recta real. Esto nos ayudará más adelante con la resolución de desigualdades. En cada una de las imágenes la sección de la recta real sombreada con amarillo «\\\» representará los valores considerados por el intervalo.

\[ [a,b] \]

Consideramos los valores de $a$ y $b$.

\[ (a,b) \]

No consideramos los valores de $a$ y $b$.

\[ (a,b] \]

No consideramos el valor de $a$.

\[ [a,b) \]

No consideramos el valor de $b$.

\[ (-\infty ,a) \]

Todos los valores estrictamente menores que $a$.

\[ (-\infty ,a] \]

Todos los valores menores o iguales que $a$.

\[ (a, \infty) \]

Todos los valores estrictamente mayores que $a$.

\[ [a, \infty) \]

Todos los valores mayores o iguales que $a$.

\[ (- \infty, \infty) \]

Toda la recta real.

Ahora que ya hemos definido a los intervalos en los reales $\r$, veremos algunos ejercicios de representación gráfica de intervalos.

Algunos ejemplos de intervalos

A continuación daremos la representación gráfica de los siguientes intervalos.

  • \[ (1,14 ] \]
    Aplicando la definición correspondiente obtenemos la siguiente representación:
  • \[ (-15,-2) \cup [6,10) \]
    Graficamos primero ambos intervalos en la recta real, por lo que tenemos lo siguiente:

Ya que estamos considerando la unión de los intervalos, por su definición tenemos que el conjunto resultante sería el azul:

  • \[ (-3, 0) \cap (-2, 4] \]
    Vemos que al graficar ambos intervalos obtenemos:

Como queremos la intersección de dichos intervalos, el intervalo resultante sería en el que encontremos elementos en común, así sería:

\[ (-3, 0) \cap (-2, 4] = [-2,0] \]

Se invita a demostrar esta igualdad haciendo uso de la definición de igualdad de conjuntos.

  • \[ [-6,1) \cup (-1,7] \]
    Comenzamos graficando ambos intervalos en la recta real:

Así considerando la definición de unión obtenemos el siguiente intervalo:

\[ [-6,1) \cup (-1,7] = [-6,7]\]

Se invita a demostrar esta igualdad haciendo uso de la definición de igualdad de conjuntos.

  • \[ [-10, 0) \cap [0, 5) \]
    Graficando los intervalos anteriores tenemos:

Debido a que queremos la intersección de ambos intervalos, observamos que por su definición no poseen ningún elemento en común, así su intersección sería vacía: $[-10, 0) \cap [0, 5) = \emptyset$

  • \[ (-\infty,-2) \cup(-3,0) \cup [-1, \infty) \]
    Si graficamos los tres intervalos anteriores vemos que tendríamos lo siguiente:

Así al aplicar la definición de unión nos percatamos que se trata de toda la recta $\r$:

Una vez que hemos visto estos ejemplos procederemos a los ejercicios que involucran desigualdades. Cabe mencionar que todos los resultados probados anteriormente relacionados al Orden en $\r$ los estaremos utilizando sin repetir dichas demostraciones.

Desigualdades en los reales

Encuentra todos los números reales $x$ que cumplan con las siguientes desigualdades:

  • $$4- x < 3 -2x \quad\text{.}$$

Comenzamos con restar $4$ en ambos lados de la desigualdad:
\begin{align*}
&\Rightarrow 4- x-4 < 3 -2x-4\\
&\Rightarrow -x+ (4 -4) < -2x+(3-4)\\
&\Rightarrow -x<-2x-1\\
&\Rightarrow-x+ 2x < (-2x +2x)-1\\
&\Rightarrow x<-1\quad\text{.}
\end{align*}

Así observamos que todas las $x$ que cumplen la desigualdad son aquellas que $x<-1$, es decir, las que pertenecen al intervalo:
$$(-\infty,-1)\quad\text{.}$$

  • $$(x-1)(x-3)>0\quad\text{.}$$

Como estamos buscando que el producto sea positivo, debemos considerar los siguientes dos casos:
CASO 1: $(x-1)>0$ y $(x-3)>0\text{.}$
Por lo anterior queremos encontrar a todos los reales que satisfacen que $x>1$ y $x>3$.
Al graficar dichos intervalos observamos lo siguiente:

Ya que estamos considerando la intersección, el intervalo buscado sería:
$$(3, \infty)\quad\text{.}$$

CASO 2: $(x-1)<0$ y $(x-3)<0$.

Ahora queremos a todos los números que cumplan con que $x<1$ y $x<3$, así tenemos:

Por lo que el intervalo buscado es:
$$(-\infty,1)\quad\text{.}$$

Considerando la unión de los intervalos obtenidos en los CASOS 1 y 2 tenemos que el conjunto solución es:
$$(-\infty,1) \cup (3, \infty)\quad\text{.}$$

  • $$\frac{1}{x} + \frac{1}{1-x} > 0\quad\text{.}$$

Comenzaremos realizando la suma de fracciones:
\begin{align*}
\frac{1}{x} + \frac{1}{1-x} > 0 &\Rightarrow \frac{1-x+x}{x(1-x)}>0\\
&\Rightarrow \frac{1}{x (1-x)}>0\\
\end{align*}
Como ya tenemos que el numerador es mayor que cero: $1>0$, la igualdad se satisface si y sólo si $x (x-1) > 0$. Por lo que debemos considerar los siguientes casos:

CASO 1: $x>0$ y $1-x >0$.
Por lo que tendríamos las siguientes condiciones: $x>0$ y $1>x$.

De lo anterior vemos que los valores que cumplen ambas condiciones son aquellos que pertenecen al intervalo:
$$(0,1)\quad\text{.}$$

CASO 2: $x<0$ y $1-x < 0$.
De lo anterior tenemos que: $x < 0$ y $1<x$.

Observamos que no existen valores que cumplan ambas condiciones.
De los casos vistos tenemos que los valores que cumple la desigualdad son todos aquellos que pertenecen al intervalo: $$(0,1)\quad\text{.}$$

Más adelante

En la próxima entrada veremos la función valor absoluto. Daremos su definición formal y su interpretación geométrica. De igual manera veremos un resultado muy importante que lo involucra: la desigualdad del triángulo.

Tarea moral

Da la representación geométrica de los siguientes intervalos:

  • \[ (-15,-2) \cap [6,10)\text{,} \]
  • \[ (-3, 0) \cup (-2, 4] \text{,}\]
  • \[ [-6,1) \cap (-1,7] \text{,}\]
  • \[ (-\infty,-2) \cup [0, \infty) \text{.}\]

Encuentra todos los números reales $x$ que cumplan con las siguientes desigualdades:

  • $$5-x^{2} < -2\text{,}$$
  • $$x^{2} -2x +2 > 0\text{.}$$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Cálculo Diferencial e Integral I: Asíntotas

Por Juan Manuel Naranjo Jurado

Introducción

En esta entrada revisaremos el concepto de asíntota de una función; de manera intuitiva podemos pensar que mientras nos vamos «moviendo» a través de una curva, si ésta comienza a tener una distancia respecto a una recta cada vez más cercana a cero, entonces tal recta es una asíntota de la curva. En otras palabras, revisaremos aquellas curvas que a partir de determinado momento comienzan a tener un comportamiento muy similar al de una recta.

Un par de funciones conocidas

Daremos inicio a esta entrada retomando la función $f(x) = tan(x)$ estudiada en una entrada previa. Para nuestra revisión, consideraremos $f: (- \frac{\pi}{2}, \frac{\pi}{2}) \to \mathbb{R}$.

Recordemos que $f(x) = tan(x) = \frac{sen(x)}{cos(x)}$, notemos que la función tiene una particularidad cuando $x \to \frac{\pi}{2}$ y $x \to -\frac{\pi}{2}$, pues en estos puntos el denominador, $cos(x)$, se hace cero. Para investigar un poco más al respecto, veamos qué pasa en el límite.

\begin{align*}
\lim_{x \to \frac{\pi}{2}^-} tan(x) = & \lim_{x \to \frac{\pi}{2}^-} \frac{sen(x)}{cos(x)} \\
= & \infty.
\end{align*}

Por otro lado,
\begin{align*}
\lim_{x \to -\frac{\pi}{2}^+} tan(x) = & \lim_{x \to -\frac{\pi}{2}^+} \frac{sen(x)}{cos(x)} \\
= & -\infty.
\end{align*}

Con lo anterior, podemos notar que cuando nos acercamos por la izquierda a $\frac{\pi}{2}$, la función tiende a $\infty$ y cuando nos acercamos por la derecha a $-\frac{\pi}{2}$ la función tiende a $- \infty$, éstos son ejemplos de comportamiento asintótico y lo podemos visualizar con mayor facilidad en la siguiente gráfica:


Las rectas $l_1: x = -\frac{\pi}{2}$, $l_2: x = \frac{\pi}{2}$ (líneas punteadas en rojo) las llamaremos asíntotas de la función.


Revisemos un segundo ejemplo antes de dar las definiciones correspondientes. En una entrada anterior vimos que para la función $f(x) = \frac{1}{x}$, se tiene que $\lim\limits_{x \to \infty} \frac{1}{x} = 0$, análogamente se puede probar que $\lim\limits_{x \to -\infty} \frac{1}{x} = 0$. Tales límites nos indican que la función $f$ comienza a parecerse mucho a la recta $y = 0$ cuando $x$ es muy grande o muy pequeño. En este sentido, dicha recta es una asíntota horizontal de $f$ tal y como lo podemos visualizar en la gráfica.

Tras haber visto la gráfica de la función es claro que también tiene un comportamiento similar al de una recta cuando $x \to 0$. Si bien el límite en tal punto no existe, ya conocemos sus límites laterales:

$$\lim_{x \to 0^+} \frac{1}{x} = \infty, \qquad \lim_{x \to 0^-} \frac{1}{x} = -\infty.$$

Cuando sucede que el límite en un punto $x_0$ es $\infty$ ó $- \infty$, a la recta $x=x_0$ se le llama asíntota vertical. De esta manera, en nuestro ejemplo tenemos dos tipos de asíntotas: horizontal y vertical.

Existe un tercer tipo llamado asíntota oblicua que sucede cuando la función se aproxima a una recta del tipo $y = ax + b$ con $a \neq 0.$

Asíntota de una curva

A continuación presentamos la definición de los 3 tipos de asíntotas.

Definición (Asíntota vertical). Sea $x = x_0$ una recta $l$. Decimos que $l$ es asíntota vertical de la curva $f$ si se cumple al menos una de las siguientes condiciones:

  1. $\lim\limits_{x \to x_0} f(x) = \pm \infty.$
  2. $\lim\limits_{x \to x_0^-} f(x) = \pm \infty.$
  3. $\lim\limits_{x \to x_0^+} f(x) = \pm \infty.$

Notemos que las condiciones nos indican que una función tiene una asíntota vertical si mientras nos acercamos a determinado punto $x_0$ (ya sea por la izquierda, derecha o de ambas formas) la función crece o decrece de forma arbitraria. Este tipo de asíntotas suelen presentarse en las funciones racionales donde el denominador se hace cero.

Definición (Asíntota horizontal). Sea $y=b$ una recta $l$. Decimos que $l$ es una asíntota horizontal de la curva $f$ si se cumple al menos una de las siguientes condiciones:

  1. $\lim\limits_{x \to \infty} f(x) = L.$
  2. $\lim\limits_{x \to -\infty} f(x) = L.$

En este caso, la definición nos indica que existe una asíntota horizontal si la función comienza a acercarse a un número real conforme $x$ se hace arbitrariamente grande o pequeño.

Definición (Asíntota Oblicua). Sea $y = ax +b$ una recta $l$. Decimos que $l$ es una asíntota oblicua de la curva $f$ si se cumple alguna de las siguientes condiciones:

  1. $\lim\limits_{x \to \infty} [f(x)- (ax+b)] = 0.$
  2. $\lim\limits_{x \to -\infty} [f(x)- (ax+b)] = 0.$

La forma práctica de encontrar las asíntotas oblicuas de una curva $f$ es de la manera siguiente:

Si existen los límites $\lim\limits_{x \to \pm \infty} \frac{f(x)}{x} = a$ y $\lim\limits_{x \to \pm \infty} [f(x)-ax] = b.$

La recta $y = ax+b$ es una asíntota oblicua. Particularmente si $a=0$, esto se reduce al caso asíntota horizontal.

Ahora veremos algunos ejemplos donde encontraremos todas las asíntotas para cada función dada.

Ejemplo 1. Encuentra las asíntotas de la función $f(x) = \frac{x^2+5}{x-1}.$

  • Asíntota vertical.
    Notemos que de la primera definición nos interesa encontrar los puntos en los cuales la función tiende a infinito o menos infinito, y el denominador se acerca a cero cuando $x \rightarrow 1$. Es decir $$\lim_{x \to 1^+} \frac{x^2+5}{x-1} = \infty \quad \text{ y } \quad \lim_{x \to 1^-} \frac{x^2+5}{x-1} = -\infty.$$
    Por lo tanto, $x=1$ es una asíntota vertical.
  • Asíntota horizontal.
    $$\lim_{x \to \infty} \frac{x^2+5}{x-1} = \infty \quad \text{ y } \quad \lim_{x \to -\infty} \frac{x^2+5}{x-1} = -\infty.$$
    Por lo que no hay asíntotas horizontales.
  • Asíntota oblicua.
    Veamos ahora que
    \begin{align*}
    \lim_{x \to \pm \infty} \frac{f(x)}{x} = & \lim_{x \to \pm \infty} \frac{\frac{x^2+5}{x-1}}{x} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^2+5}{x^2-x} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^2+5}{x^2-x} \cdot \frac{\frac{1}{x^2}}{\frac{1}{x^2}} \\ \\
    = & \lim_{x \to \pm \infty} \frac{1+\frac{5}{x^2}}{1-\frac{1}{x}} \\ \\
    = & 1.
    \end{align*}

    Por otro lado,
    \begin{align*}
    \lim_{x \to \pm \infty} [f(x)-ax] = & \lim_{x \to \pm \infty} \frac{x^2+5}{x-1} -x \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^2+5-x^2+x}{x-1} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x+5}{x-1} \\ \\
    = & 1.
    \end{align*}
    Así, tenemos una asíntota oblicua en $y = x+1$.

Ejemplo 2. $f(x) = \frac{x^2+x-3}{x}.$

  • Asíntota vertical.
    Notemos que
    $$\lim_{x \to 0^+} \frac{x^2+x-3}{x} = -\infty \quad \text{y} \quad \lim_{x \to 0^-} \frac{x^2+x-3}{x} = \infty.$$
    Por lo tanto, hay una asíntota vertical en $x=0$.
  • Asíntota horizontal.
    $$\lim_{x \to \infty} \frac{x^2+x-3}{x} = \infty \quad \text{y} \quad \lim_{x \to -\infty} \frac{x^2+x-3}{x} = -\infty.$$
    Por lo tanto, no hay asíntota horizontal.
  • Asíntota Oblicua.
    \begin{align*}
    \lim_{x \to \pm \infty} \frac{f(x)}{x} = & \lim_{x \to \pm \infty} \frac{\frac{x^2+x-3}{x}}{x} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^2+x-3}{x^2} \\ \\
    = & 1.
    \end{align*}
    \begin{align*}
    \lim_{x \to \pm \infty} [f(x)-ax] = & \lim_{x \to \pm \infty} \frac{x^2+x-3}{x} – x \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^2+x-3-x^2}{x} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x-3}{x} \\ \\
    = & 1.
    \end{align*}

    Así, $f$ tiene como asíntota oblicua la recta $y = x+1$.



Ejemplo 3. $f(x) = \frac{1}{x^2+x-30}.$

  • Asíntota vertical.
    Revisemos en qué momento el denominador se hace cero
    $x^2+x-30 = 0 \iff (x+6)(x-5) = 0 \iff x =-6 \text{ ó } x = 5.$
    Así,
    $$\lim_{x \to -6^+} \frac{1}{x^2+x-30} = -\infty \quad \text{y} \quad \lim_{x \to -6^-} \frac{1}{x^2+x-30} = \infty.$$
    $$\lim_{x \to 5^+} \frac{1}{x^2+x-30} = \infty \quad \text{y} \quad \lim_{x \to 5^-} \frac{1}{x^2+x-30} = -\infty.$$
    Por tanto, hay dos asíntotas verticales, una en $x = 5$ y otra en $x= -6$.
  • Asíntota horizontal.
    $$\lim_{x \to \pm \infty} \frac{1}{x^2+x-30} = 0$$
    Hay una asíntota horizontal en $y = 0$.
  • Asíntota oblicua.
    \begin{align*}
    \lim_{x \to \pm \infty} \frac{f(x)}{x} = & \lim_{x \to \pm \infty} \frac{\frac{1}{x^2+x-30}}{x} \\ \\
    = & \lim_{x \to \pm \infty} \frac{1}{x^3+x^2-30x} \\ \\
    = & 0.
    \end{align*}
    Como el límite es cero, no hay asíntota oblicua.

Ejemplo 4. $f(x) = \frac{x^5}{x^4-1}.$

  • Asíntota vertical.
    El denominador se hace cero si $x^4 – 1 = 0 \iff x = 1 \text{ ó } x = -1$
    $$\lim_{x \to -1^+} \frac{x^5}{x^4-1} = \infty \quad \text{y} \quad \lim_{x \to -1^-} \frac{x^5}{x^4-1} = -\infty$$
    $$\lim_{x \to 1^+} \frac{x^5}{x^4-1} = \infty \quad \text{y} \quad \lim_{x \to 1^-} \frac{x^5}{x^4-1} = -\infty$$
    Por lo tanto, hay dos asíntotas verticales, una en $x=1$ y otra en $x=-1$.
  • Asíntota horizontal.
    Notemos que
    $$\lim_{x \to \pm \infty} \frac{x^5}{x^4-1} = \pm \infty$$
    Por lo que no hay asíntota horizontal.
  • Asíntota oblicua.
    \begin{align*}
    \lim_{x \to \pm \infty} \frac{f(x)}{x} = & \lim_{x \to \pm \infty} \frac{\frac{x^5}{x^4-1}}{x} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^5}{x^5-x} \\ \\
    = & 1.
    \end{align*}
    \begin{align*}
    \lim_{x \to \pm \infty} [f(x)-ax] = & \lim_{x \to \pm \infty} \frac{x^5}{x^4-1} – x \\ \\
    = & \lim_{x \to \pm \infty} \frac{x^5-x^5+x}{x^4-1} \\ \\
    = & \lim_{x \to \pm \infty} \frac{x}{x^4-1} \\ \\
    = & 0.
    \end{align*}
    Así, $f$ tiene como asíntota oblicua la recta $y = x$.

Más adelante…

En las siguientes entradas estudiaremos el concepto de continuidad puntual y en un intervalo, también veremos diversos teoremas de las funciones continuas; para hacer la revisión de este nuevo concepto haremos amplio uso de la definición de límite, así como las propiedades que se revisaron a lo largo de esta unidad.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

Encuentra todas las asíntotas de las siguientes funciones:

  • $f(x) = \frac{x^2+2}{x+1}.$
  • $f(x) = \frac{x^5+1}{x^2-1}.$
  • $f(x) = x \sqrt{\frac{x+10}{x-10}}.$
  • $f(x) = \frac{x^2+3}{\sqrt{x^2+4}}.$
  • $f(x) = \frac{1-x^2}{x^2-4}.$

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal II: Caracterizaciones de diagonalizar

Por Julio Sampietro

Introducción

Ya dimos la definición de que una matriz sea diagonalizable y encontramos buenas razones para, dada una matriz, intentar encontrar una matriz similar que sea diagonal. En esta entrada enunciaremos y demostraremos un teorema de caracterización de matrices diagonalizables, el cual nos ayudará a entender con más profundidad la diagonalizabilidad.

El teorema de caracterización

El teorema principal de esta entrada es el siguiente.

Teorema. Sea $V$ un espacio de dimensión finita sobre $F$ y $T:V\to V$ una transformación lineal. Las siguientes afirmaciones son equivalentes.

  1. $T$ es diagonalizable.
  2. Existe un polinomio $P\in F[X]$ que se divide sobre $F$ y tiene raíces distintas dos a dos, tal que $P(T)=0$.
  3. El polinomio mínimo $\mu_T$ de $T$ se divide sobre $F$ y tiene raíces distintas dos a dos.
  4. Sea $\operatorname{Sp}(T)\subset F$ el conjunto de eigenvalores de $T$. Entonces
    \begin{align*}
    \bigoplus_{\lambda \in \operatorname{Sp}(T)} \ker (T-\lambda \cdot \operatorname{Id})=V.
    \end{align*}

Demostración. Demostremos primero que $1$ implica $2$. Escogemos una base en la que $T$ se represente por una matriz diagonal $D$. Sea $P$ el polinomio cuyas raíces son las diferentes entradas de la diagonal de $D$. Entonces $P(T)$ está representada por la matriz diagonal $P(D)$ con entradas $P(d_{ii})=0$. Es decir $P(T)=0$.

Que $2$ implica $3$ se sigue de la definición del polinomio mínimo: si $P$ cumple $2$, entonces $\mu_T$ divide a $P$ y por tanto cumple $3$.

La implicación $3\Rightarrow 4$ es consecuencia del último teorema de la entrada anterior aplicado a $P=\mu_T$ y los factores lineales siendo los $P_i$.

Finalmente veamos que $4$ implica $1$. Sea $\operatorname{Sp}(T)=\{\lambda_1,\dots, \lambda_k\}$ y sea $v_1,\dots v_n$ una base de $V$ obtenida al pegar una base de $\ker(T-\lambda_1\cdot \operatorname{Id})$ a una base de $\ker(T-\lambda_2\cdot \operatorname{Id})$ y a una base de $\ker(T-\lambda_3 \cdot \operatorname{Id})$ y así sucesivamente hasta pegar una base de $\ker(T-\lambda_n\cdot \operatorname{Id})$. Entonces $v_1,\dots, v_n$ es una base de eigenvectores de $V$ y por tanto se cumple $1$.

$\square$

Consecuencias del teorema

Hacemos algunas observaciones que son consecuencia del teorema anterior.

Observación. Si $T$ es una transformación lineal diagonalizable, entonces el polinomio mínimo de $T$ es

\begin{align*}
\mu_T(X)=\prod_{\lambda \in \operatorname{Sp}(T)} (X-\lambda)
\end{align*}

dónde el producto se toma sobre todos los valores propios, contados sin multiplicidad. El mismo producto pero tomado con multiplicidades rinde el polinomio característico de $T$.

Observación. Si $T$ es cualquier transformación lineal en un espacio vectorial de dimensión finita entonces $T$ es diagonalizable si y sólo si la suma de las dimensiones de los eigenespacios coincide con la dimensión de $V$, es decir si

\begin{align*}
\sum_{\lambda \in \operatorname{Sp}(T)}\dim \ker (T-\lambda \cdot \operatorname{Id})=\dim V.
\end{align*}

Observación. Supongamos que $T$ es diagonalizable. Para cada $\lambda\in \operatorname{Sp}_T$ sea $\pi_{\lambda}$ la proyección al subespacio $\ker(T-\lambda\cdot \operatorname{Id})$. Entonces

\begin{align*}
T=\sum_{\lambda\in \operatorname{Sp}(T)} \lambda \pi_{\lambda}.
\end{align*}

Esto se sigue de la descomposición $\bigoplus_{\lambda \in \operatorname{Sp}(T)} \ker (T-\lambda \cdot \operatorname{Id})=V$ y que si

\begin{align*}
v=\sum_{\lambda \in \operatorname{Sp}(T)} v_{\lambda}, v_{\lambda}\in \ker(T-\lambda\cdot \operatorname{Id}),
\end{align*}

entonces

\begin{align*}
T(v)=\sum_{\lambda \in \operatorname{Sp}(T)} T(v_{\lambda})=\sum_{\lambda \in \operatorname{Sp}(T)} \lambda v_{\lambda}= \sum_{\lambda \in \operatorname{Sp}(T)} \lambda \pi_{\lambda}(v).
\end{align*}

Finalmente enunciamos el teorema que demostramos en su forma matricial (que es ciertamente una consecuencia del teorema para transformaciones lineales).

Teorema. Sea $A\in M_n(F)$. Entonces las siguientes afirmaciones son equivalentes.

  1. $A$ es diagonalizable en $M_n(F)$.
  2. Si $\operatorname{Sp}(A)$ es el conjunto de eigenvalores de $A$, entonces
    \begin{align*}
    \bigoplus_{\lambda \in \operatorname{Sp}(A)}\ker(\lambda \cdot I_n-A)=F^{n}.
    \end{align*}
  3. El polinomio mínimo $\mu_A$ de $A$ se divide sobre $F$ con raíces distintas dos a dos.
  4. Existe un polinomio $P\in F[X]$ que se divide sobre $F$ con raíces distintas dos a dos tal que $P(A)=O_n$.

Problemas para practicar

Terminamos esta entrada con unos cuantos problemas para aplicar los resultados vistos.

Problema 1. Considera la matriz

\begin{align*}
A=\begin{pmatrix}
0 & 1 & 0\\ 0 & 0 & 1\\ 1 & 0 & 0\end{pmatrix}.
\end{align*}

¿Es $A$ diagonalizable en $M_3(\mathbb{C})$? ¿ En $M_3(\mathbb{R})$?

Solución. El polinomio característico de $A$ está dado por $\chi_A(X)=X^3-1$. Este polinomio se divide sobre $\mathbb{C}$ con raíces distintas, ya que tenemos $3$ soluciones dadas por las raíces de la unidad. Por el teorema de Cayley-Hamilton sabemos que $\chi_A(A)=O_3$. Usando el teorema de esta entrada concluimos que $A$ es diagonalizable sobre $\mathbb{C}$.

Sin embargo, dado que el polinomio característico no se divide sobre $\mathbb{R}$ podemos deducir que $A$ no es diagonalizable en $M_3(\mathbb{R})$.

$\triangle$

Problema 2. ¿Es la matriz

\begin{align*}
A=\begin{pmatrix}
0 & 1 & 0\\ -4 & 4 & 0\\ -2 & 1 & 2\end{pmatrix}\in M_3(\mathbb{R})
\end{align*}

diagonalizable?

Solución. Comenzamos calculando el polinomio característico de $A$:

\begin{align*}
\chi_A(X)=\begin{vmatrix} X & -1 & 0 \\ 4 & X-4 & 0 \\ 2 & -1 &X-2\end{vmatrix}
&=(X-2)\begin{vmatrix} X & -1\\ 4 & X-4\end{vmatrix} \\
&= (X-2)(X^2-4X+4)\\
&= (X-2)^3.
\end{align*}

Por tanto $2$ es un eigenvalor con multiplicidad algebraíca $3$. Si $A$ fuese diagonalizable, entonces $2$ tendría multiplicidad geométrica $3$, es decir $\ker(A-2I_3)$ sería $3$-dimensional: ¡pero entonces sería todo $\mathbb{R}^3$! Esto implicaría que $A-2I_3=0$, de otra manera que $A=2I_3$, lo que claramente no es cierto.

$\triangle$

Más adelante…

En las siguientes entradas estudiaremos formas bilineales, lo que forma el segundo bloque del curso.

Tarea moral

Los siguientes ejercicios no forman parte de la evaluación del curso, pero te servirán para repasar lo visto en esta entrada.

  1. Encuentra todos los valores de $a\in \mathbb{R}$ tales que la matriz
    \begin{align*}
    A=\begin{pmatrix} 2 & 1 &-2\\ 1 & a & -1\\ 1 & 1 & -1\end{pmatrix}\in M_3(\mathbb{R})
    \end{align*}
    sea diagonalizable.
  2. Explicita el por qué el teorema para operadores lineales implica el teorema para matrices.
  3. Calcula la $n$-ésima potencia de
    \begin{align*}
    A=\begin{pmatrix}
    1 & 3 & 3\\ 3 & 1 & 3\\ 3 & 3 & 1
    \end{pmatrix}.
    \end{align*}
    Sugerencia. Diagonaliza a $A$.
  4. Demuestra que si $T:V\to V$ es una transformación lineal con $V$ un espacio vectorial de dimensión finita sobre $\mathbb{C}$ tal que $T^2$ diagonalizable y $\ker T=\ker T^2$ entonces $T$ es diagonalizable.
  5. Si $V$ es un espacio de dimensión finita sobre $F$ y $T:V\to V$ es una transformación lineal diagonalizable fija, entonces cualquier otra transformación lineal $S:V\to V$ satisface $S\circ T=T\circ S$ si y sólo si $S$ deja invariante cada eigenespacio de $T$.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE109323 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 3»