Archivo del Autor: Leonardo Ignacio Martínez Sandoval

Acerca de Leonardo Ignacio Martínez Sandoval

Hola. Soy Leonardo Martínez. Soy Profesor de Tiempo Completo en la Facultad de Ciencias de la UNAM. Hice un doctorado en Matemáticas en la UNAM, un postdoc en Israel y uno en Francia. Además, me gusta colaborar con proyectos de difusión de las matemáticas como la Olimpiada Mexicana de Matemáticas.

Álgebra Lineal I: Propiedades del polinomio característico

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta entrada continuamos con el estudio de eigenvalores y eigenvectores de matrices y trasformaciones lineales. Para ello, estudiaremos más a profundidad el polinomio característico.

Como recordatorio, en una entrada pasada demostramos que si $A$ es una matriz en $M_n(F)$, entonces la expresión $\det (\lambda I_n – A)$ es un polinomio en $\lambda$ de grado $n$ con coeficientes en $F$. A partir de ello, definimos el polinomio característico de $A$ como $$\chi_A(\lambda)=\det(\lambda I_n – A).$$

En esta entrada probaremos algunas propiedades importantes del polinomio característico de matrices. Además, hablaremos de la multiplicidad algebraica de los eigenvalores. Finalmente enunciaremos sin demostración dos teoremas fundamentales en álgebra lineal: el teorema de caracterización de matrices diagonalizables y el teorema de Cayley-Hamilton.

Las raíces del polinomio característico son los eigenvalores

Ya vimos que las raíces del polinomio característico son los eigenvalores. Pero hay que tener cuidado. Deben ser las raíces que estén en el campo en el cual la matriz esté definida. Veamos un ejemplo más.

Problema. Encuentra el polinomio característico y los eigenvalores de la matriz \begin{align*}
\begin{pmatrix}
0&1&0&0\\
2&0&-1&0\\
0& 7 & 0 & 6\\
0 & 0 & 3 & 0
\end{pmatrix}.
\end{align*}

Solución. Debemos encontrar las raíces del polinomio dado por el siguiente determinante:
\begin{align*}
\begin{vmatrix}
\lambda&-1&0&0\\
-2&\lambda&1&0\\
0& -7 & \lambda & -6\\
0 & 0 & -3 & \lambda
\end{vmatrix}.
\end{align*}

Haciendo expansión de Laplace en la primer columna, tenemos que este determinante es igual a

\begin{align*}
\lambda\begin{vmatrix}
\lambda&1&0\\
-7 & \lambda & -6\\
0 & -3 & \lambda
\end{vmatrix}
+2\begin{vmatrix}
-1&0&0\\
-7 & \lambda & -6\\
0 & -3 & \lambda
\end{vmatrix}.
\end{align*}

Para calcular los determinantes de cada una de las matrices de $3\times 3$ podemos aplicar la fórmula por diagonales para obtener:
\begin{align*}
\lambda\begin{vmatrix}
\lambda&1&0\\
-7 & \lambda & -6\\
0 & -3 & \lambda
\end{vmatrix}&=
\lambda(\lambda^3-18\lambda+7\lambda)\\
&=\lambda(\lambda^3-11\lambda)\\
&=\lambda^4-11\lambda^2
\end{align*}

y
\begin{align*}
2\begin{vmatrix}
-1&0&0\\
-7 & \lambda & -6\\
0 & -3 & \lambda
\end{vmatrix}&=
2(-\lambda^2+18)\\
&=-2\lambda^2+36.
\end{align*}

Concluimos que el polinomio característico es
\begin{align*}
\lambda^4-13\lambda^2+36&=(\lambda^2-4)(\lambda^2-9)\\
&=(\lambda+2)(\lambda-2)(\lambda+3)(\lambda-3).
\end{align*}

De esta factorización, las raíces del polinomio (y por lo tanto los eigenvalores que buscamos) son $-2,2,-3,3$.

Si quisiéramos encontrar un eigenvector para, por ejemplo, el eigenvalor $-2$, tenemos que encontrar una solución no trivial al sistema lineal de ecuaciones homogéneo $$(-2I_n-A)X=0.$$

$\triangle$

Propiedades del polinomio característico

Veamos ahora algunas propiedades importantes del polinomio característico. El primer resultado habla del polinomio característico de matrices triangulares superiores. Un resultado análogo se cumple para matrices inferiores, y su enunciado y demostración quedan como tarea moral.

Proposición. Si $A=[a_{ij}]$ es una matriz triangular superior en $M_n(F)$, entonces su polinomio característico es $$\chi_A(\lambda)=\prod_{i=1}^n (\lambda-a_{ii}).$$

Demostración. Como $A$ es triangular superior, entonces $\lambda I_n -A$ también, y sus entradas diagonales son precisamente $\lambda-a_{ii}$ para $i=1,\ldots,n$. Como el determinante de una matriz triangular es el producto de sus entradas en la diagonal, tenemos que $$\chi_A(\lambda)=\prod_{i=1}^n (\lambda-a_{ii}).$$

$\square$

Como el polinomio característico es un determinante, podemos aprovechar otras propiedades de determinantes para obtener otros resultados.

Proposición. Una matriz y su transpuesta tienen el mismo polinomio característico.

Demostración. Sea $A$ una matriz en $M_n(F)$. Una matriz y su transpuesta tienen el mismo determinante. Además, transponer es una transformación lineal. De este modo:
\begin{align*}
\chi_A(\lambda)&=\det(\lambda I_n – A)\\
&=\det({^t(\lambda I_n-A)})\\
&=\det(\lambda({^tI_n})-{^tA})\\
&=\det(\lambda I_n – {^tA})\\
&=\chi_{^tA}(\lambda).
\end{align*}

$\square$

Ya antes habíamos mostrado que matrices similares tienen los mismos eigenvalores, pero que dos polinomios tengan las mismas raíces no necesariamente implica que sean iguales. Por ejemplo, los polinomios $$(x-1)^2(x+1) \quad \text{y} \quad (x+1)^2(x-1)$$ tienen las mismas raíces, pero no son iguales.

De esta forma, el siguiente resultado es más fuerte de lo que ya habíamos demostrado antes.

Proposición. Sean $A$ y $P$ matrices en $M_n(F)$ con $P$ invertible. Entonces $A$ y $P^{-1}AP$ tienen el mismo polinomio característico.

Demostración. El resultado se sigue de la siguiente cadena de igualdades, en donde usamos que $\det(P)\det(P^{-1})=1$ y que el determinante es multiplicativo:

\begin{align*}
\chi_{P^{-1}AP}(\lambda) &= \det(P) \chi_{P^{-1}AP}(\lambda) \det(P)^{-1}\\
&=\det(P) \det(\lambda I_n – P^{-1}AP) \det(P^{-1})\\
&=\det(P(\lambda I_n – P^{-1}AP)P^{-1})\\
&=\det(\lambda PP^{-1}-PP^{-1}APP^{-1})\\
&=\det(\lambda I_n – A)\\
&=\chi_{A}(\lambda)
\end{align*}

$\square$

Ten cuidado. El determinante es multiplicativo, pero el polinomio característico no es multiplicativo. Esto es evidente por el siguiente argumento. Si $A$ y $B$ son matrices en $M_n(F)$, entonces $\chi_A(\lambda)$ y $\chi_B(\lambda)$ son cada uno polinomios de grado $n$, así que su producto es un polinomio de grado $2n$, que por lo tanto no puede ser igual al polinomio característico $\chi_{AB}(\lambda)$ pues este es de grado $n$. Así mismo, $\chi_{A^2}(\lambda)$ no es $\chi_{A}(\lambda)^2$.

Una última propiedad que nos interesa es mostrar que el determinante de una matriz y su traza aparecen en los coeficientes del polinomio característico.

Teorema. Sea $A$ una matriz en $M_n(F)$ y $\chi_A(\lambda)$ su polinomio característico. Entonces $\chi_{A}(\lambda)$ es de la forma $$\lambda^n-(\text{tr} A) \lambda^{n-1}+\ldots+(-1)^n \det A.$$

Demostración. Tenemos que mostrar tres cosas:

  • El polinomio $\chi_{A}$ es mónico, es decir, tiene coeficiente principal $1$,
  • que el coeficiente del término de grado $n-1$ es $-\text{tr} A$ y
  • el coeficiente libre es $(-1)^n \det A$.

El coeficiente libre de un polinomio es su evaluación en cero. Usando la homogeneidad del determinante, dicho coeficiente es:
\begin{align*}
\chi_A(0)&=\det(0\cdot I_n-A)\\
&=\det(-A)\\
&=(-1)^n\det(A).
\end{align*}

Esto muestra el tercer punto.

Para el coeficiente del término de grado $n-1$ y el coeficiente principal analicemos con más detalle la fórmula del determinante
\begin{align*}
\begin{vmatrix}
\lambda – a_{11} & -a_{12} & \ldots & -a_{1n}\\
-a_{21} & \lambda – a_{22} & \ldots & -a_{1n}\\
\vdots & & \ddots & \\
-a_{n1} & -a_{n2} & \ldots & \lambda – a_{nn}
\end{vmatrix}
\end{align*}
en términos de permutaciones.

Como discutimos anteriormente, la única forma de obtener un término de grado $n$ es cuando elegimos a la permutación identidad. Pero esto también es cierto para términos de grado $n-1$, pues si no elegimos a la identidad, entonces la permutación elige por lo menos dos entradas fuera de la diagonal, y entonces el grado del producto de entradas correspondiente es a lo más $n-2$.

De este modo, los únicos términos de grado $n$ y $n-1$ vienen del producto $$(\lambda-a_{11})\cdot\ldots\cdot(\lambda-a_{nn}).$$

El único término de grado $n$ viene de elegir $\lambda$ en todos los factores, y se obtiene el sumando $\lambda^n$, lo cual muestra que el polinomio es mónico.

Los únicos términos de grado $n-1$ se obtienen de elegir $\lambda$ en $n-1$ factores y un término del estilo $-a_{ii}$. Al considerar todas las opciones, el término de grado $n-1$ es $$-(a_{11}+a_{22}+\ldots+a_{nn})\lambda^{n-1}=-(\text{tr} A) \lambda^{n-1},$$ que era lo último que debíamos mostrar.

$\square$

Ejemplo. El teorema anterior muestra que si $A$ es una matriz en $M_2(F)$, es decir, de $2\times 2$, entonces $$\chi_A(\lambda)=\lambda^2 – (\text{tr}A) \lambda +\det A.$$ De manera explícita en términos de las entradas tendríamos entonces que si $A=\begin{pmatrix} a & b \\ c & d \end{pmatrix}$, entonces su polinomio característico es $$\lambda^2-(a+d)\lambda+(ad-bc).$$

Como ejemplo, si $A=\begin{pmatrix} 5 & 2 \\ -8 & -3 \end{pmatrix}$, entonces su polinomio característico es $$\lambda^2 -2\lambda +1=(\lambda-1)^2.$$ Su único eigenvalor sería entonces $1$.

$\triangle$

Suma y producto de eigenvalores de matrices complejas

A veces queremos referirnos al conjunto de todos los eigenvalores de una matriz.

Definición. Para $A$ una matriz en $M_n(F)$, el espectro de $A$ es el conjunto de eigenvalores de $A$. Lo denotamos por $\text{spec} (A)$

Tenemos una definición análoga para el espectro de una transformación lineal. Esa definición da un poco de intuición de por qué los teoremas de diagonalización de matrices se llaman teoremas espectrales. La siguiente definición habla de un sentido en el cual un eigenvalor «se repite».

Definición. Sea $A$ una matriz en $M_n(F)$ y $\lambda$ un eigenvalor de $A$. La multiplicidad algebraica de $\lambda$ es el mayor entero $m_{\lambda}$ tal que $(x-\lambda)^{m_\lambda}$ divide a $\chi_A(x)$.

Cuando estamos en $\mathbb{C}$, por el teorema fundamental del álgebra todo polinomio de grado $n$ se puede factorizar en exactamente $n$ términos lineales. Además, los polinomios característicos son mónicos. De este modo, si tenemos una matriz $A$ en $M_n(\mathbb{C})$, su polinomio característico se puede factorizar como sigue:

$$\chi_A(\lambda) = \prod_{j=1}^n (\lambda-\lambda_j),$$

en donde $\lambda_1,\ldots,\lambda_n$ son eigenvalores de $A$, no necesariamente distintos, pero en donde cada eigenvalor aparece en tantos términos como su multiplicidad algebraica.

Desarrollando parcialmente el producto del lado derecho, tenemos que el coeficiente de $\lambda^{n-1}$ es $$-(\lambda_1+\ldots+\lambda_n)$$ y que el coeficiente libre es $$(-1)^n\lambda_1\cdot\ldots\cdot\lambda_n.$$ Combinando este resultado con el de la sección anterior y agrupando eigenvalores por multiplicidad, se demuestra el siguiente resultado importante. Los detalles de la demostración quedan como tarea moral.

Teorema. Sea $A$ una matriz en $M_n(\mathbb{C})$

  • La traza $A$ es igual a la suma de los eigenvalores, contando multiplicidades algebraicas, es decir: $$\text{tr} A = \sum_{\lambda \in \text{spec}(A)} m_{\lambda} \lambda.$$
  • El determinante de $A$ es igual al producto de los eigenvalores, contando multiplicidades algebraicas, es decir: $$\det A = \prod_{\lambda \in \text{spec} (A)} \lambda^{m_{\lambda}}.$$

Veamos un problema en donde se usa este teorema.

Problema. Sea $A$ una matriz en $M_n(\mathbb{C})$ tal que $A^2-4A+3I_n=0$. Muestra que el determinante de $A$ es una potencia de $3$.

Solución. Sea $\lambda$ un eigenvalor de $A$ y $v$ un eigenvector para $\lambda$. Tenemos que $$A^2v=A(\lambda v) = \lambda(Av)=\lambda^2 v.$$ De esta forma, tendríamos que
\begin{align*}
0&=(A^2-4A+3I_n)v\\
&=(\lambda^2 v – 4\lambda v + 3 v)\\
&=(\lambda^2-4\lambda+3) v.
\end{align*}

Como $v$ no es el vector $0$, debe suceder que $\lambda^2-4\lambda+3=0$. Como $\lambda^2-4\lambda+3 = (\lambda-3)(\lambda-1)$, entonces $\lambda=1$ ó $\lambda=3$. Con esto concluimos que los únicos posibles eigenvectores de $A$ son $1$ y $3$.

Como $A$ es una matriz en $\mathbb{C}$, tenemos entonces que su polinomio característico es de la forma $(x-1)^a(x-3)^b$ con $a$ y $b$ enteros no negativos tales que $a+b=n$. Pero entonces por el teorema de producto de eigenvalores, tenemos que el determinante es $1^a\cdot 3^b=3^b$, con lo que queda demostrado que es una potencia de $3$.

$\square$

Dos teoremas fundamentales de álgebra lineal (opcional)

Tenemos todo lo necesario para enunciar dos resultados de álgebra lineal. Sin embargo, las demostraciones de estos resultados requieren de más teoría, y se ven en un siguiente curso. No los demostraremos ni los usaremos en el resto de este curso, pero te pueden servir para anticipar el tipo de resultados que verás al continuar tu formación en álgebra lineal.

El primer resultado fundamental es una caracterización de las matrices que pueden diagonalizarse. Para ello necesitamos una definición adicional. Hay otro sentido en el cual un eigenvalor $\lambda$ de una matriz $A$ puede repetirse.

Definición. Sea $A$ una matriz en $M_n(F)$ y $\lambda$ un eigenvalor de $A$. La multiplicidad geométrica de $\lambda$ es la dimensión del kernel de la matriz $\lambda I_n -A$ pensada como transformación lineal.

En estos términos, el primer teorema al que nos referimos queda enunciado como sigue.

Teorema. Una matriz $A$ en $M_n(F)$ es diagonalizable si y sólo si su polinomio característico $\chi_A(\lambda)$ se puede factorizar en términos lineales en $F[\lambda]$ y además, para cada eigenvalor, su multiplicidad algebraica es igual a su multiplicidad geométrica.

Ejemplo. La matriz $$A=\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$$ tiene como polinomio característico a $\chi_A(\lambda)=\lambda^2+1$. Este polinomio no se puede factorizar en $\mathbb{R}[x]$, así que $A$ no es diagonalizable con matrices de entradas reales.

Sin embargo, en $\mathbb{C}$ tenemos la factorización en términos lineales $\lambda^2+1=(\lambda+i)(\lambda-i),$ que dice que $i$ y $-i$ son eigenvalores de multiplicidad algebraica $1$. Se puede mostrar que la multiplicidad geométrica también es $1$. Así, $A$ sí es diagonalizable con matrices de entradas complejas.

$\square$

El segundo resultado fundamental dice que «cualquier matriz se anula en su polinomio característico». Para definir correctamente esto, tenemos que decir qué quiere decir evaluar un polinomio en una matriz. La definición es más o menos natural.

Definición. Si $A$ es una matriz en $M_n(F)$ y $p$ es un polinomio en $F[\lambda]$ de la forma $$p(\lambda)=a_0+a_1\lambda+a_2\lambda^2+\ldots+a_n\lambda^n,$$ definimos a la matriz $p(A)$ como la matriz $$a_0I_n+a_1A+a_2A^2+\ldots+a_nA^n.$$

En estos términos, el resultado queda enunciado como sigue.

Teorema (Cayley-Hamilton). Si $A$ es una matriz en $M_n(F)$ y $\chi_A(x)$ es su polinomio característico, entonces $$\chi_A(A)=O_n.$$

Ejemplo. Tomemos de nuevo a la matriz $$A=\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$$ del ejemplo anterior. Su polinomio característico es $x^2+1$. En efecto, verificamos que se cumple el teorema de Cayley-Hamilton pues:
\begin{align*}
A^2+I_2 &= \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} + \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\\
&=\begin{pmatrix} -1 & 0 \\ 0 & -1 \end{pmatrix}+\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\\
&=\begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}.
\end{align*}

$\square$

Más adelante…

En esta entrada estudiamos algunas propiedades de los eigenvalores y eigenvectores de transformaciones lineales y matrices; vimos cómo obtener eigenvalores de una matriz a partir del polinomio característico y enunciamos dos teoremas muy importantes como parte opcional del curso.

En la siguiente entrada haremos varios ejercicios para desarrollar un poco de práctica al obtener los eigenvalores y eigenvectores de una transformación lineal y de una matriz.

Entradas relacionadas

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • Enuncia y demuestra cómo es el polinomio característico de una matriz triangular inferior.
  • Completa los detalles de la demostración del teorema de suma y producto de eigenvalores. Úsalo para encontrar la suma y producto (con multiplicidades) de los eigenvalores de la matriz $$\begin{pmatrix}5 & 0 & -1 & 2 \\ 3 & -2 & 1 & -2 \\ 0 & 0 & 0 & 5\\ 0 & 2 & 4 & 0 \end{pmatrix}.$$
  • Sea $A$ una matriz en $M_n(F)$. ¿Cómo es el polinomio característico de $-A$ en términos del polinomio característico de $A$?
  • Tomemos $A$ una matriz en $M_n(F)$ y $k$ un entero positivo. Muestra que si $\lambda$ es un eigenvalor de la matriz $A$, entonces $\lambda^k$ es un eigenvalor de la matriz $A^k$.

De la sección opcional:

  • Demuestra, haciendo todas las cuentas, el caso particular del teorema de Cayley-Hamilton para matrices de $2\times 2$.
  • Ya sabemos calcular el polinomio característico de matrices diagonales. Muestra el teorema de Cayley-Hamilton en este caso particular.
  • Las matrices diagonales trivialmente son diagonalizables. Muestra que la multiplicidad algebraica de sus eigenvalores en efecto coincide con la multiplicidad geométrica.

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Seminario de Resolución de Problemas: Vectores en geometría

Por Leonardo Ignacio Martínez Sandoval

Introducción

Anteriormente, comenzamos esta serie de entradas de geometría platicando de algunas técnicas euclideanas o sintéticas que se pueden usar para resolver problemas en el plano. Después, tomamos herramientas de la geometría analítica, las cuales nos permiten poner problemas en términos de coordenadas y ecuaciones. Lo que haremos ahora es ver varios ejemplos del uso de vectores en geometría.

A diferencia de la geometría analítica, cuando hablamos de soluciones por vectores estamos hablando de aquellas que aprovechan la estructura de espacio vectorial en $\mathbb{R}^2$. En otras palabras, usamos argumentos en los cuales pensamos a los puntos del plano como vectores, los cuales tienen una dirección y una magnitud. Los vectores tienen operaciones de suma y de producto por un escalar. Además, tienen producto punto, norma y transformaciones dadas por matrices. Apenas tocaremos la superficie del tipo de teoría que se puede usar. Un buen curso de álgebra lineal te puede dar más herramientas para resolver problemas geométricos.

Interpretar puntos como vectores

Pongamos un origen $O$ en el plano. A cada punto $P$ le corresponden ciertas coordenadas dadas por parejas de reales $(x,y)$, que identificaremos con $P$. Al origen le corresponden las coordenadas $(0,0)$. Si tenemos otro punto $Q=(w,z)$, entonces su suma es el vector $P+Q=(x+w,y+z)$. Si tomamos un real $r$, el vector $rP$ es el vector de coordenadas $(rx,ry)$.

Suma de vectores
Suma de vectores

La suma $P+Q$ se puede encontrar mediante la ley del paralelogramo: los puntos $O,P,P+Q,Q$ hacen un paralelogramo en ese orden cíclico. La resta $Q-P$ está definida por $Q+(-1)P$, y la llamamos el vector $PQ$. Geométricamente coincide con el vector que va «de $P$ a $Q$». Observa que el orden es importante y que $OP=P$.

Resta de vectores
Resta de vectores

Proposición (de la razón). Si tenemos dos puntos $P$ y $Q$ distintos y $m,n$ son reales, entonces podemos encontrar al único punto $R$ en la recta por $P$ y $Q$ tal que $$\frac{PR}{RQ}=\frac{m}{n}$$ así: $$R=\frac{n}{m+n}P + \frac{m}{m+n} Q.$$

Punto en una recta con cierta razón
Punto en una recta con cierta razón

Veamos dos problemas en los que se usan estas ideas de vectores en geometría, en particular, la proposición de la razón.

Problema. En el triángulo $ABC$ se toman puntos $D,E,F$ sobre los segmentos $BC,CA,AB$ tales que $\frac{BD}{DC}=\frac{CE}{EA}=\frac{AF}{FB}=\frac{1}{4}$. Muestra que $ABC$ y $DEF$ tienen el mismo gravicentro.

Sugerencia pre-solución. Encuentra una fórmula en términos vectoriales para el gravicentro de un triángulo $ABC$.

Solución. Tomemos un triángulo $PQR$ y pensemos a sus vértices como vectores. Afirmamos que su gravicentro $X$ es el punto correspondiente a $\frac{P+Q+R}{3}$ Demostraremos esto.

El gravicentro está a un tercio del punto medio hacia el vértice correspondiente
Razón del gravicentro en la mediana

Primero haremos un argumento de geometría sintética. El gravicentro es por definición el punto de intersección de las medianas de un triángulo. Si $L$ es el punto medio de $QR$ y $M$ es el punto medio de $RP$, entonces $X$ es el punto de intersección de $PL$ y $QM$. Tenemos que $$\frac{RL}{LQ}=1=\frac{RM}{MP},$$ así que por el teorema de Tales se tiene que la recta por $L$ y $M$ es paralela al lado $PQ$, y $\frac{LM}{PQ}=\frac{1}{2}$. Esto muestra que los triángulos $XLM$ y $XPQ$ son semejantes en razón $1$ a $2$. Por lo tanto, $\frac{LX}{XP}=\frac{1}{2}$.

Ahora hagamos el argumento vectorial, pensando a los puntos como vectores. El punto $L$ está a la mitad de $QR$, así que por la proposición de la razón, $$L=\frac{Q+R}{2}.$$ El punto $X$ cumple $\frac{LX}{XP}=\frac{1}{2}$, así que de nuevo por la proposición de la razón.
\begin{align*}
X&=\frac{2L+P}{2+1}\\
&=\frac{Q+R+P}{3}\\
&=\frac{P+Q+R}{3}.
\end{align*}

Esto es el resultado auxiliar que queríamos mostrar. Regresemos al problema.

De acuerdo al resultado auxiliar, el gravicentro de $ABC$ es $$G:=\frac{A+B+C}{3}.$$ Usando una vez más la proposición de la razón, los puntos $D$, $E$ y $F$ los podemos calcular como sigue:
\begin{align*}
D&=\frac{4B+C}{4+1}=\frac{4B+C}{5}\\
E&=\frac{4C+A}{4+1}=\frac{4C+A}{5}\\
F&=\frac{4A+B}{4+1}=\frac{4A+B}{5}.
\end{align*}

De esta forma, el gravicentro $G’$ de $DEF$ lo podemos encontrar como sigue:
\begin{align*}
G’&=\frac{D+E+F}{3}\\
&=\frac{\frac{4B+C}{5}+\frac{4C+A}{5}+\frac{4A+B}{5}}{3}\\
&=\frac{A+B+C}{3}\\
&=G.
\end{align*}

Esto termina la solución del problema.

$\square$

Problema. En el paralelogramo $ABCD$ el punto $F$ es el punto medio de $CD$. Muestra que el segmento $AF$ corta a la diagonal $BD$ en un punto $E$ tal que $\frac{DE}{DB}=\frac{1}{3}$.

Sugerencia pre-solución. Hay varias formas de hacer las cuentas en este problema, pero el uso de una notación adecuada te hará simplificar muchas operaciones.

Solución. Pensemos a los puntos de la figura como vectores. Coloquemos al punto $A$ en el origen. El punto $C$ está dado por $B+D$, de modo que $$F:=\frac{C+D}{2}=\frac{B+2D}{2}.$$

Vectores en geometría: problema de paralelogramo
Figura auxiliar para problema de paralelogramo

Para encontrar al punto $E$, notemos que está en las rectas $AF$ y $BD$. De esta forma, deben existir reales $r$ y $s$ tales que $$E=rF$$ y $$E=sB+(1-s)D.$$ Expresando $F$ en términos de $B$ y $D$ en la primer ecuación, tenemos que $$E=\frac{rB+2rD}{2}=\frac{rB}{2}+rD.$$ De ambas expresiones para $E$, concluimos que
\begin{align*}
s=\frac{r}{2}\\
1-s=r.
\end{align*}

Este sistema de ecuaciones tiene solución $r=\frac{2}{3}$, $s=\frac{1}{3}$, y por lo tanto $E=\frac{B+2D}{3}$. De aquí se obtiene $\frac{DE}{EB}=\frac{1}{2}$, o bien $\frac{DE}{DB}=\frac{DE}{DE+EB}=\frac{1}{3}$, como queríamos mostrar.

$\square$

Producto punto, norma y ángulos

Para dos vectores $P=(x,y)$ y $Q=(w,z)$ definimos su producto punto como la cantidad $P\cdot Q = xw+yz$. El productos puntos es:

  • Conmutativo: $P\cdot Q = Q\cdot P$
  • Abre sumas: $P\cdot (Q+R)=P\cdot Q + P\cdot R$
  • Saca escalares: $(rP)\cdot Q = r(P\cdot Q)$.

La norma de $P$ se define como $\norm{P}=\sqrt{P\cdot P}$, y coincide con la distancia de $P$ al origen. La norma de $PQ$ es entonces $\norm{PQ}=\sqrt{(Q-P)\cdot (Q-P)}$ y coincide con la distancia de $P$ a $Q$.

El ángulo entre dos vectores $PQ$ y $RS$ se define como el ángulo cuyo coseno es $$\frac{PQ \cdot RS}{\norm{PQ}\norm{RS}},$$ y coincide precisamente con el ángulo (orientado) geométrico entre las rectas $PQ$ y $RS$. De esta forma, las rectas $PQ$ y $RS$ son perpendiculares si y sólo si el producto punto $PQ\cdot RS$ es cero.

Problema. Sea $ABC$ un triángulo con sus vértices pensados como vectores. Sean $H$ y $O$ su ortocentro y circuncentro respectivamente. Supongamos que el circuncentro $O$ está en el origen. Muestra que $H=A+B+C$.

Sugerencia pre-solución. Trabaja hacia atrás. Define al punto $A+B+C$ y ve que las rectas que unen a los vértices con este punto en efecto son alturas. Para calcular los ángulos, usa el producto punto y sus propiedades.

Solución. Como el circuncentro equidista de $A$. $B$ y $C$, tenemos que $$\norm{A}=\norm{B}=\norm{C}.$$ Tomemos el punto $H’=A+B+C$.

Vectores en geometría para encontrar el ortocentro
Ortocentro con vectores

Calculemos el ángulo entre las rectas $BC$ y $AH’$, haciendo su producto punto:
\begin{align*}
BC\cdot AH’ &= (C-B)\cdot (H’-A)\\
&=(C-B)\cdot(C+B)\\
&=C\cdot C + C\cdot B – B\cdot C – B\cdot B\\
&=\norm{C}^2 – \norm{B}^2\\
&=0.
\end{align*}

Observa que estamos usando la linealidad y conmutatividad del producto punto. Al final usamos que $A$ y $C$ tienen la misma norma.

Esto muestra que la recta $AH’$ es la altura al lado $BC$. De manera análoga, $BH’$ y $CH’$ son las alturas a los lados $CA$ y $AB$ respectivamente. Por lo tanto, $H’$ es el ortocentro, así que $H=A+B+C$.

$\square$

Cualquier triángulo $ABC$ en el plano se puede trasladar para que su circuncentro $O$ quede en el origen. El ortocentro estará en $H=A+B+C$ y el gravicentro, como vimos antes, en $G=\frac{A+B+C}{3}$, que es un múltiplo escalar de $H$. Por lo tanto, $O$, $H$ y $G$ están alineados. Acabamos de demostrar con vectores en geometría un clásico resultado euclideano.

Teorema (recta de Euler). En cualquier triángulo $ABC$, el circuncentro $O$, el gravicentro $G$ y el ortocentro $H$ están alineados. Además, $$\frac{OG}{GH}=\frac{1}{2}.$$

Teorema de la recta de Euler
Teorema de la recta de Euler

Si el circuncentro no está en el origen, ahora podemos usar el teorema de la recta de Euler y la proposición de la razón para concluir que $G=\frac{2O+H}{3}$. Usando que $G=\frac{A+B+C}{3}$, obtenemos el siguiente corolario

Corolario. Sea $ABC$ un triángulo en el plano, $H$ su ortocentro y $O$ su circuncentro. Entonces al pensar a los puntos como vectores tenemos que $$A+B+C=2O+H.$$

Más problemas

Puedes encontrar más problemas del uso de vectores en geometría en la sección 8.3 del libro Problem Solving through Problems de Loren Larson.

Álgebra Superior II: Continuidad y diferenciabilidad de polinomios reales

Por Leonardo Ignacio Martínez Sandoval

Introducción

Al inicio de esta unidad, hablamos de las propiedades algebraicas de $\mathbb{R}[x]$, definimos sus operaciones y argumentamos por qué se puede usar la notación de potencias. Luego hablamos de las propiedades aritméticas de los polinomios cuando hablamos de divisibilidad, máximo común divisor y factorización en irreducibles. Vimos una aplicación de esto a la solución de desigualdades. Lo que queremos hacer ahora es pensar a los polinomios como funciones de $\mathbb{R}$ en $\mathbb{R}$ y entender las propiedades analíticas que tienen, es decir en términos de cálculo. Nos interesa saber qué les sucede cuando su entrada es grande, la continuidad y la diferenciabilidad de polinomios.

Estas propiedades tienen consecuencias algebraicas importantes. La continuidad de polinomios nos permite encontrar raíces reales en ciertos intervalos. La diferenciabilidad de polinomios nos ayuda a encontrar la multiplicidad de las raíces. Supondremos que manejas conocimientos básicos de cálculo y de manipulación de límites, pero de cualquier forma recordaremos algunas definiciones y daremos esbozos de la demostración de algunos resultados.

Límites a reales y límites a infinito

Recordemos dos definiciones de cálculo, que se aplican para funciones arbitrarias definidas en todos los reales.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función y $a, b$ reales. Decimos que $$\lim_{x\to a} f(x) = b$$ si para todo $\epsilon >0$ existe un $\delta > 0 $ tal que cuando $0<|x-a|<\delta$, entonces $|f(x)-b|<\epsilon$. En palabras, decimos que el límite de $f$ cuando $x$ tiende a $a$ es $b$.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función. Decimos que $$\lim_{x\to \infty} f(x) = \infty$$ si para todo $M>0$ existe un $r > 0 $ tal que cuando $x>r$, entonces $f(x)>M$. En palabras, decimos que el límite de $f$ cuando $x$ tiende a infinito es infinito.

De manera análoga se pueden definir límites cuando $x$ tiende a menos infinito, y definir qué quiere decir que el límite sea menos infinito. La siguiente proposición se prueba en textos de cálculo.

Proposición (propiedades de límites). Sean $f:\mathbb{R}\to \mathbb{R}$ y $g:\mathbb{R}\to \mathbb{R}$ funciones y $a$, $b$, $c$ reales. Si $$\lim_{x\to a} f(x) = b \quad \text { y } \quad \lim_{x\to a} g(x)= c,$$ entonces:

  • «El límite de la suma es la suma de los límites», en símbolos, $$\lim_{x\to a} (f+g)(x) = b+c.$$
  • «El límite del producto es el producto de los límites», en símbolos, $$\lim_{x\to a} (fg)(x)=bc.$$

La proposición anterior es sólo para cuando los límites son reales. Hay resultados para cuando algunos de los límites son infinitos, pero en general hay que tener cuidado.

La primer propiedad analítica de los polinomios es saber cómo es su comportamiento cuando $x$ se hace infinito o menos infinito. Si el polinomio es constante, entonces este límite es simplemente su valor en cualquier punto. Para polinomios de grado mayor o igual a $1$, su comportamiento queda resumido en la siguiente proposición.

Proposición (límites a infinito). Tomemos al polinomio $p(x)$ en $\mathbb{R}[x]$ dado por $$p(x)=a_0+a_1x+a_2x^2+\ldots+a_nx^n,$$ en donde $n\geq 1$ y $a_n\neq 0$.

  • Si $a_n>0$ y $p(x)$ es de grado par entonces $$\lim_{x\to \infty} p(x) = \lim_{x\to-\infty} p(x)= \infty,$$
  • Cuando $a_n>0$ y $p(x)$ es de grado impar entonces $$\lim_{x\to \infty} p(x) = \infty \quad \text { y } \quad \lim_{x\to -\infty} p(x)=-\infty$$
  • Si $a_n<0$ y $p(x)$ es de grado par entonces $$\lim_{x\to \infty} p(x) = \lim_{x\to-\infty} p(x)= -\infty,$$
  • Cuando $a_n<0$ y $p(x)$ es de grado impar entonces $$\lim_{x\to \infty} p(x) = -\infty \quad \text { y } \quad \lim_{x\to -\infty} p(x)=\infty.$$

Demostración. Vamos a hacer una de las demostraciones. Mostraremos que para cuando $a_n>0$ y el grado es par, entonces $$\lim_{x\to \infty} p(x) = \infty.$$ Las demás se siguen haciendo cambios de signo cuidadosos y usando que una potencia impar de un real negativo es un real negativo, y una potencia par es siempre un real positivo. Pensar en estas demostraciones queda como tarea moral.

Tomemos entonces $p(x)$ un polinomio de grado par y con coeficiente principal $a_n>0$. Intuitivamente, tenemos que mostrar que si $x$ es muy grande, entonces $p(x)$ es tan grande como queramos. Tomemos un real $M>0$. Como haremos $x$ grande, podemos suponer que $x>1$.

Como el término $a_nx^n$ es positivo, basta mostrar como resultado auxiliar que si $x$ es suficentemente grande, entonces $$a_nx^n >M+|a_0+a_1x+\ldots+a_{n-1}x^{n-1}|,$$ ya que si esto sucede, tendríamos que:
\begin{align*}
a_nx^n&>M+|a_0+a_1x+\ldots+a_{n-1}x^{n-1}|\\
&=M+|-a_0-a_1x-\ldots-a_{n-1}x^{n-1}|\\
&>M-a_0-a_1x-\ldots-a_{n-1}x^{n-1},
\end{align*}

y de aquí, pasando todo excepto a $M$ a la izquierda, tendríamos $p(x)>M$.

Para probar el resultado auxiliar, tomemos $A$ como el máximo de los valores absolutos $|a_0|,\ldots,|a_{n-1}|$. Por la desigualdad del triángulo y usando $x>1$ tenemos que

\begin{align*}
M+|a_0&+a_1x+\ldots+a_{n-1}x^{n-1}|\\
&\leq M+|a_0|+|a_1 x| + \ldots + |a_{n-1}x^{n-1}|\\
&\leq M+A(1+x+\ldots+x^{n-1})\\
&< M+nA\\
&<(M+nA)x^{n-1}
\end{align*}

De esta forma, para mostrar nuestra desigualdad auxiliar basta mostrar que para $x$ suficientemente grande, tenemos que $(M+nA)x^{n-1}<a_nx^n$. Pero como $x>0$, esta desigualdad es equivalente a $x>\frac{M+nA}{a_n}$.

Recapitulando, para cualquier $M>0$, si $x>\frac{M+nA}{a_n}$, entonces $p(x)>M$. Esto termina la demostración.

$\square$

Podemos usar la proposición anterior para comparar polinomios cuando su variable tiende a infinito.

Ejemplo. Mostraremos que existe una $M$ suficientemente grande tal que si $x>M$, entonces $$\frac{1}{2}x^7-x^6-x-1>x^6+1000x^5+1000000.$$ Pasando todo del lado izquierdo, nos queda la desigualdad equivalente $$\frac{1}{2}x^7-2x^6-1000x^5-x-999999>0.$$ Aquí tenemos un polinomio $p(x)$ de grado impar y coeficiente principal positivo. Por la proposición anterior, $\lim_{x\to \infty} p(x) = \infty$, de modo que la $M$ que estamos buscando existe.

$\triangle$

Continuidad de polinomios

Antes de llegar a diferenciabilidad de polinomios, haremos un paso intermedio. Recordemos otra definición de cálculo.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función y $a$ un real. Decimos que $f$ es continua en $a$ si $$\lim_{x\to a} f(x) = f(a).$$ Decimos que $f$ es continua si es continua en todo real.

Por la proposición de propiedades de límites, la suma o producto de funciones continuas es continua. Las funciones constantes son continuas. La función identidad $I:\mathbb{R}\to \mathbb{R}$ dada por $I(x)=x$ es continua. Estos tres hechos nos ayudan a demostrar que todos los polinomios son funciones continuas sin tener que recurrir a la definición de límite.

Teorema. Cualquier polinomio $p(x)$ en $\mathbb{R}[x]$ pensado como una función $p:\mathbb{R}\to \mathbb{R}$ es una función continua.

Demostración. Supongamos que $p(x)$ está dado por $$p(x)=a_0+a_1x+\ldots+a_nx^n.$$

Para toda $i$ de $0$ a $n$ tenemos que la función $x\mapsto a_i$ es constante y por lo tanto es continua. Si $i>0$, la función $x\mapsto x^i$ es producto de $i$ veces la identidad consigo misma. Como la identidad es continua y producto de continuas es continua, entonces $x\mapsto x^i$ es continua.

De nuevo, usando que producto de funciones continuas es continua, tenemos que $x\mapsto a_ix^i$ es una función continua. De esta forma, $p(x)$ es la suma de $n+1$ funciones continuas, y por lo tanto es una función continua.

$\square$

El resultado anterior nos ayuda a usar teoremas versátiles de cálculo en nuestro estudio de polinomios. Recordemos el teorema del valor intermedio.

Teorema (del valor intermedio). Sea $f:\mathbb{R}\to \mathbb{R}$ una función continua. Sean $a<b$ dos reales. Entonces entre $a$ y $b$, la función $f$ toma todos los valores entre $f(a)$ y $f(b)$.

Veamos cómo el teorema del valor intermedio nos permite encontrar raíces de polinomios.

Problema 1. Muestra que el polinomio $p(x)=x^7-5x^5+x^2+3$ tiene por lo menos una raíz en el intervalo $[0,2]$.

Solución. Al evaluar al polinomio en cero, obtenemos $p(0)=3$. Al evaluarlo en $2$, obtenemos
\begin{align*}
p(2)&=2^7-5\cdot 2^5+x^2 + 3\\
&=128-160+4+3\\
&=-25.
\end{align*}

Como los polinomios son funciones continuas, podemos aplicar el teorema del valor intermedio. Concluimos que $p(x)$ toma todos los valores de $-25$ a $2$ en el intervalo $[0,2]$. En particular, existe un real $r$ en $[0,2]$ tal que $p(r)=0$.

$\triangle$

El teorema del valor intermedio nos ayuda a demostrar que un polinomio tiene una raíz en cierto intervalo. Sin embargo, no es de tanta utilidad para decir exactamente cuál es esa raíz. Es un resultado existencial en vez de ser constructivo. Veamos un ejemplo más, que muestra una proposición que quedó pendiente en una entrada anterior.

Problema 2. Sea $p(x)$ un polinomio cuadrático, mónico e irreducible en $\mathbb{R}[x]$. Muestra que $p(r)>0$ para todo real $r$.

Solución. Procedamos por contradicción. Supongamos que $p(r)\leq 0$ para algún real $r$.

Como $p(x)$ es mónico, su coeficiente principal es $1$, que es positivo. Como $p(x)$ es cuadrático, es de grado par. Por la proposición de límites a infinito, existe un real $t>r$ tal que $p(t)>0$. Por el teorema del valor intermedio, existiría un real $s$ en el intervalo $[r,t]$ tal que $p(s)=0$. Pero esto es imposible, pues entonces por el teorema del factor $x-s$ divide a $p(x)$ y esto contradice que $p(x)$ es irreducible.

$\triangle$

Como muestra el problema anterior, se pueden combinar los límites de polinomios a infinito y menos infinito, y sus propiedades de continuidad. Otra aplicación es mostrar que todo polinomio de grado impar tiene por lo menos una raíz real. Esto se verá en otra entrada.

Por supuesto, otros resultados de continuidad también se pueden usar en todos los polinomios, como el teorema del valor extremo. Aplicándolo directamente, concluimos lo siguiente.

Proposición. Sean $a<b$ reales y $p(x)$ un polinomio en $\mathbb{R}$. Entonces $p(x)$ está acotado en el intervalo $[a,b]$ y existen reales $r$ y $s$ en dicho intervalo tales que $p(r)$ y $p(s)$ son el mínimo y máximo de $p(x)$ en $[a,b]$, respectivamente.

Diferenciabilidad de polinomios

Es momento de hablar de diferenciabilidad de polinomios. Recordemos una última definición de cálculo.

Definición. Sea $f:\mathbb{R}\to \mathbb{R}$ una función. Decimos que $f$ es diferenciable en $a$ si el límite $$\lim_{h\to 0} \frac{f(a+h)-f(a)}{h}$$ existe. En este caso, a ese límite lo denotamos por $f'(a)$. Una función es diferenciable si es diferenciable en todo real. A la función $f’:\mathbb{R}\to \mathbb{R}$ le llamamos la derivada de $f$.

Al igual que en el caso de continuidad, la suma y producto de funciones diferenciales es diferenciable. Si $f:\mathbb{R}\to \mathbb{R}$ y $g:\mathbb{R}\to \mathbb{R}$ son diferenciables, entonces la derivada de $f+g$ está dada por $$(f+g)'(x)=f'(x)+g'(x)$$ y la derivada de $fg$ está dada por la regla de la cadena $$(fg)'(x)=f'(x)g(x)+f(x)g'(x).$$

Las funciones constantes son diferenciables, y su derivada es la función constante $0$. La función identidad es diferenciable, y su derivada es la función constante $1$. Esto es sencillo de mostrar y queda como tarea moral.

Proposición. Sea $n\geq 1$ un entero. El polinomio $p(x)=x^n$ es diferenciable, y su derivada es la función $p'(x)=nx^{n-1}$.

Demostración. Haremos la prueba por inducción. Si $n=1$, el polinomio es $p(x)=x$, y su derivada es $p'(x)=1=1\cdot x^0$, como queremos. Supongamos que el resultado es cierto para el entero $n\geq 1$ y tomemos $p(x)=x^{n+1}=x^n\cdot x$. Por hipótesis inductiva, $x\mapsto x^n$ es diferenciable. Como $p(x)$ es producto de dos funciones diferenciables, entonces es diferenciable.

Usando la regla de la cadena, la hipótesis inductiva de la fórmula y la derivada de $x\mapsto x$, tenemos que $$p'(x)=(nx^{n-1})(x)+(x^n)(1)=(n+1)x^n.$$ Esto termina la demostración.

$\square$

Con todos estos ingredientes podemos mostrar la diferenciabilidad de todos los polinomios. Los detalles quedan como tarea moral.

Teorema (diferenciabilidad de polinomios). Sea $p(x)$ un polinomio en $\mathbb{R}[x]$ dado por $$p(x)=a_0+a_1x+\ldots+a_nx^n,$$ Entonces $p(x)$ pensado como función es diferenciable y su derivada es un polinomio. Si $p(x)$ es constante, su derivada es el polinomio $0$. En otro caso, su derivada es el polinomio $$a_1+2a_2x+3a_3x^2+\ldots+na_nx^{n-1}.$$

Ejemplo. El polinomio $x^7+3x^2-1$ es diferenciable. Su derivada es el polinomio $7x^6+6x$.

$\triangle$

Ya que sabemos que los polinomios son diferenciables, podemos usar todas las herramientas de cálculo diferencial, como:

No profundizaremos en esto, pues es el contenido de un buen curso de cálculo, o bien de material de algún texto en el área, como el libro de Cálculo de Spivak.

A nosotros nos interesa una consecuencia algebraica de que los polinomios tengan derivada. Como la derivada de un polinomio es otro polinomio, entonces la derivada es diferenciable. Por ello, un polinomio $p(x)$ se puede derivar iteradamente tantas veces como se quiera. Al polinomio obtenido de derivar $n$ veces le llamamos la $n$-ésima derivada y lo denotamos por $p^{(n)}(x)$. En la siguiente entrada veremos cómo la repetida diferenciabilidad de polinomios nos ayuda a detectar la multiplicidad de sus raíces.

Más adelante…

En la siguiente sección nos encargaremos de realizar varios problemas para repasar las definiciones y propiedades que acabamos de enunciar, y posteriormente ocuparemos todo lo aprendido para explotar el conocimiento que tenemos de los polinomios.

En particular, nos será útil el concepto de diferenciabilidad pues con este podemos dar una definición precisa de lo que significa que la raíz de un polinomio sea múltiple.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  1. Estudia el resto de los casos de la proposición de límites de polinomios cuando la entrada va a menos infinito y a infinito.
  2. Muestra usando la definición de límite que las funciones constantes y la función identidad son continuas.
  3. Demuestra por definición que las funciones constantes son diferenciables y que su derivada es la función constante $0$. Demuestra por definición que la función identidad es diferenciable y que su derivada es la función constante $1$.
  4. Muestra que existe un real $x$ en el cual los polinomios $p(x)=x^5+x^3+x$ y $q(x)=100x^4+10x^2$ son iguales. Sugerencia. Reescribe esta igualdad en términos de encontrar una raíz de un sólo polinomio.
  5. Completa los detalles del teorema de diferenciabilidad de polinomios.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104522 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM – Etapa 2»

Álgebra Lineal I: Eigenvalores y eigenvectores de transformaciones y matrices

Por Leonardo Ignacio Martínez Sandoval

Introducción

En entradas anteriores ya establecimos los fundamentos para hablar de determinantes. Dimos su definición para el caso de vectores y el caso de matrices/transformaciones lineales. Enunciamos y demostramos varias de sus propiedades. Luego dedicamos toda una entrada a ver formas de calcularlos. Finalmente, vimos que nos pueden ayudar para entender mucho mejor a los sistemas de ecuaciones lineales. Entender bien estos conceptos te será de gran utilidad en tu formación matemática.

Además, los determinantes son un paso natural en uno de nuestros objetivos del curso: entender por qué las matrices simétricas reales son diagonalizables. Recuerda que una matriz $A$ en $M_n(F)$ es diagonalizable si existe una matriz diagonal $D$ y una matriz invertible $P$, ambas en $M_n(F)$, de modo que $$A=P^{-1}DP.$$

Lo que haremos en esta entrada es hablar de esos valores que aparecen en la matriz diagonal $D$ en el caso de que $A$ sea diagonalizable. Resulta que estos valores están relacionados con una pregunta muy natural en términos de lo que le hace la matriz a ciertos vectores. Y mejor aún, como veremos, hay un método para encontrar estos valores por medio de un determinante. Vamos poco a poco.

Eigenvalores y eigenvectores para transformaciones lineales

Sea $V$ un espacio vectorial sobre un campo $F$ y sea $T:V\to V$ una transformación lineal. Para fijar ideas, pensemos en $\mathbb{R}^n$ por el momento. A veces, $T$ simplemente la cambia la magnitud a un vector, sin cambiarle la dirección. Es decir, hay algunos vectores para los cuales $T$ se comporta simplemente como la multiplicación por un escalar. En símbolos, hay vectores $v$ tales que existe un valor $\lambda$ tal que $T(v)=\lambda v$.

Por supuesto, al vector $0$ siempre le pasa esto, pues como $T$ es lineal, se tiene que $T(0)=0=\lambda\cdot 0$ para cualquier escalar $\lambda$. Resulta que cuando se estudian estos vectores y escalares especiales, lo más conveniente es quitar al vector $0$ de la discusión. Estas ideas llevan a la siguiente definición.

Definición. Un eigenvalor de una transformación lineal $T:V\to V$ es un escalar $\lambda$ tal que $\lambda \text{id} – T$ no es invertible. En otras palabras, $\lambda$ es un escalar tal que existe un vector no cero en el kernel de $\lambda \text{id} – T$. A un vector $v\neq 0$ en $V$ tal que $$(\lambda \text{id} – T)v=0,$$ se le conoce como un eigenvector de $T$.

En otras palabras, $v$ es un eigenvector correspondiente a $T$ si $v$ no es cero y $T(v)=\lambda v$. A los eigenvalores y eigenvectores de $T$ también se les conoce en la bibliografía como valores propios y vectores propios de $T$.

Observa que si al conjunto de eigenvectores para un eigenvalor $\lambda$ le agregamos el vector $0$, entonces obtenemos el kernel de una transformación lineal, que sabemos que es un subespacio vectorial.

Veamos un par de ejemplos para que queden más claras las ideas.

Ejemplo 1. Consideremos a la transformación lineal $T:\mathbb{R}^3\to \mathbb{R}^3$ dada por $$T(x,y,z)=(-2x+15y+18z,3y+10z,z).$$

Observa que
\begin{align*}
T(1,0,0)&=(-2,0,0)\\
&=-2(1,0,0),
\end{align*}

que
\begin{align*}
T(-19,-5,1)&=((-2)(-19)+15(-5)+18,3(-5)+10, 1)\\
&=(28+75-18,-15+10,1)\\
&=(-19,-5,1),
\end{align*}

y que

\begin{align*}
T(3,1,0)&=(-6+15,3,0)\\
&=(9,3,0)\\
&=3(3,1,0).
\end{align*}

Estas igualdades muestran que $(1,0,0)$ es un eigenvector de $T$ con eigenvalor $-2$, que $(-19,-5,1)$ es un eigenvector de $T$ con eigenvalor $1$ y $(3,1,0)$ es un eigenvector de $T$ con eigenvalor $3$.

$\triangle$

Ejemplo 2. Consideremos al espacio vectorial $\mathbb{R}[x]$ de polinomios con coeficientes reales. Tomemos la transformación lineal $T$ que manda a un polinomio a su segunda derivada. ¿Quiénes son los eigenvalores y eigenvectores de $T$?

Para que $p$ sea un eigenvector con eigenvalor $\lambda$, tiene que suceder que $$p»=T(p)=\lambda p.$$

Como $p$ no es el vector cero, tiene un cierto grado. Si $\lambda \neq 0$, entonces la igualdad anterior no puede suceder, pues si $p$ es de grado mayor o igual a $2$, entonces el grado de $p»$ es menor al de $\lambda p$, y si el grado de $p$ es $0$ ó $1$, su segunda derivada es $0$, y no puede pasar $\lambda p = 0$. Así, el único eigenvalor que puede tener $T$ es $\lambda = 0$. Observa que sí es válido que los eigenvalores sean cero (los eigenvectores no).

Cuando $\lambda = 0$, tiene que pasar que $p»$ sea $0\cdot p$, es decir, el polinomio cero. Los únicos polinomios tales que su derivada es cero son los constantes y los lineales. Pero el polinomio cero por definición no es eigenvector.

Así, la respuesta final es que el único eigenvalor de $T$ es $0$, y sus eigenvectores correspondientes son los polinomios constantes distintos de cero, y los polinomios lineales.

$\triangle$

Eigenvalores y eigenvectores para matrices

Tenemos una definición similar para matrices. Sea $A$ una matriz en $M_n(F)$.

Definición. Un escalar $\lambda$ en $F$ es un eigenvalor de $A$ si la matriz $\lambda I_n – A$ no es invertible. En otras palabras, si existe un vector no cero $X$ en $F^n$ tal que $AX=\lambda X$. A un tal vector $X$ se le conoce como un eigenvector correspondiente al eigenvalor $\lambda$.

En otras palabras, los eigenvalores y eigenvectores de $A$ son exactamente los eigenvalores y eigenvectores de la transformación $T_A:\mathbb{F}^n\to \mathbb{F}^n$ dada por $T_A(v)=Av$.

Además, si elegimos cualquier base $B$ de un espacio de dimensión finita $V$ y $A$ es la matriz de $T$ con respecto a la base $B$, entonces para cualquier escalar $\lambda$ se tiene que $\lambda I_n – A$ es la matriz de $\lambda \text{id} – T$ con respecto a esta misma base. De aquí se deduce que los eigenvalores de $T$ son los mismos que los eigenvalores de $A$. Dos matrices que representan a $T$ difieren sólo en un cambio de base, así que obtenemos el siguiente resultado fundamental.

Proposición. Si $A$ es una matriz en $M_n(F)$ y $P$ es una matriz invertible, entonces $A$ y $P^{-1}AP$ tienen los mismos eigenvalores. En otras palabras, matrices similares tienen los mismos eigenvalores.

En el primer ejemplo tomamos la transformación lineal $T:\mathbb{R}^3\to \mathbb{R}^3$ tal que $$T(x,y,z)=(-2x+15y+18z,3y+10z,z).$$ Su matriz en la base canónica de $\mathbb{R}^3$ es $$A=\begin{pmatrix} -2 & 15 & 18\\ 0 & 3 & 10\\ 0 & 0 & 1 \end{pmatrix}.$$ En el ejemplo vimos que los eigenvalores eran $-2$, $1$ y $3$, que precisamente conciden con las entradas en la diagonal de $A$. Esto no es casualidad. El siguiente resultado muestra esto, y es una primer evidencia de la importancia de los determinantes para encontrar los eigenvalores de una matriz.

Proposición. Si $A$ es una matriz triangular (superior o inferior) en $M_n(F)$, entonces sus eigenvalores son exactamente las entradas en su diagonal principal.

Demostración. Haremos el caso para cuando $A$ es triangular superior. El otro caso queda de tarea moral.

Queremos encontrar los valores $\lambda$ para los cuales la matriz $\lambda I_n – A$ no sea invertible. La matriz $A$ es triangular superior, así que la matriz $\lambda I_n – A$ también, pues las entradas de $A$ se vuelven negativas, y luego sólo se altera la diagonal principal.

Si las entradas diagonales de $A$ son $a_{11},\ldots,a_{nn}$, entonces las entradas diagonales de $\lambda I_n -A$ son $$\lambda – a_{11},\ldots,\lambda-a_{nn}.$$

La matriz $\lambda I_n – A$ no es invertible si y sólo si su determinante es igual a cero. Como es una matriz triangular superior, su determinante es el producto de sus entradas diagonales, es decir, $$\det(\lambda I_n – A) = (\lambda – a_{11})\cdot\ldots\cdot(\lambda – a_{nn}).$$

Este producto es $0$ si y sólo si $\lambda$ es igual a alguna entrada $a_{ii}$. De esta forma, los únicos eigenvalores de $A$ son las entradas en su diagonal.

$\square$

Si $A$ es una matriz diagonalizable, entonces es semejante a una matriz diagonal $D$. Por la proposición anterior, los eigenvalores de $A$ serían entonces las entradas en la diagonal principal de $D$. Esto nos da una intuición muy importante: si acaso pudiéramos encontrar todos los eigenvalores de $A$, entonces eso podría ser un paso parcial hacia diagonalizarla.

Encontrar eigenvalores es encontrar las raíces de un polinomio

La siguiente proposición conecta eigenvalores, polinomios y determinantes.

Proposición. Sea $A$ una matriz en $M_n(F)$. Entonces la expresión $$\det(\lambda I_n – A)$$ está en $F[\lambda]$, es decir, es un polinomio en la variable $\lambda$ con coeficientes en $F$. Además, es de grado exactamente $n$.

Demostración. La fórmula para el determinante
\begin{align*}
\begin{vmatrix}
\lambda – a_{11} & -a_{12} & \ldots & -a_{1n}\\
-a_{21} & \lambda – a_{22} & \ldots & -a_{1n}\\
\vdots & & \ddots & \\
-a_{n1} & -a_{n2} & \ldots & \lambda – a_{nn}
\end{vmatrix}
\end{align*}

en términos de permutaciones nos dice que el determinante es sumas de productos de entradas de $A$. Cada una de las entradas es un polinomio en $F[\lambda]$, ya sea constante, o lineal. Como $F[\lambda]$ es cerrado bajo sumas y productos, esto prueba la primer parte de la afirmación.

Para probar que el grado es exactamente $n$, notemos que cada sumando de la expresión multiplica exactamente $n$ entradas. Como las entradas a lo mucho son de grado uno en $F[\lambda]$, entonces cada sumando es un polinomio de grado a lo más $n$. Hay una única forma que el grado sea $n$: cuando se elige la permutación identidad y entonces se obtiene el sumando $$(\lambda-a_{11})\cdot\ldots\cdot(\lambda-a_{nn}).$$

Esto termina la prueba.

$\square$

La proposición anterior nos asegura entonces que la siguiente definición tiene sentido.

Definición. Para $A$ una matriz en $M_n(F)$, el polinomio característico de $A$ es el polinomio $\chi_A(\lambda)$ en $F[\lambda]$ dado por $$\chi_A(\lambda) = \det(\lambda I_n – A).$$

De esta forma, $\lambda$ es un eigenvalor de $A$ si y sólo si es una raíz del polinomio $\chi_A(\lambda)$. Esto son buenas y malas noticias. Por un lado, nos cambia un problema de álgebra lineal a uno de polinomios, en donde a veces tenemos herramientas algebraicas que nos ayudan a encontrar raíces. Sin embargo, como se ve en cursos anteriores, también hay otros polinomios para los cuales es muy difícil encontrar sus raíces de manera exacta. Lo que salva un poco esa situación es que sí existen métodos para aproximar raíces numéricamente de manera computacional.

A pesar de la dificultad de encontrar raíces, sin duda tenemos consecuencias interesantes de esta conexión. Consideremos como ejemplo el siguiente resultado.

Proposición. Una matriz $A$ en $M_n(F)$ tiene a lo más $n$ eigenvalores distintos. Lo mismo es cierto para una transformación lineal $T:V\to V$ para $V$ un espacio vectorial de dimensión $n$.

Demostración. La matriz $A$ tiene tantos eigenvalores como raíces en $F$ tiene su polinomio característico. Como el polinomio característico es de grado exactamente $n$, tiene a lo más $n$ raíces en $F$.

La parte de transformaciones queda de tarea moral.

$\square$

Ya que encontramos los eigenvalores de una matriz o transformación, es posible que queramos encontrar uno o más eigenvectores correspondientes a ese eigenvalor. Observa que eso corresponde a encontrar una solución no trivial al sistema lineal de ecuaciones homogéneo de la forma $$(I_n-A) X = 0.$$ Para ello ya tenemos muchas herramientas, como hacer reducción Gaussiana.

Terminamos esta entrada con un ejemplo de cómo encontrar los valores propios y vectores propios en un caso concreto.

Problema. Encuentra los eigenvalores de la matriz $$A=\begin{pmatrix}1 & 0 & 0\\ 0 & 0 & -1 \\ 0 & 1 & 0 \end{pmatrix}$$ considerándola como:

  • Una matriz en $M_3(\mathbb{R})$
  • Una matriz en $M_3(\mathbb{C})$.

En el caso de $M_n(\mathbb{R})$, encuentra un eigenvector para cada eigenvalor.

Solución. Para encontrar los eigenvalores, tenemos que encontrar el determinante $$\begin{vmatrix}\lambda – 1 & 0 & 0\\ 0 & \lambda & 1 \\ 0 & -1 & \lambda \end{vmatrix}.$$

Usando expansión de Laplace en la primer columna y haciendo las operaciones, obtenemos que el determinante de $\lambda I_3 – A$ es el polinomio $$(\lambda-1)(\lambda^2+1).$$

Aquí es importante la distinción de saber en qué campo estamos trabajando. Si estamos en $M_3(\mathbb{R})$, la única raíz del polinomio es $1$. Si estamos en $M_3(\mathbb{C})$, obtenemos otras dos raíces: $i$ y $-i$.

Ahora, para cuando $A$ es matriz en $M_3(\mathbb{R})$, necesitamos encontrar un eigenvector para el eigenvalor $1$. Esto equivale a encontrar una solución al sistema de ecuaciones $$(I_3-A)X=0,$$ es decir, a $$\begin{pmatrix}0 & 0 & 0\\ 0 & 1 & 1 \\ 0 & -1 & 1\end{pmatrix}X=0.$$

Una solución para este sistema es $X=(1,0,0)$. Y en efecto, $(1,0,0)$ es eigenvector de $A$ para el eigenvalor $1$ pues no es el vector cero y $$\begin{pmatrix}1 & 0 & 0\\ 0 & 0 & -1 \\ 0 & 1 & 0 \end{pmatrix}\begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix} = \begin{pmatrix} 1 + 0 + 0 \\ 0 + 0 + 0 \\ 0 + 0 + 0 \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}.$$

$\triangle$

Observa que la matriz anterior no es diagonalizable en $M_n(\mathbb{R})$, pues si lo fuera tendría que ser semejante a una matriz diagonal $D$ con entradas $i$ y $-i$ en la diagonal, pero entonces $D$ no sería una matriz en $M_n(\mathbb{R})$. Esto nos da otra intuición con respecto a la diagonalización de una matriz: si acaso una matriz en $M_n(F)$ es diagonalizable, entonces su polinomio característico debe tener puras raíces en $F$. Esta es una condición necesaria, pero aún no es suficiente.

Más adelante…

En esta entrada definimos el concepto de eigenvalor y eigenvector para una transformación lineal y para una matriz; y vimos algunas de las propiedades que cumplen. En la siguiente entrada estudiaremos el concepto de polinomio característico utilizando los conceptos que hemos visto en esta entrada y enunciaremos (sin demostración) dos teoremas muy importantes. Luego, pondremos en práctica lo que hemos estudiado resolviendo algunos ejercicios.

Tarea moral

A continuación hay algunos ejercicios para que practiques los conceptos vistos en esta entrada. Te será de mucha utilidad intentarlos para entender más la teoría vista.

  • En la entrada vimos que los eigenvalores de una transformación $T$ son los eigenvalores de cualquier matriz que la represente. ¿Es cierto que los eigenvectores de $T$ son los eigenvectores de cualquier matriz que lo represente?
  • Muestra que una transformación lineal $T:V\to V$ para $V$ un espacio vectorial de dimensión $n$ tiene a lo más $n$ eigenvalores distintos.
  • Encuentra los eigenvalores de las matrices de permutación.
  • Para un real $\theta\in[0,2\pi)$ se define la matriz $$A(\theta):=\begin{pmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{pmatrix}.$$ Muestra que $A(\theta)$ tiene eigenvalores reales si y sólo si $\theta=0$ \o $\theta=\pi$. Sugerencia: Encuentra el polinomio característico (que es cuadrático) y calcula su discrimintante. Si es negativo, no tiene soluciones reales.
  • Sea $A$ una matriz en $M_n(F)$. Muestra que la matriz transpuesta $^t A$ tiene los mismos eigenvalores que $A$, y de hecho, el mismo polinomio característico que $A$. Sugerencia. Recuerda que una matriz y su transpuesta tienen el mismo determinante.

Entradas relacionadas

Agradecimientos

Trabajo realizado con el apoyo del Programa UNAM-DGAPA-PAPIME PE104721 «Hacia una modalidad a distancia de la Licenciatura en Matemáticas de la FC-UNAM»

Seminario de Resolución de Problemas: Introducción a problemas de geometría y geometría euclideana

Por Leonardo Ignacio Martínez Sandoval

Introducción

En esta semana veremos algunas herramientas para resolver problemas de geometría. Como con otros temas que hemos visto, sería imposible tratar a profundidad el área. En vez de eso, lo que haremos es ver un poco de varias de las herramientas que se pueden usar en la solución de problemas geométricos, comenzando con geometría euclideana. Veremos ideas de lo siguiente:

  • Geometría triángulos y circunferencias
  • Geometría analítica
  • Vectores en geometría
  • Números complejos en geometría
  • Geometría discreta

En esta entrada comenzaremos con la parte de geometría euclideana. Más adelante hablaremos de las demás ideas.

Geometría euclideana

Cuando en geometría nos referimos a una solución por geometría euclideana o geometría sintética nos referimos a un argumento que no use parametrizaciones de los objetos del plano en términos de coordenadas, vectores o complejos. Simplemente usamos conceptos geométricos como ángulos, distancias, semejanza, congruencia, etc. Todas estas se pueden pensar como propiedades que se mantienen invariantes bajo movimientos rígidos del plano. Dentro de los resultados más versátiles del área tenemos los siguientes.

Teorema (de Tales). Tomemos puntos $P$ y $Q$ sobre los lados $AB$ y $AC$ de $\triangle ABC$. Se tiene que $AP/AQ = AB/AC$ si y sólo si la recta $PQ$ es paralela a la recta $BC$.

El teorema de Tales
Teorema de Tales

Teorema (criterios de congruencia). Sean $\triangle ABC$ y $\triangle DEF$ triángulos. Cualquiera de las siguientes condiciones (o sus simétricos) implican que $\triangle ABC$ y $\triangle DEF$ son congruentes:

  • (LLL) $AB=DE$, $BC=EF$ y $CA=FD$
  • (LAL) $AB=DE$, $\angle BAC = \angle EDF$ y $CA=FD$
  • (ALA) $\angle BAC = \angle EDF$, $CA=FD$ y $\angle BCA – \angle EFD$.

Teorema (criterios de semejanza). Sean $\triangle ABC$ y $\triangle DEF$ triángulos. Cualquiera de las siguientes condiciones (o sus simétricos) implican que $\triangle ABC$ y $\triangle DEF$ son semejantes.

  • (LLL) $\frac{AB}{DE}=\frac{BC}{EF}=\frac{CA}{FD}$.
  • (LAL) $\frac{AB}{DE}=\frac{CA}{FD}$ y $\angle BAC = \angle EDF$.
  • (AA) $\angle BAC = \angle EDF$ y $\angle BCA – \angle EFD$.

Veamos un ejemplo en el que se usan estos hechos básicos.

Problema. Sobre los lados $AB$ y $AC$ de un triángulo $ABC$ se construyen cuadrados $ABPQ$ y $ACRS$ como en la figura. Muestra que $CQ=BS$.

Sugerencia pre-solución. En geometría es típico modificar un problema. En vez de intentar medir los segmentos requeridos, es útil preguntarse si forman parte de triángulos que sean congruentes, o que sea pueda ver que son congruentes por algún criterio. Por supuesto, en todo problema de geometría es útil hacer muchas figuras.

Problema de geometría euclidiana con cuadrados
Figura auxiliar para problema de cuadrados en un triángulo.

Solución. Consideremos los triángulos $ABS$ y $AQC$. Tenemos que $AB=AQ$ pues ambos son lados del cuadrado $ABPQ$. De manera similar, $AC=AS$. Finalmente, tenemos que $\angle BAS = \angle QAC$, pues ambos ángulos son iguales a $$90^\circ + \angle BAC.$$

Por esta razón, podemos usar el criterio de congruencia $LAL$ en estos triángulos para concluir que son congruentes. De aquí se concluye que $CQ=BS$, como queríamos.

$\square$

Recordatorio de puntos notables en triángulos

Otro tema relevante para la geometría euclideana es la geometría de triángulos. Tomemos un triángulo $\triangle ABC$. Hay algunos puntos y rectas notables en el triángulo, que se usan en varios problemas. A continuación enunciamos las más importantes.

  • Si $L$, $M$ y $N$ son los puntos medios de $BC$, $CA$ y $AB$, respectivamente, entonces a cada una de las rectas $AL$, $BM$ y $CN$ se le conoce como una mediana. Las medianas de un triángulo concurren en un punto llamado el gravicentro o baricentro, que usualmente se denota por $G$.
Medianas de un triángulo y su gravicentro
Medianas de un triángulo y su gravicentro
  • Si $D$, $E$ y $F$ son las proyecciones desde $A$, $B$, $C$ a los lados $BC$, $CA$ y $AB$ respectivamente, entonces a cada una de las rectas $AD$, $BE$ y $CF$ se le conoce como una altura. Las alturas de un triángulo concurren en un punto llamado el ortocentro, que usualmente se denota por $H$.
Alturas de un triángulo y su ortocentro
Alturas de un triángulo y su ortocentro
  • Las rectas que cortan a la mitad a cada uno de los ángulos internos de $\triangle ABC$ se les conoce como las bisectrices internas del triángulo. Concurren en un punto llamado el incentro, usualmente denotado por $I$. El incentro sirve como centro para la única circunferencia que es tangente a los segmentos $AB$, $BC$ y $CA$.
Bisectrices de un triángulo y su incentro
Bisectrices de un triángulo y su incentro
  • Las rectas perpendiculares a los lados del triángulo y que pasan por sus puntos medios se les llama mediatrices y concurren en un punto llamado el circuncentro, que se suele denotar $O$. Este punto sirve como centro de la única circunferencia que pasa por los tres vértices $A$, $B$ y $C$.
Mediatrices de un triángulo y su circuncentro
Mediatrices de un triángulo y su circuncentro

Veamos las demostraciones de algunas de estas afirmaciones, para repasar algunos argumentos geométricos.

Una idea útil es caracterizar a una recta como el conjunto de puntos que satisfacen cierta propiedad. Por ejemplo, probemos primero la siguiente caracterización de las mediatrices.

Proposición. La recta perpendicular $\ell$ a un segmento $BC$ que pasa por su punto medio $L$ consiste exactamente de los puntos $P$ tales que $PB=PC$.

Demostración. Para ver que cualquier punto en $\ell$ satisface esto, se puede usar el criterio LAL de congruencia en los triángulos $PBL$ y $PCL$, usando el ángulo recto que comparten. Para ver que cualquier punto tal que $PB=PC$ está en $\ell$, se usa que $\angle PBC = \angle PCB$ (por el triángulo isósceles $PBC$), y entonces al bajar la perpendicular desde $P$ a $BC$ a un punto $L’$, los triángulos $PBL’$ y $PCL’$ comparten dos ángulos (y por lo tanto los tres), de donde se puede usar de nuevo el criterio LAL para concluir que $L=L’$.

$\square$

Demostrar que las mediatrices concurren es entonces muy sencillo. Si $P$ es la intersección de la mediatriz en $BC$ y en $CA$, entonces por el resultado anterior tenemos $PB=PC=PA$, y entonces también por el resultado anterior se tiene que $P$ está en la mediatriz de $AB$. De manera análoga se puede mostrar que una bisectriz consiste de los puntos que equidistan de los lados que la definen, y con ello mostrar que las bisectrices internas de un triángulo concurren.

Veamos ahora un problema de geometría euclideana que involucra a las alturas y a las medianas. Es el Problema 1 del Concurso Nacional de la Olimpiada Mexicana de Matemáticas de 2009.

Problema. Sea $ABC$ un triángulo y $D$ el pie de la altura desde $A$. Con centro en $D$ se traza una circunferencia de radio $DA$. Esta circunferencia corta a los lados $AB$ y $AC$ del triángulo en puntos $P$ y $Q$ respectivamente. Muestra que los triángulos $AQP$ y $ABC$ son semejantes.

Sugerencia pre-solución. Para mostrar que estos triángulos son semejantes, basta con mostrar que tienen ángulos iguales.

Solución. Tracemos además los pies de altura $E$ y $F$ desde $B$ y $C$ respectivamente.

Ángulos creados por alturas de un triángulo.
Ángulos creados por alturas de un triángulo.

Observemos que $\triangle ABD$ y $\triangle CBF$ comparten los ángulos rectos y el ángulo en $B$, de modo que son semejantes y por lo tanto su tercer ángulo es igual. Este y argumentos análogos muestran que
\begin{align*}
\alpha&:=\angle ABE = \angle ACF\\
\beta&:=\angle BAD = \angle BCF\\
\gamma&:= \angle CBE = \angle CAD.
\end{align*}

De esta forma, los ángulos internos de $\triangle ABC$ miden $\angle A= \beta+\gamma$, $\angle B = \gamma+\alpha$ y $\angle C = \alpha+\beta$. Ya que la suma interna de los ángulos de un triángulo es $180^\circ$, concluimos que $\alpha+\beta+\gamma = 90^\circ$.

Ahora, usando los triángulos isósceles $\triangle ADP$ y $\triangle ADQ$ del problema, tenemos que
\begin{align*}
\angle DPA &= \angle DAP = \beta\\
\angle DQA &= \angle DAQ = \gamma.
\end{align*}

Figura auxiliar para el problema
Figura auxiliar para el problema

Como $\triangle PDQ$ también es isósceles con $PD=DQ$, tenemos que $$\alpha’=:\angle DPQ = \angle DQP.$$ Por la suma de ángulos en el triángulo $APQ$, tenemos que $\alpha’+\beta + \gamma = 90^\circ$. Así, $\alpha = \alpha’$. Concluimos entonces que en el $\triangle PAQ$ los ángulos internos son $\angle A = \beta+ \gamma$, $\angle P = \alpha+\beta$ y $\angle Q = \gamma + \alpha$.

De esta forma, los triángulos $ABC$ y $AQP$ son semejantes por el criterio AA.

$\square$

Otra técnica útil para resolver problemas de geometría consiste en mostrar que un punto está en dos rectas notables (por ejemplo, en las medianas $AL$ y $BM$), deducir que entonces es el punto notable correspondiente (en este caso el gravicentro $G$), y usar la información de que entonces la recta por el tercer vértice y el punto es la tercer recta notable (que en el ejemplo diría que $CG$ es la mediana).

Recordatorio de geometría del círculo

Un tercer ingrediente básico para la geometría euclideana es entender qué pasa con las circunferencias. Tomemos una circunferencia $\Gamma$ y dos puntos fijos $A$ y $B$ sobre ella. Tomemos $C$ y $D$ otros dos puntos sobre $\Gamma$ distintos de $A$ y $B$ sobre el mismo arco definido por $A$ y $B$ y sea $E$ otro punto sobre $\Gamma$, en el arco opuesto. Entonces

  • Los ángulos $\angle ACB$ y $\angle ADB$ son iguales.
  • Los ángulos $\angle ACB$ y $\angle AEB$ son suplementarios, es decir, suman $180^\circ$.
Ángulos en cuadriláteros cíclicos
Ángulos en cuadriláteros cíclicos

De hecho, este resultado es un si y sólo si. Para $A$, $B$, $C$, $D$ puntos distintos en el plano:

  • Si $\angle ACB$ y $\angle ADB$ son iguales, entonces $A$, $B$, $C$, $D$ son puntos sobre una circunferencia y $C$ y $D$ están en el mismo arco definido por $A$ y $B$ y
  • Si los ángulos $\angle ACB$ y $\angle ADB$ son suplementarios, entonces $A$, $B$, $C$, $D$ son puntos sobre una circunferencia y $C$ y $D$ están en arcos opuestos definidos por $A$ y $B$.

Cuando $A$, $B$, $C$ y $D$ son puntos distintos que yacen sobre una misma circunferencia, en ese orden, decimos que $ABCD$ es un cuadrilátero cíclico.

Teorema (potencia de un punto). Sea $P$ un punto y $\Gamma$ una circunferencia. Tomemos dos rectas por $P$ que corten a la circunferencia en puntos $A$, $B$, $C$ y $D$ como en alguna de las figuras. Entonces $PA\cdot PB = PC \cdot PD$.

Diagrama para teorema de potencia de un punto
Diagrama para teorema de potencia de un punto

Veamos un problema de la Olimpiada Matemática de la Cuenca del Pacífico en donde confluyen algunas de estas ideas. Es el problema 1 de la edición de 2016.

Problema. Un triángulo $ABC$ es grandioso si para cualquier punto $D$ en el lado $BC$, cuando se toman los pies de las perpendiculares $P$ y $Q$ de $D$ a las rectas $AB$ y $AC$, respectivamente, sucede que la reflexión de $D$ en la recta $PQ$ cae sobre el circuncírculo del triángulo $ABC$.

Muestra que un triángulo $ABC$ es grandioso si y sólo si $\angle A = 90^\circ$ y $AB=AC$.

Sugerencia pre-solución. El problema dice que cierta condición se debe cumplir para todo punto $D$ en el lado $BC$. Considera algunos casos extremos de lo que puede ser $D$, de los que puedas obtener información de cómo debe ser el triángulo.

Solución. Para cualquier punto $D$ en el lado $BC$, vamos a llamar $D’$ a la reflexión de $D$ en la recta $PQ$. Primero veremos que si $ABC$ es grandioso, entonces es isósceles y con ángulo recto en $A$.

Como la hipótesis se cumple para cualquier punto $D$, en particular se cumple para cuando elegimos $D$ como el punto donde la bisectriz desde $A$ intersecta a $BC$. Nota que $P$ y $Q$ están en los rayos $AB$ y $AC$. Además, $P$ y $Q$ son reflexiones entre sí con respecto a la recta $AD$, de modo que $PQ$ es perpendicular a $AD$. Por esto, se tiene que $D’$ está en la recta $AD$, así que o es $A$, o es el segundo punto de intersección de la bisectriz en $A$ con el circuncírculo del triángulo. Como además $APDQ$ es un cuadrilátero cíclico, se tiene que $AD$ intersecta a $PQ$ y por lo tanto $D’=A$.

Imagen auxiliar para problema APMO
Imagen auxiliar para problema APMO

Tenemos entonces las igualdades de ángulos
\begin{align*}
\angle BAC &= \angle PD’Q \\
&= \angle PDQ \\
&= 180^\circ – \angle BAC.
\end{align*}

Concluimos entonces que $\angle BAC = 90^\circ$, que muestra que el triángulo es rectángulo en $A$.

Ahora tomamos a $D$ como el punto medio de $BC$, lo cual hace que $P$ y $Q$ sean los puntos medios de $AB$ y $AC$ respectivamente. Pero entonces $PQ$ es paralelo a $BC$ y por lo tanto $DD’$ es perpendicular a $BC$. La distancia de $D’$ a $BC$ es igual al circunradio del triángulo (pues $D’$ debe caer en el circuncírculo), y es igual a la distancia de $A$ a $BC$. Esto sólo puede suceder cuando $ABC$ es isósceles y con ángulo recto en $A$, como queríamos.

Veamos ahora que si $ABC$ es isósceles y de ángulo recto en $A$, entonces se cumple la propiedad para todo punto $D$ en $BC$. Como $D$ es la reflexión en $PQ$, tendríamos $D’P=DP=BP$. De manera similar, $D’Q=DQ=CQ$.

El cuadrilátero $APDQD’$ es cíclico de diámetro $PQ$, pues todos los ángulos $\angle PAQ$, $\angle PD’Q$ y $\angle PDQ$ son de $90^\circ$. De aquí, $\angle APD’= \angle AQD’$, de donde obtenemos que $\angle BPD’= \angle CQD’$. Con esto concluimos que $\triangle D’PB$ y $\triangle D’QC$ son semejantes. De aquí se sigue que

\begin{align*}
\angle PD’Q &= \angle PD’C+ \angle CD’Q\\
&=\angle PD’C + \angle BD’P\\
&= \angle BD’C.
\end{align*}

Como además tenemos $\frac{D’P}{D’Q}= \frac{D’B}{D’C}$, concluimos que también $\triangle D’PQ$ y $\triangle D’BC$ son semejantes. Pero como $\triangle DPQ$ y $\triangle D’PQ$ son congruentes, se obtiene que $$\angle BD’C=\angle PD’Q = \angle PDQ = 90^\circ.$$ Con esto concluimos que $D’$ yace en la circunferencia de diámetro $BC$, que es precisamente el circuncírculo de $\triangle ABC$.

$\square$

Más problemas

Puedes encontrar más problemas de geometría euclideana en la sección 8.1 del libro Problem Solving through Problems de Loren Larson. Para tener buenos fundamentos en geometría euclideana, se pueden revisar algunos textos en el área, como los cuadernos de la Olimpiada Mexicana de Matemáticas de Geometría y de Geometría: Ejercicios y problemas.