Archivo de la etiqueta: geometría

Cálculo Diferencial e Integral III: Diferenciabilidad en campos vectoriales

Por Alejandro Antonio Estrada Franco

Introducción

Después de haber abordado a modo de repaso las herramientas que usaremos de álgebra lineal, estamos listos para estudiar la diferenciabilidad en funciones más generales. Ya estudiamos la diferenciabilidad en curvas (funciones $f:S\subseteq \mathbb{R}\to \mathbb{R}^m$) y en campos escalares (funciones $f:S\subseteq \mathbb{R}^n \to \mathbb{R}$). Ahora podemos estudiar la diferenciabilidad en campos vectoriales, que recuerda que ahora sí son funciones $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ para cualesquiera $m$ y $n$ enteros positivos.

Intuición de diferenciabilidad en campos vectoriales

Con anterioridad, hemos discutido la intuición geométrica de lo que quiere decir que un campo escalar $f:\mathbb{R}^n\to \mathbb{R}$ sea diferenciable. A grandes rasgos, estamos pidiendo que cerca de un punto $\bar{a}$ la función $f(\bar{a})$ cambie «como una función lineal». Esto quiere decir que la gráfica de la función se parece mucho a un hiperplano en $\mathbb{R}^{n+1}$ cerca del punto $\bar{a}$, tanto que de hecho podemos dar un hiperplano tangente a la gráfica en $\bar{a}$. Bajo suficiente regularidad, esta función lineal estaba dada por las derivadas parciales y estaba muy relacionada con el gradiente $\triangledown f$.

La situación para campos vectoriales es parecida. Si tenemos una función $f:\mathbb{R}^n\to \mathbb{R}^m$, entonces está dada por funciones coordenada que la expresan de la manera $f(\bar{x})=(f_1(\bar{x}),\ldots,f_m(\bar{x}))$ para cada $\bar{x}\in \mathbb{R}^n$. La diferenciabilidad que buscaremos ahora deberá suceder coordenada a coordenada, y por ello lo que pensaremos como derivada tendrá algo así como un gradiente por cada coordenada. Esto nos daría $m$ gradientes, pero una mejor forma de pensar en resumen a la derivada es como una transformación lineal $T:\mathbb{R}^n\to \mathbb{R}^m$ que nos diga con mucha precisión cuándo cambia la funciíon $f$ (cuando esto sea posible).

Para tener clara idea de lo que queremos hacer recordemos el ejemplo de campos escalares, y de aquí construiremos una generalización a campos vectoriales: Observa la Figura $1$. A la izquierda, hemos dibujado dos copias de $\mathbb{R}^n$ (pero que puedes pensar como $\mathbb{R}^2$). A la derecha, hemos dibujado la gráfica de dos funciones. Una es una función cualquiera $f:\mathbb{R}^{n}\rightarrow \mathbb{R}^m$. La otra es una transformación lineal $T:\mathbb{R}^{n}\rightarrow \mathbb{R}^m$ que ha sido trasladada sobre el plano $xy$ y sobre el eje $z$ con la función $G(\bar{v})=T(\bar{v}-\bar{a})+f(\bar{a})$. Estas gráficas son objetos en $\mathbb{R}^n \times \mathbb{R}^m$ (ponemos un punto por cada pareja $(\bar{x},f(\bar{x}))$ con $\bar{x}\in \mathbb{R}^n$).

Como $T$ es lineal, cumple $T(\bar{0})=0$. Al hacer la traslación, obtenemos $G(\bar{a})=T(\bar{0})+f(\bar{a})=f(\bar{a})$. Así, $T$ traslada un subespacio $H$ de dimensión $n$ a un subespacio afín de dimensión $n$ que pasa por $f(\bar{a})$. Lo que buscaremos al pedir que la función $f$ sea diferenciable con derivada $T$ es que la gráfica de $f$ se parezca mucho a este subespacio $H+f(\bar{a})$, tanto que de hecho dicho subespacio lo podremos pensar como tangente a la gráfica en el punto $(\bar{a},f(\bar{a}))$.

Figura 1

Definición de diferenciabilidad para campos vectoriales

¿Cuál es la condición algebraica que pediremos? Será muy similar a lo que pasaba en campos escalares. Lo que queremos es que el cambio $f(\bar{a}+\bar{v})-f(\bar{a})$ se parezca mucho a $T(\bar{v})$ cuando $\bar{v}$ es pequeño. De hecho, tiene que parecerse tanto, tanto, que $f(\bar{a}+\bar{v})-f(\bar{a})$ debe parecerse a $T(\bar{v})$ más rápido de lo que $\bar{v}$ se va a $\bar{0}$. Esto nos lleva a plantear que la condición buscada sea la siguiente:

$$\lim_{\bar{v}\to \bar{0}}\frac{||(f(\bar{a}+\bar{v})-f(\bar{a}))-T(\bar{v})||}{||\bar{v}||}=0.$$ La Figura $2$ tiene un diagrama que ayuda a entender esto un poco mejor. Queremos que la flecha indicada en amarillo acabe muy cerca de $f(\bar{a}+\bar{v})$.

El vector $T(\bar{v}-\bar{a})+f(\bar{a})$ es el vector $T(\bar{v})$ transportado hasta el plano tangente el cual está en color rosa. La idea es que $f(\bar{a}+\bar{v})-f(\bar{a})$, que es el vector señalado con amarillo abajo, se aproxime mucho en el sentido señalado por el límite mencionado en el párrafo de arriba. De esta manera tenemos la mejor aproximación lineal. Esta definición se inspira en el polinomio de Tylor de grado 1 para funciones de una variable real.

Por supuesto, la discusión que hemos tenido sólo aplica para cuando estamos trabajando cerca del punto $\bar{a}$, así que más bien la transformación lineal de la que estamos hablando dependerá del punto $\bar{a}$. Todo esto nos lleva a nuestra primera definición formal de diferenciabilidad.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Decimos que $f$ es diferenciable en $\bar{a}\in Int(S)$ si existe una transformación lineal $T_{\bar{a}}:\mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ tal que

$$\lim_{\bar{v}\to \bar{0}}\frac{||f(\bar{a}+\bar{v})-f(\bar{a})-T_{\bar{a}}(\bar{v})||}{||\bar{v}||}=0.$$

En este caso, a $T_{\bar{a}}$ le llamamos la derivada de $f$ en el punto $\bar{a}$.

Antes de empezar a demostrar propiedades de esta noción, nos conviene tener una versión alternativa y totalmente equivalente.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Decimos que $f$ es diferenciable en $\bar{a}\in Int(S)$ si existe una transformación lineal $T_{\bar{a}}:\mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ y una función $E:\mathbb{R}^n\times \mathbb{R}^n\to \mathbb{R}^m$ de manera que $$f(\bar{a}+\bar{v})=f(\bar{a})+T_{\bar{a}}(\bar{v})+||\bar{v}||E(\bar{a};\bar{v})$$ con $$\lim_{||\bar{v}||\to 0}E(\bar{a};\bar{v})=0.$$

Esta definición es equivalente a la anterior pues si despejamos tenemos: \[E(\bar{a};\bar{v})=\frac{f(\bar{a}+\bar{v})-f(\bar{a})-T_{\bar{a}}(\bar{v})}{||\bar{v}||},\] de donde se puede verificar que se cumple una definición si y sólo si se cumple la otra. Los detalles quedan como tarea moral.

Ejemplo. Consideremos la función $f(x,y)=(x^2y^2,xy)$ y tomemos el punto $a=(1,1)$. ¿Será $f$ diferenciable en $a$? Afirmamos que sí, que la función lineal $T_a(x,y)=(2x+2y, x+y)$ cumple con la definición de límite que se pide. Veamos esto en la primera versión de la definición. Tendríamos, usando $\bar{v}=(h,k)$, que

\begin{align*}
f((1,1)&+(h,k))-f(1,1)-T_a(h,k)\\
&=((h+1)^2(k+1)^2,(h+1)(k+1))-(1,1)-(2h+2k,h+k)\\
&=(h^2k^2+2h^2k+2hk^2+h^2+k^2+4hk,hk)
\end{align*}

Dividiendo entre $\sqrt{h^2+k^2}$ que es la norma de $v$, y haciendo manipulaciones algebraicas, se obtiene

$$\left(\frac{h^2k^2+2h^2k+2hk^2+h^2+k^2+4hk}{\sqrt{h^2+k^2}},\frac{hk}{\sqrt{h^2+k^2}}\right).$$

Por la desigualdad entre la media cuadrática y la media geométrica, $$\frac{|hk|}{\sqrt{h^2+k^2}}\leq \sqrt{\frac{|hk|}{2}},$$

de modo que cuando $(h,k)\to (0,0)$, la segunda coordenada del vector que nos interesa converge a cero. La primera coordenada también se puede ver que converge a cero: el primero, segundo, tercero y sexto sumandos se acotan de manera similar, pues tienen factores $h$ o $k$ adicionales. El cuarto y quinto sumando se acotan notando que $\frac{h^2+k^2}{\sqrt{h^2+k^2}}=\sqrt{h^2+k^2}$, que también converge a cero con $h$ y $k$. Los detalles quedan de tarea moral.

$\triangle$

Diferenciabilidad implica continuidad

En el caso de las funciones de una variable real teníamos claramente que diferenciabilidad implica continuidad. Como es de esperarse, lo mismo se cumple para campos vectoriales, ya que una función diferenciable es más «suave» que una continua.

Teorema. Supongamos $f:S\subseteq \mathbb{R}^n\to\mathbb{R}^m$ es un campo vectorial diferenciable en un punto $\bar{a}$ de $S$. Entonces $f$ es continuo en $\bar{a}$.

Demostración. Si $f$ es diferenciable en $\bar{a}$ entonces cumple con la ecuación \[f(\bar{a}+\bar{v})=f(\bar{a})+T_{\bar{a}}(\bar{v})+||\bar{v}||E(\bar{a};\bar{v})\] con $E(\bar{a};\bar{v})$ una función tal que $\lim_{\bar{v}\to \bar{0}} E(\bar{a}; \bar{v})=0$ (¿Por qué es válida esta última afirmación?). Por ello:

\begin{align*}
\lim\limits_{\bar{v}\to \bar{0}}f(\bar{a}+\bar{v})&=\lim\limits_{\bar{v}\to \bar{0}}\left( f(\bar{a})+T_{\bar{a}}(\bar{v})+||\bar{v}||E(\bar{a};\bar{v}) \right)\\
&= \lim\limits_{\bar{v}\to \bar{0}}f(\bar{a})+\lim\limits_{\bar{v}\to \bar{0}}T_{\bar{a}}(\bar{v})+\lim\limits_{\bar{v}\to \bar{0}}||\bar{v}||E(\bar{a};\bar{v}).
\end{align*}

El primer sumando no depende de $\bar{v}$, así que es $f(\bar{a})$. El segundo se va a cero pues las transformaciones lineales son continuas. Finalmente, el tercer sumando se va a cero por lo que sabemos de $E(\bar{a},\bar{v})$. Así, $\lim\limits_{\bar{v}\to \bar{0}}f(\bar{a}+\bar{v})=f(\bar{a})$. Por lo tanto $f$ es continua.

$\square$.

Derivadas direccionales y derivadas parciales

Si bien tenemos dos definiciones de diferenciabilidad, aún no tenemos una manera muy práctica de encontrar o describir a la transformación lineal $T_{\bar{a}}$, que es la mejor aproximación lineal. En el ejemplo después de nuestra definición, nos dieron la transformación y funcionó, pero hasta donde hemos platicado, todavía es un misterio cómo obtenerla.

Nos gustaría tener una descripción más explícita pues queremos resolver problemas específicos como encontrar, por ejemplo, la ecuación de un hiperplano tangente. Este problema ya lo habíamos resuelto para campos escalares: si tenemos suficiente regularidad, entonces podemos construir la derivada a través de las derivadas parciales (que a su vez son derivadas direccionales). La teoría que ya desarrollamos prácticamente se puede copiar, considerando que ahora tendremos derivadas en cada función coordenada.

Lo primero que notaremos es que así como para campos escalares, para campos vectoriales también podemos definir la noción de derivadas direccionales. Pensemos en una función $f:S\subseteq \mathbb{R}^{n}\to \mathbb{R}^n$. Tomemos un vector fijo $\bar{a}\in Int=(S)$. Coloquemos una flecha que comience en $\bar{a}$ y tenga dirección dada por otro vector dado $\bar{y}\in \mathbb{R}^{n}$. Si multiplicamos a $\bar{y}$ por un escalar $h$ positivo, esto estira o encoge al vector $\bar{y}$, pero lo deja con la misma dirección. En el ejemplo de la Figura 3, al variar sobre todos los valores de $h$ se genera la recta $\bar{a}+h\bar{y}$. Si a los puntos de esta recta le aplicamos la función $f$, se obtiene un cierto lugar geométrico $$f(\bar{a}+h\bar{y})=(f_1(\bar{a}+h\bar{y}),\ldots,f_m(\bar{a}+h\bar{y})),$$ conforme se varían los valores de $h$. Lo que definiremos como derivada direccional nos permitirá hablar de un espacio afín tangente de dimensión $m$ a este lugar geométrico en el punto $f(\bar{a})$.

Figura 3

A continuación tenemos nuestra definición de derivada direccional para campos vectoriales.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Tomemos $\bar{a}\in Int(S)$, $\bar{y}\in \mathbb{R}^{n}$. Definimos la derivada direccional de $f$ en $\bar{a}$ en la dirección $\bar{y}$ como: \[ f'(\bar{a};\bar{y})=\lim\limits_{h\to 0}\frac{f(\bar{a}+h\bar{y})-f(\bar{a})}{h}, \] siempre y cuando el límite exista.

Notemos que $f'(\bar{a};\bar{y})$ es un vector de $\mathbb{R}^{m}$.

En los campos escalares teníamos derivadas parciales. En este caso también las tenemos y describen a las derivadas direccionales en el mismo sentido que en el caso escalar. Para formalizar las cosas, damos la definición a continuación.

Definición. Sea $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ un campo vectorial. Tomemos $\bar{a}\in Int(S)$, $\bar{y}\in \mathbb{R}^{n}$. Definimos la derivada direccional de $f$ en la coordenada $x_i$ en $a$ como la derivada parcial $f'(\bar{a};\hat{e}_i)$, donde $\hat{e}_i$ es el $i$-ésimo vector de la base canónica, siempre y cuando esta exista.

Como en el caso de los campos escalares, las derivadas direccionales pueden entenderse en términos de las derivadas parciales bajo suficiente regularidad. Tomemos $\hat{e}_1,\ldots,\hat{e}_n$ la base canónica de $\mathbb{R}^n$. Tomemos $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$. Pensemos que todas las derivadas parciales de $f$ existen en un punto dado $\bar{a}$ y que son continuas. Expresemos a $\bar{y}$ como $\bar{y}=\alpha_1\hat{e}_1+\alpha_2\hat{e}_2+\ldots+\alpha_n\hat{e}_n$ con $\hat{e}_1,\ldots,\hat{e}_n$ la base canónica de $\mathbb{R}^n$. En esta entrada discutiremos hacia el final que bajo estas condiciones tendremos que $f'(\bar{a};\bar{y})$ existe y de hecho que $$f'(\bar{a};\bar{y})=\sum_{i=1}^n \alpha_i f'(\bar{a};\bar{e}_i).$$

El tener derivadas parciales continuas resultará una hipótesis muy fuerte y de hecho implicará todavía más que la existencia de derivadas direccionales. De hecho, como en el caso de campos escalares, esta hipótesis implicará diferenciabilidad. Antes de discutir esto, veremos en la siguiente sección qué pasa componente a componente.

Si las derivadas parciales no son continuas, no deberíamos esperar que las derivadas direccionales existan: ¡hay muchas posibles direcciones y sólo sabemos que pasa en dos de ellas! Como tarea moral, puedes pensar en un contraejemplo de un campo escalar $f:\mathbb{R}^2\to \mathbb{R}^2$ con derivadas parciales en cierto punto $\bar{a}$, pero sin alguna (o algunas) derivadas direccionales en $\bar{a}$.

Derivadas por componente

Las derivadas direccionales pueden entenderse mediante las derivadas parciales, pero también, como en el caso de las trayectorias, pueden entenderse mediante las derivadas por componente. Para pensar en ello, tomemos $\hat{e}_1,\ldots,\hat{e}_m$ la base canónica de $\mathbb{R}^m$. Tomemos $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ con funciones coordenadas $f(\bar{x})=\left( f_{1}(\bar{x}),\dots ,f_{m}(\bar{x})\right)$. Pensemos que las derivadas direccionales de $f_1,\ldots, f_m$ en $\bar{a}$ en la dirección $\bar{y}$ existen.

Tenemos entonces:

\begin{align*} \lim\limits_{h\to 0}\frac{f(\bar{a}+h\bar{y})-f(\bar{a})}{h} &=\lim\limits_{h\to 0}\frac{\left( f_{1}(\bar{a}+h\bar{y}),\dots ,f_{m}(\bar{a}+h\bar{y})\right) -\left( f_{1}(\bar{a}),\dots ,f_{m}(\bar{a})\right)}{h}\\ &=\lim\limits_{h\to 0}\left( \frac{f_{1}(\bar{a}+h\bar{y})-f_{1}(\bar{a})}{h},\dots ,\frac{f_{m}(\bar{a}+h\bar{y})-f_{m}(\bar{a})}{h}\right)\\ &=\lim\limits_{h\to 0}\sum_{i=1}^{m}\frac{f_{i}(\bar{a}+h\bar{y})-f_{i}(\bar{a})}{h}{\hat{e}_{i}}\\
&=\sum_{i=1}^{m}\lim\limits_{h\to 0}\frac{f_{i}(\bar{a}+h\bar{y})-f_{i}(\bar{a})}{h}{\hat{e}_{i}}\\ &=\sum_{i=1}^{m}f_{i}'(\bar{a};\bar{y}){\hat{e}_{i}}. \end{align*}

En la última igualdad estamos usando la suposición de que las derivadas existen componente a componente. Como mostramos que el límite planteado inicialmente existe, obtenemos entonces que
\begin{equation} \label{eq:porcomponente} f'(\bar{a};\bar{y})=\sum_{i=1}^{m}f_{i}'(\bar{a};\bar{y}){\hat{e}_{i}} .\end{equation}

Lo que tenemos aquí es que la derivada direccional de $f$ en $\bar{a}$ en dirección de $\bar{y}$ es la suma vectorial de cada vector de la base escalado por la derivada direccional del campo escalar $f_{i}$ en $\bar{a}$ con respecto a la dirección de $\bar{y}$.

Diferenciabilidad implica derivadas direccionales

La noción de diferenciabilidad que dimos implica la diferenciabilidad de cada una de las funciones componente $f_i$ de una función $f:\mathbb{R}^n\to \mathbb{R}^m$. Es decir, si el campo vectorial es diferenciable, entonces cada uno de los campos escalares $f_1,\ldots,f_m$ componentes son también diferenciables, pues el límite $$\lim_{\bar{v}\to \bar{0}}\frac{||f(\bar{a}+\bar{v})-f(\bar{a})-T_{\bar{a}}(\bar{v})||}{||\bar{v}||}=0$$ se cumple, y por lo tanto se cumple componente a componente. En el caso de $T_{\bar{a}}$ el $i$-ésimo componente es precisamente hacer el producto interior del $i$-ésimo renglon de la matriz que representa a $T_{\bar{a}}$ con $\bar{v}$, y entonces la derivada $\triangledown f_i(\bar{a})$ del campo escalar $f_i$ está dada precisamente por dicho $i$-ésimo renglón.

A su vez, sabemos que si un campo escalar es diferenciable, entonces existen todas las derivadas parciales. Por lo que hemos platicado en unidades anteriores, si $\bar{y}\in \mathbb{R}^{n}$ se escribe en la base canónica como $\bar{y}=\sum_{j=1}^{n}y_{j}{\hat{e}_{j}}$, al aplicar $\triangledown f_i(\bar{a})$ obtenemos

\begin{align*}
\triangledown f_i(\bar{a})(\bar{y})&=\sum_{j=1}^n y_j\triangledown f_i(\bar{a})(\hat{e}_j)\\
&=\sum_{j=1}^n y_j \frac{\partial f_i}{\partial x_j}(\bar{a}),\\
\end{align*}

lo cual abreviamos como

$$f_i'(\bar{a};\bar{y})=\left(\frac{\partial f_i}{\partial x_1}(\bar{a}), \ldots, \frac{\partial f_i}{\partial x_n}(\bar{a})\right) \cdot \bar{y}.$$

Usando esta igualdad para cada $i$ y sustituyendo la ecuación \eqref{eq:porcomponente} que obtuvimos al analizar componente por componente, obtenemos entonces que

$$f^{\prime}(\bar{a};\bar{y})=\sum_{i=1}^m \left(\left(\frac{\partial f_i}{\partial x_1}(\bar{a}), \ldots, \frac{\partial f_i}{\partial x_n}(\bar{a})\right) \cdot \bar{y}\right)\hat{e}_i.$$

¡Pero esto se puede denotar de manera mucho más compacta mediante un producto matricial! Reflexiona un poco por qué la expresión anterior dice exactamente lo mismo que la siguiente:

$$f'(\bar{a};\bar{y})= \begin{pmatrix} \frac{\partial f_{1}}{\partial y_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial y_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}\begin{pmatrix} y_{1} \\ \vdots \\ y_{n} \end{pmatrix}.$$

Como tarea moral, tendrás que verificar que en un campo vectorial diferenciable en $\bar{a}$ se debe cumplir que $f'(\bar{a};\bar{y})=T_{\bar{a}}(\bar{y})$. Por lo discutido, debe pasar entonces para cada $y$ que \[ T_{\bar{a}}(\bar{y})=\begin{pmatrix} \frac{\partial f_{1}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial x_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}\begin{pmatrix} y_{1} \\ \vdots \\ y_{n} \end{pmatrix}.\]

Esto precisamente nos está diciendo que si $f$ es diferenciable en $a$, entonces sus derivadas parciales deben existir y se debe cumplir que la forma matricial de $T_{\bar{a}}$ en las bases canónicas de $\mathbb{R}^n$ y $\mathbb{R}^m$ debe ser \begin{equation}\label{eq:jacobiana}\begin{pmatrix} \frac{\partial f_{1}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial x_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}.\end{equation}

Matriz jacobiana

Toda la discusión anterior nos lleva a lo siguiente.

Definición. Dado un campo vectorial $f:S\subseteq \mathbb{R}^{n}\rightarrow \mathbb{R}^{m}$ diferenciable en un punto $\bar{a}\in Int(S)$ con derivada $T_{\bar{a}}$, a la matriz que representa a $T_{\bar{a}}$ en las bases canónicas la denotamos por $Df(\bar{a})$ y le llamamos la matriz jacobiana de $f$ en $\bar{a}$.

Por lo discutido en la sección anterior,

$$Df(\bar{a})=\begin{pmatrix} \frac{\partial f_{1}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{1}}{\partial x_{n}}(\bar{a}) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_{m}}{\partial x_{1}}(\bar{a}) & \dots & \frac{\partial f_{m}}{\partial x_{n}}(\bar{a}) \end{pmatrix}.$$

Escribiremos $Df(\bar{a})(\bar{x})$ para referirnos al producto de la matriz $Df(\bar{a})$ con el vector (columna) $\bar{x}$, que precisamente coincide con $T_{\bar{a}}(\bar{x})$. Así, bajo la hipótesis de diferenciabilidad, hemos recuperado entonces lo que hace $T_{\bar{a}}$ como una multiplicación matricial, donde la matriz tiene como elementos a las derivadas parciales de las funciones coordenada en el punto $\bar{a}$.

Ejemplos de diferenciabilidad en campos vectoriales

Con todo lo discutido hasta ahora, obtenemos un método para obtener la derivada para campos vectoriales, lo que nos permitirá, por ejemplo, encontrar la transformación lineal de forma explícita y encontrar hiperplanos tangentes.

Ejemplo. Consideremos $f(x,y)=(x^{2},xy,y^{2}).$ Calculemos su diferencial en el punto $(1,-1)$. Las funciones coordenada son

\begin{align*}
f_{1}(x,y)&=x^{2}\\
f_{2}(x,y)&=xy\\
f_{3}(x,y)&=y^{2},
\end{align*}

de donde tenemos: \[ \frac{\partial f_{1}}{\partial x}(1,-1)=\left. 2x\right|_{_{(1,-1)}}=2;\hspace{3cm} \frac{\partial f_{1}}{\partial y}(1,-1)=0;\hspace{3cm}\frac{\partial f_{2}}{\partial x}(1,-1)=\left. y\right|_{_{(1,-1)}}=-1;\] \[ \frac{\partial f_{2}}{\partial y}(1,-1)=\left. x\right|_{_{(1,-1)}}=1;\hspace{3cm}\frac{\partial f_{3}}{\partial x}(1,-1)=0;\hspace{3cm}\frac{\partial f_{3}}{\partial y}(1,-1)=\left. 2y\right|_{_{(1,-1)}}=-2.\] Así \[ Df(1,-1)=\begin{pmatrix} \frac{\partial f_{1}}{\partial x}(1,-1) & \frac{\partial f_{1}}{\partial y}(1,-1) \\ \frac{\partial f_{2}}{\partial x}(1,-1) & \frac{\partial f_{2}}{\partial y}(1,-1) \\ \frac{\partial f_{3}}{\partial x}(1,-1) & \frac{\partial f_{3}}{\partial y}(1,-1) \end{pmatrix}= \begin{pmatrix} 2 & 0 \\ -1 & 1 \\ 0 & -2 \end{pmatrix}.\]

$\triangle$

Ejemplo. Ahora obtengamos el plano tangente a una superficie dada en un punto dado. Sea $\mathcal{S}$ la superficie de $\mathbb{R}^{3}$ descrita por la imagen de la función $f(x,y)=(x,y,xy^{2})$. Vamos a determinar el plano tangente a dicha superficie en el punto $(1,1,1)$. Comencemos calculando $Df(1,1)$. En primer lugar calculemos las parciales: \[ \frac{\partial f_{1}}{\partial x}(1,1)=1;\hspace{3cm}\frac{\partial f_{1}}{\partial y}(1,1)=0;\hspace{3cm}\frac{\partial f_{2}}{\partial x}(1,1)=0 \] \[ \frac{\partial f_{2}}{\partial y}(1,1)=1;\hspace{3cm}\frac{\partial f_{3}}{\partial y}(1,1)=1;\hspace{3cm}\frac{\partial f_{3}}{\partial y}(1,1)=2.\]

Por lo tanto \[ Df(1,1)=\begin{pmatrix} 1 & 0 \\ 0 & 1 \\ 1 & 2 \end{pmatrix}.\]

Esta transformación manda al punto $(x,y)$ del plano $\mathbb{R}^2$ al punto\[ \begin{pmatrix} 1 & 0 \\ 0 & 1 \\ 1 & 2 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} x \\ y \\ x+2y \end{pmatrix}.\]

De modo que el plano centrado en el origen es el conjunto $$H=\{(x,y,x+2y)\in \mathbb{R}^{3}|(x,y)\in \mathbb{R}^{2}\}.$$

Pero este plano debemos todavía trasladarlo por el vector $(1,1,1)$ para que pase por el punto $f(1,1)$. Concluimos entonces que el plano tangente buscado es el conjunto

$$\{(x+1,y+1,x+2y+1)\in \mathbb{R}^{3}|(x,y)\in \mathbb{R}^{2}\}.$$

En la Figura 4 tenemos la en rojo la imagen del campo vectorial de este ejemplo y en verde la del plano tangente, el punto negro es el punto $(1,1,1)$.

Figura 4

$\triangle$

¿Y derivadas parciales implica diferenciabilidad?

Cuando un campo vectorial es diferenciable, existen todas las derivadas parciales de todos sus campos escalares coordenados. El regreso no es cierto. Sin embargo, sí se vale bajo una condición adicional de regularidad.

Definición. Diremos que un campo vectorial $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ es de clase $C^1$ (o simplemente es $C^1$) en un punto $\bar{a}\in S$ si todas las derivadas parciales de todas las funciones componentes de $f$ existen y son continuas en $\bar{a}$. Definimos de manera análoga lo que significa que $f$ sea de clase $C^1$ en todo $S$.

Teorema. Si $f:S\subseteq \mathbb{R}^n\to \mathbb{R}^m$ es un campo vectorial, $\bar{a}\in S$ y $f$ es $C^1$ en $\bar{a}$, entonces $f$ es diferenciable y su derivada $T_a$ tiene como forma matricial a la matriz jacobiana \eqref{eq:jacobiana}.

La prueba de este resultado se hace coordenada a coordenada, aplicando en cada una de ellas el teorema de diferenciabilidad y derivadas parciales para campos escalares que demostramos en la entrada del teorema del valor medio para campos escalares.

Más adelante

En esta entrada introdujimos el concepto de diferenciabilidad, de derivadas parciales, direccionales y por componente. Además, mostramos que cuando una función es diferenciable, entonces su derivada tiene una forma matricial muy sencilla, dada por las derivadas parciales de las componentes. Esto es nuestra primera señal de que las derivadas y las matrices están muy relacionadas entre sí. Lo que veremos en la siguiente entrada es que esta conexión se sigue dando, y de hecho nos permitirá enunciar de manera muy elegante la regla de la cadena para campos vectoriales: ¡será una multiplicación de matrices!

Después de entender mejor la diferenciabilidad, presentaremos y demostraremos teoremas clásicos e importantes de campos vectoriales: el teorema de la función inversa, y el teorema de la función implícita.

Tarea moral

  1. Completa los detalles faltantes del primer ejemplo que dimos de diferenciabilidad.
  2. Calcula la matriz jacobiana de la función $g(x,y,z)=(xz,xy,x^{2}y^{2}z^{2})$. Úsala para encontrar la ecuación del espacio tangente a la gráfica en el punto $g(2,1,0)$.
  3. Halla el campo vectorial cuya imagen es el plano tangente a la superficie dada por la ecuación $F(x,y)=x^{2}y^{2}+1$ en el punto $(1,1)$. Como ayuda al graficar $F$ en $\mathbb{R}^{3}$ nos dibuja la misma superficie que obtenemos de la imagen del campo vectorial $f(x,y)=(x,y,x^{2}y^{2}+1)$ que esta contenida en $\mathbb{R}^{3}$.
  4. Verifica que en efecto las dos definiciones de diferenciabilidad que dimos son equivalentes.
  5. Demuestra que si las parciales de cada componente de un campo vectorial existen, y son continuas, entonces la función es diferenciable. Tendrás que seguir la sugerencia dada en la última sección. Después, justifica la igualdad que dimos que escribe a las derivadas direccionales en términos de las parciales.
  6. Explica a detalle por qué la expresión a la que llegamos para $f^{\prime}(\bar{a};\bar{y})$ en efecto se puede pensar como el producto matricial mencionado.
  7. Encuentra un ejemplo de campo vectorial $f:\mathbb{R}^2\to \mathbb{R}^2$ en donde las derivadas parciales existen en algún punto $\bar{a}$, pero no todas las derivadas direccionales existen.

Entradas relacionadas

Geometría Analítica II: Cilindros sobre cónicas

Por Brian Manzano

Introducción

Con esta entrada comenzamos nuestra exploración de los objetos en el espacio de tres dimensiones. Lo primero que haremos es estudiar los cilindros que se construyen sobre cónicas. La mayoría de nosotros tiene una noción bastante buena sobre ellos, o por lo menos de los «cilindros usuales», en donde las secciones horizontales son círculos. Sin embargo, si bien entendemos muy bien su forma de manera intuitiva, ¿cómo los podemos representar en el lenguaje matemático?

A continuación definiremos qué entenderemos por un cilindro sobre una cónica. Veremos algunos ejemplos y luego haremos cilindros con objetos que hemos estudiado en el curso de Geometría Analítica I: con cónicas.

Definición de cilindros sobre curvas

Los cilindros que conocemos de manera intuitiva comienzan con una circunferencia y luego esta se extiende sin cambios a lo largo de un eje. Los cilindros con los que nos encontramos cotidianamente (por ejemplo, un vaso) se extienden sólo de manera acotada. Pero podemos pensar en qué sucedería si los extendemos indefinidamente. Si hacemos esto, llegamos a la siguiente definición.

Definición. Un cilindro es una superficie en $\mathbb{R}^3$ que se pueda obtener tomando un plano $\Pi$, tomando en él una curva $\mathcal{C}$ y tomando para cada punto $p$ de $\mathcal{C}$ una recta ortogonal a $\Pi$ que pase por $p$. La unión de estas rectas son el cilindro. A cada una de las rectas le llamamos una directriz del cilindro y a la curva $\mathcal{C}$ le llamamos la curva generatriz del cilindro.

Así, un cilindro es un conjunto de lineas paralelas que se encuentran «guiadas» o «dirigidas» de acuerdo a una curva plana. Podemos imaginarlo como sigue: dibujamos la curva sobre un papel, y luego sobre ella pegamos palos perpendiculares a la hoja

Cilindros a partir de cónicas

La definición de cilindro, tal y como está arriba, no restringe el tipo de cónicas que podemos tener. Sin embargo, hay una familia de cónicas que conocemos bien debido a cursos anteriores: las cónicas. Ya que podemos elegir con libertad la curva plana, pensemos en lo que sucede si usamos de las cónicas que conocemos. Para simplificar la situación, supondremos que dibujamos la cónica en el plano XY y entonces que las directrices son perpendiculares al plano $XY$, es decir, paralelas al eje $Z$. Podemos entonces hacer ejemplos de acuerdo a subfamilia de cónicas que usemos.

Cilindros elípticos

Recordemos que una elipse en el plano $XY$ puede pensarse (salvo rotaciones y traslaciones) como el lugar geométrico de los puntos $(x,y)$ que satisfacen una ecuación del estilo $$\frac{x^2}{a^2}+\frac{y^2}{b^2} =1,$$ donde $a$ y $b$ son parámetros que determinan la longitud de los ejes de la elipse.

Si ahora pensamos en todo $\mathbb{R}^3$ y nos preguntamos por el lugar geométrico de los puntos $(x,y,z)$ que satisfacen la ecuación, la respuesta es similar. Los valores de $(x,y)$ están dados por la ecuación y el valor de $z$ no está restringido de ninguna manera por la ecuación, de modo que puede ser lo que sea. ¡Hemos logrado «levantar la cónica» a líneas perpendiculares al plano $XY$!

De tener $a=b$, tendremos un cilindro circular en el origen. Si $a=b=1$, entonces es un cilindro mucho más especial, pues es uno que se obtiene de levantar la circunferencia unitaria canónica.

Por supuesto, pudimos haber comenzado con una elipse en el plano $YZ$, que tendría una ecuación del estilo $$\frac{y^2}{a^2}+\frac{z^2}{b^2} =1.$$ En este caso, el valor de $x$ sería libre, así que puede valer lo que sea. Así, esta ecuación pensada en todo $\mathbb{R}^3$ nos daría un cilindro cuya curva directriz es una elipse, y cuyas generatrices son paralelas al eje $x$.

Cilindros parabólicos

Para crear cilindros parabólicos podemos proceder de la misma manera. Para ellos, comenzamos con una parábola, por ejemplo, en el plano $XY$. Sabemos que una parábola así está dada, salvo rotaciones y traslaciones, por una ecuación del siguiente tipo: $$y^2 = 2px.$$ Una vez más, si en vez de pensar en esto como una ecuación en $\mathbb{R}^2$, la pensamos como una ecuación en $\mathbb{R}^3$, entonces el valor de $z$ es arbitrario y entonces al tomar el lugar geométrico en efecto obtenemos una línea perpendicular al plano $XY$ por cada punto de la parábola.

Cilindros hiperbólicos

La tercer familia sería la de cilindros hiperbólicos. En este caso, la curva generatriz es una hipérbola. Recordemos que salvo rotaciones y traslaciones, una hipérbola es el lugar geométrico de los puntos $(x,y)$ del plano $XY$ tales que satisfacen una ecuación del estilo $$\frac{x^2}{a^2}-\frac{y^2}{b^2} =1.$$ Al pensar a esta ecuación como una restricción para puntos $(x,y,z)$ de $\mathbb{R}^3$, obtenemos entonces un cilindro hiperbólico.

Problemas ejemplo de cilindros

Para aterrizar las ideas anteriores, veamos algunos ejemplos concretos.

Ejemplo. Tomemos el lugar geométrico de los puntos $(x,y,z) \in $ $\mathbb{R} ^3$ que cumplen con la siguiente ecuación: $$\frac{x^2}{4}+\frac{y^2}{25} = 1.$$

Podemos comenzar detectando la ausencia de la variable $z$, con lo que las generatrices serán rectas paralelas al eje $Z$. De hecho, el eje del cilindro precisamente será será el eje $Z$. Esto no siempre ocurre ya que no necesariamente el centro de la curva dada está en el origen del plano $XY$, pero debido a que no tenemos constantes que acompañen los valores $x$ o $y $ su centro no se encontrará desplazado.

¿Qué nos dicen los valores $4,25$ que acompañan a sus variables correspondientes ?Con todo en mente veamos su gráfica

Veamos desde otra perspectiva, no solo sobre el plano, sino con una vista incluyendo el otro eje coordenado obtenemos la siguiente gráfica.

$\square$

Ejemplo. Tomemos el lugar geométrico en $\mathbb{R}^3$ de los puntos $(x,y,z)$ que cumplen la siguiente ecuación: $$y^2=6x.$$

De manera muy similar notamos que la ausencia de la variable $z$ llevara a que su directriz se encuentre en el plano $XY$ de forma que vista desde este plano:

¿Puedes decir a que cónica pertenece esta gráfica?

Agregando la perspectiva con el eje faltante obtenemos:

Nota importante. Como habrás notado al graficar obtenemos estas representaciones que parecen estar cortadas o seccionadas por planos paralelos al $XY$ , en realidad estos cilindros se extienden sin límite.

$\square$

Ejemplo. Para la siguiente ecuación: $$\frac{z^2}{4}-\frac{y^2}{9} = 1,$$ ¿cuál es el lugar geométrico de los puntos $(x,y,z)$ en $\mathbb{R}^3$ que la cumplen?

Notemos ahora que además de representar otro tipo de cónica tenemos ahora un cambio importante, ya no contamos de manera explicita con la $y$ en la ecuación, ¿Qué cambios conllevara esto? ¿En que plano podremos observar la cónica correspondiente?

Veamos si tu intuición fue correcta

Gráfica de la ecuación en el plano YZ

Desde otra perspectiva donde podremos ver su profundidad, tenemos ahora que las generatrices se extienden desde $- \infty$ hasta $\infty$.

$\square$

Más adelante…

En esta primer entrada del curso hablamos de los primeros objetos geométricos de tres dimensiones que nos interesan: los cilindros con cierta curva generatriz. En la siguiente entrada veremos otra manera con la cual podemos crear un objeto de tres dimensiones a partir de rectas: las superficies de revolución. Un poco más adelante estudiaremos una versión más general de objetos que podemos obtener de esta manera: los conjuntos cero de ecuaciones de segundo grado en tres variables.

Tarea moral

Estos ejercicios te ayudaran a comprender de mejor forma los conceptos vistos.

  1. Reescribe las ecuaciones de los ejemplos que dimos para que sus directrices se encuentren en diferentes planos.
    Sugerencia: Nota qué pasa con el tercer ejemplo.
  2. Ahora que hemos cambiado los planos donde se encuentran las directrices, grafica estas ecuaciones, ¿Cómo cambian los cilindros? Realiza un cambio de variable para el segundo ejemplo haciendo el reemplazo $x\to x-3$. ¿Qué cambia? ¿pasa lo mismo para el primer ejemplo?
  3. Determina la ecuación para un cilindro parabólico cuya parábola directriz esté contenida en el plano XY y cuyo foco sea el punto $(2, 0)$ de este plano. Hay varias de estas parábolas. Puedes usar la que gustes.
  4. Gráfica los cilindros asociados a cada una de las siguientes ecuaciones:
    1. $x^2-z^2=0$.
    2. $(y-9)^2+(z-4)^2=0$.
    3. $x^2=y$.

Entradas relacionadas

Geometría Moderna II: Circunferencias Ortogonales

Por Armando Arzola Pérez

1.3 Circunferencias Ortogonales

Definición Circunferencias Ortogonales:

Dos circunferencias que se intersecan son ortogonales si sus tangentes a un punto de contacto forman un ángulo recto, o también si los radios que van de los centros a los puntos de intersección son ortogonales.

Teorema:

El centro de una circunferencia que corta a 2 circunferencias ortogonales, está en el eje radical de estas últimas.

Demostración:

Sean \(C_1(O_1,r_1)\) y \(C_2(O_2,r_2)\) dos circunferencias dadas, y sea \(C_3(O_3,r_3)\) una circunferencia ortogonal a $C_1$ y $C_2$.

Denotaremos a $T_1$ a uno de los puntos de intersección de $C_1$ y $C_3$, y a $T_2$ un punto de intersección de $C_2$ y $C_3$. Por demostrar que $O_3$ está en el eje radical de $C_1$ y $C_2$, solo falta demostrar que

$Pot(O_3,C_1)$ $=$ $Pot(O_3,C_2)$

Circunferencias Ortogonales del primer teorema.

Ahora como $O_3T_2$ y $O_3T_1$ son radios de $C_3$, entonces

$O_3T_1$ $=$ $O_3T_2$ $\Longleftrightarrow$ $(O_3T_1)^2=(O_3T_2)^2$

Por proposición 3 de potencia:

$Pot(O_3,C_1)=(O_3T_1)^2=(O_3T_2)^2=Pot(O_3,C_2)$

$Pot(O_3,C_1)=Pot(O_3,C_2)$

$\therefore$ $O_3$ es un punto del eje radical de $C_1$ y $C_2$. $\blacksquare$

Teorema:

Si una circunferencia cuyo centro está en el eje radical de dos circunferencias, y es ortogonal una de ellas, es también ortogonal a la otra.

Demostración:

Tomando como referencia la figura anterior.

Sea $C_3$ una circunferencia tal que su centro $O_3$ está en el eje radical de $C_1$ y $C_2$ dos circunferencias dadas y $C_3$ es ortogonal a $C_2$.

Se quiere demostrar que $C_3$ es ortogonal a $C_1$ o sea por Pitágoras

$(O_3O_1)^2-r_1^2= (O_3T_1)^2$

Dado que $C_3$ es ortogonal a $C_2$, el triángulo $\triangle O_3T_2O_2$ es rectángulo, entonces por Pitágoras $(O_3O_2)^2-r_2^2= (O_3T_2)^2$. Ahora como $O_3$ está en el eje radical de $C_1$ y $C_2$, y por propiedad de potencias se tiene:

$(O_3O_2)^2 – r_2^2=(O_3O_1)^2-r_1^2$ y como $O_3T_1=O_3T_2$

$\Rightarrow$ $(O_3T_1)^2=(O_3T_2)^2=(O_3O_2)^2-r_2^2=(O_3O_1)^2-r_1^2$

$\therefore$ $C_3$ es ortogonal a $C_1$. $\blacksquare$

Teorema:

Sean 2 circunferencias $C_1$ y $C_2$, y sea $C_3(O_3,r_3)$ una circunferencia ortogonal a $C_1$ y $C_2$. Entonces se generan 3 casos:

  1. Si $C_1$ y $C_2$ se intersecan, entonces $C_3$ no interseca a $O_1O_2$ la línea de los centros.
  2. Si $C_1$ y $C_2$ son tangentes, $C_3(O_3,r_3)$ es tangente a $O_1O_2$ la línea de los centros.
  3. Si $C_1$ y $C_2$ no se intersecan, entonces $C_3$ interseca a $O_1O_2$ la línea de los centros.

Demostración:

Sea $C_3$ una circunferencia ortogonal a 2 circunferencias dadas $C_1$ y $C_2$. Sea $X$ a la intersección de $O_1O_2$ con «$l$» el eje radical de las circunferencias $C_1$ y $C_2$. Ahora, dado que $C_3$ es ortogonal a $C_1$ y $C_2$, se tienen dos triángulos rectángulos:

$\triangle O_3T_1O_1$ y $\triangle O_3XO_1$

$\Rightarrow$ Por Pitágoras:

$(O_3T_1)^2+r_1^2=(O_3O_1)^2=(O_1X)^2+(O_3X)^2$

$\Longleftrightarrow$ $r_1^2-(O_1X)^2=(O_3X)^2-r_3^2$

Caso 1

Sean $C_1$ y $C_2$ dos circunferencias que no se intersecan. Por demostrar que $C_3$ no interseca a $O_1O_2$ la línea de los centros.

Circunferencias Ortogonales

Como

$r_1>O_1X$ $\Longleftrightarrow$ $r_1^2>O_1X^2$

$\Rightarrow$ $r_1-O_1X>0$ $\Longleftrightarrow$ $r_1^2-O_1X^2>0$

$\Rightarrow$ $r_1^2-(O_1X)^2$ $=$ $(O_3X)^2-r_3^2$

$\Rightarrow$ $(O_3X)^2-r_3^2>0$ $\Longleftrightarrow$ $(O_3X)^2>r_3^2$

$\Longleftrightarrow$ $O_3X>r_3$

$\therefore$ $C_3(O_3,r_3)$ no interseca la línea de los centros $O_1O_2$ $\blacksquare$

Caso 2

Sean $C_1$ y $C_2$ tangentes. Por demostrar que $C_3(O_3,r_3)$ es tangente a $O_1O_2$ la línea de los centros.

$r_1=O_1X$ $\Longleftrightarrow$ $r_1^2=O_1X^2$

$\Rightarrow$ $r_1-O_1X=0$ $\Longleftrightarrow$ $r_1^2-O_1X^2=0$

$\Rightarrow$ Por Pitágoras $r_1^2-(O_1X)^2$ $=$ $(O_3X)^2-r_3^2$

$\Rightarrow$ $(O_3X)^2-r_3^2=0$ $\Longleftrightarrow$ $(O_3X)^2=r_3^2$

$\Longleftrightarrow$ $O_3X=r_3$

$\therefore$ $C_3(O_3,r_3)$ es tangente a $O_1O_2$ la línea de los centros.$\blacksquare$

Caso 3

Sean $C_1$ y $C_2$ que no se interceptan. Por demostrar que $C_3$ interseca a $O_1O_2$ la línea de los centros.

Circunferencias Ortogonales

$r_1<O_1X$ $\Longleftrightarrow$ $r_1^2<O_1X^2$

$\Rightarrow$ $r_1-O_1X<0$ $\Longleftrightarrow$ $r_1^2-O_1X^2<0$

$\Rightarrow$ Por Pitágoras $r_1^2-(O_1X)^2$ $=$ $(O_3X)^2-r_3^2$

$\Rightarrow$ $(O_3X)^2-r_3^2<0$ $\Longleftrightarrow$ $(O_3X)^2<r_3^2$

$\Longleftrightarrow$ $O_3X<r_3$

$\therefore$ $C_3(O_3,r_3)$ interseca a $O_1O_2$ la línea de los centros.$\blacksquare$

Más adelante…

Se abordará en la siguiente entrada las Familias Coaxiales.

Al final de los temas de esta primera unidad se dejará unas series de ejercicios.

Entradas relacionadas

Geometría Analítica I: Teoremas de clasificación de polinomios cuadráticos y curvas cuadráticas

Por Leonardo Ignacio Martínez Sandoval

Introducción

Nos hemos estado preparando para enunciar formalmente los resultados de clasificación que nos dirán «cómo son todas las cónicas algebraicamente», o bien que nos dirán «cómo se ven conjuntos de ceros de cualquier polinomio cuadrático en dos variables». En una entrada anterior hablamos de qué es un resultado de clasificación en matemáticas. Después, definimos con toda precisión cuáles son los objetos que clasificaremos: los polinomios cuadráticos en dos variables y las curvas cuadráticas. Finalmente, establecimos las nociones de equivalencia afín y equivalencia isométrica que usaremos para dar nuestra clasificación.

En esta entrada finalmente enunciaremos con toda precisión los teoremas de clasificación que nos interesan. La demostración de estos teoremas no es directa, así que nos tomará algunas entradas más preparar la teoría necesaria para poder hacerlo.

Teoremas de clasificación isométrica

Los primeros teoremas que demostraremos serán bajo la equivalencia dada por las isometrías. Daremos teoremas para clasificar tanto polinomios cuadráticos en dos variables, como curvas cuadráticas.

El resultado para PCDVs es un poco más abstracto. La clasificación es un poco aparatosa, pues habrá muchos posibles parámetros involucrados. Pero tiene la ventaja de que es el que podremos demostrar a partir de las técnicas de matrices que ya conocemos y de algunas más que desarrollaremos sobre la marcha.

El resultado para curvas cuadráticas es muy intuitivo, pues lo podemos pensar en términos puramente geométricos: nos dirá que cualquier curva cuadrática se puede llevar, sin alterar su métrica, a una curva cuadrática mucho más fácil de describir, que viene de una «lista corta» de posibilidades. Como las transformaciones permitidas son las isometrías, esto es lo que más se parece a nuestro entendimiento de «ser la misma figura».

Veamos qué dice cada resultado. El primer teorema clasifica PCDVs a través de isometrías.

Teorema. Cualquier polinomio cuadrático en dos variables es isométricamente equivalente a exactamente alguno de los siguientes polinomios:

  1. A algún polinomio de la forma $\frac{x^2}{a^2}+\frac{y^2}{b^2}-1$ para $a\geq b$ reales distintos de cero
  2. A algún polinomio de la forma $\frac{x^2}{a^2}-\frac{y^2}{b^2}-1$ para $a\geq b$ reales distintos de cero
  3. A algún polinomio de la forma $y^2-cx$ para $c$ real distinto de cero
  4. A algún polinomio de la forma $c^2x^2-y^2$ para $c$ real distinto de cero
  5. A algún polinomio de la forma $c^2x^2-1$ para $c$ real distinto de cero
  6. Al polinomio $x^2$
  7. A algún polinomio de la forma $c^2x^2+y^2$ para $c$ real distinto de cero
  8. A algún polinomio de la forma $\frac{x^2}{a^2}+\frac{x^2}{b^2}+1$ para $a,b$ reales distintos de cero
  9. A algún polinomio de la forma $c^2x^2+1$ para $c$ real distinto de cero

El segundo teorema clasifica curvas cuadráticas bajo isometrías, y será un corolario del teorema anterior.

Teorema. Cualquier curva cuadrática del plano es isométricamente equivalente a exactamente una de las siguientes:

  1. A alguna elipse canónica con centro en $(0,0)$ y focos en el eje $x$
  2. A alguna hipérbola canónica con centro en $(0,0)$ y focos en el eje $x$
  3. A alguna parábola canónica de vértice $(c,0)$ y directriz $y=-c$
  4. A dos rectas que se intersectan en el origen
  5. A dos rectas paralelas de la forma $x=c$ y $x=-c$
  6. A la recta $x=0$
  7. Al origen $(0,0)$
  8. Al conjunto vacío

Teoremas de clasificación afín

Después de realizar la clasificación isométrica, agrandaremos un poco el conjunto de transformaciones que usaremos: permitiremos utilizar cualquier transformación afín. Al hacer esto, tenemos más transformaciones y por lo tanto deberíamos esperar que nuestra clasificación tenga menos posibilidades. En efecto este es el caso.

De hecho, la razón por la cual hacemos esto es que al permitir a todas las transformaciones afines nuestros polinomios cuadráticos en dos variables (o curvas cuadráticas) quedan clasificadas en muy muy pocos tipos: una cantidad finita. A continuación enunciamos los resultados concretos.

El primer teorema es para polinomios cuadráticos en dos variables.

Teorema. Cualquier polinomio cuadrático en dos variables es afínmente equivalente a exactamente uno de los siguientes polinomios:

  1. $x^2+y^2-1$
  2. $x^2-y^2-1$
  3. $y^2-x$
  4. $x^2-y^2$
  5. $x^2+1$
  6. $x^2$
  7. $x^2+y^2$
  8. $x^2+y^2+1$
  9. $x^2+1$

¡Este resultado es fantástico! Existen muchísimas expresiones de la forma $Ax^2+Bxy+Cy^2+Dx+Ey+F$ y el teorema anterior nos dice que, en realidad, podemos «resumirlas» únicamente en nueve posibilidades muy fáciles de enunciar.

Como corolario, obtendremos el segundo resultado para clasificación mediante transformaciones afines: el correspondiente a las curvas cuadráticas.

Teorema. Cualquier curva cuadrática del plano es afínmente equivalente a exactamente una de las siguientes posibilidades:

  1. La circunferencia unitaria
  2. La hipérbola unitaria
  3. La parábola unitaria
  4. Las rectas $y=x$ y $y=-x$
  5. Las rectas $x=1$ y $x=-1$
  6. La recta $x=0$
  7. El origen
  8. El conjunto vacío

Una vez más, es increíble que existiendo tantísimas curvas cuadráticas en el plano, sea posible resumirlas a tan solo ocho posibilidades.

Y, ¿por qué sirve esta clasificación?

En el transcurso de las siguientes entradas nos encontraremos con muchas situaciones concretas en las que clasificar una cónica será de utilidad. Mientras tanto discutimos esto de manera un poco informal. Imagina que comenzamos con el siguiente polinomio cuadrático en dos variables: $$P((x,y))=x^2-5xy-y^2+2x-y+5.$$

Tras hacer una figura en el plano usando alguna herramienta computacional, obtenemos que la curva cuadrática definida por $P$ se ve como en la siguiente figura.

Parece ser que esta es una hipérbola. Una de las ventajas del teorema de clasificación isométrica de curvas cuadráticas es que nos dirá que, en efecto, esto es una hipérbola. De hecho, tendremos una manera práctica de encontrar de manera explícita la transformación $T$ que manda el polinomio $P$ que define esta hipérbola $\mathcal{H}$ a un polinomio isométricamente equivalente $P’$ de una hipérbola canónica $\mathcal{H}’$.

¿Cuáles son los focos de $\mathcal{H}$? ¿Cuál es el centro de $\mathcal{H}$? ¿Cuál es la longitud de sus ejes? Esto no se aprecia claramente a partir del polinomio $P$. Sin embargo, la hipérbola $\mathcal{H}’$ tiene ecuación canónica, así que en $P’$ podemos leer fácilmente los focos, ejes y centro de $\mathcal{H’}$. Y luego usando precisamente la transformación $T$ podemos transferir esta información que sabemos de $\mathcal{H}’$ a $\mathcal{H}$. Por ejemplo, usando que $T$ es isometría obtenemos que $\mathcal{H}$ y $\mathcal{H}’$ tienen la misma longitud de ejes.

Más adelante…

En las siguientes entradas nos enfocaremos en demostrar los teoremas de clasificación aquí enunciados. Antes de hacer esto, debemos desarrollar un poco más de teoría. Por un lado, necesitamos comprender cómo las traslaciones nos pueden ayudar a «eliminar los términos lineales» de algunos polinomios cuadráticos. Luego, necesitamos comprender cómo las rotaciones nos pueden ayudar a «eliminar el término cruzado $xy$».

Las traslaciones las podremos entender fácilmente. Sin embargo, las rotaciones que «eliminan el término cruzado» requerirán que entendamos un nuevo procedimiento para matrices simétricas: el de diagonalizarlas. Esto nos llevará a discutir los eigenvalores, eigenvectores y el polinomio característico de la matriz.

Tarea moral

  1. Demuestra que cualesquiera dos segmentos del plano son afínmente equivalentes.
  2. Demuestra que cualesquiera dos rectángulos del plano son afínmente equivalentes.
  3. Resuelve los siguientes incisos:
    1. Prueba que dos cuadrados del plano son isométricamente equivalentes si y sólo si tienen la misma longitud de lado.
    2. Demuestra que cualquier cuadrado es isométricamente equivalente a algún cuadrado de vértices $(0,0)$, $(c,0)$, $(0,c)$ y $(c,c)$ para $c>0$.
    3. Demuestra que el cuadrado de vértices $(0,0)$, $(c,0)$, $(0,c)$ y $(c,c)$ tiene diagonal de longitud $\sqrt{2}c$.
    4. Usa todo lo anterior para demostrar que en cualquier cuadrado de lado $c$ se tiene que la diagonal mide $\sqrt{2}c$.
  4. En el teorema de clasificación afín de PCDV tenemos que cualquier PCDV es afínmente equivalente a exactamente una de las posibilidades enunciadas. En particular, esto implica que de esos nueve polinomios, no hay dos de ellos que sean afínmente equivalentes entre sí. Demuestra esto.
  5. Enuncia y demuestra un teorema de clasificación isométrico y un teorema de clasificación afín para triángulos en el plano.

Entradas relacionadas

Geometría Analítica I: Introducción a resultados de clasificación

Por Leonardo Ignacio Martínez Sandoval

Introducción

En tu formación matemática muchas veces te encontrarás con resultados de clasificación. Pero, ¿qué es clasificar en este contexto? A grandes rasgos, consiste en poder decir de manera sencilla cómo son todos los objetos matemáticos que se estén estudiando en un contexto dado.

En esta entrada hablaremos un poco más del problema de clasificar ciertos objetos matemáticos. Iniciaremos con un ejemplo «de juguete» muy básico. Luego, hablaremos de cómo en las clasificaciones geométricas podemos usar transformaciones. Finalmente, daremos un ejemplo sencillo de cómo usar estas ideas en la clasificación de los segmentos del plano.

Ejemplo básico de clasificación

Cuando queremos hacer una clasificación, en el sentido matemático, lo que queremos hacer es tomar algunos objetos matemáticos y decir, bajo algún criterio cómo son todos los «tipos posibles» que existen para esos objetos. Esto puede ser respondido de muchas formas, así que es fundamental acordar dos cosas con precisión:

  1. ¿Cuáles son los objetos que queremos clasificar?
  2. ¿Bajo qué criterio diremos que dos de esos objetos son «del mismo tipo»?

Al final del proceso, nos gustaría tener una lista relativamente fácil de escribir de todas las posibilidades. Esto puede ayudar posteriormente a resolver otros problemas matemáticos o bien a desarrollar más teoría.

Comencemos con un ejemplo «de juguete». Será muy sencillo, pero nos permitirá hablar de algunas de las sutilezas que nos encontraremos en contextos más abstractos. Considera la siguiente figura en la que hay varias figuras geométricas.

Imagina que nos piden «clasificar todas las figuras que están aquí». Lo que nos gustaría obtener al final es una lista con la clasificación, es decir con «todas las posibilidades» de figuras que hay. Si sólo nos dan esta instrucción, entonces estaríamos en problemas: hay muchas formas de clasificar estos objetos.

Una posible clasificación es por forma. Si consideramos equivalentes a dos de estas figuras cuando tienen la misma forma, entonces nuestra lista de posibilidades se reduce a tres: triángulos, cuadrados y círculos. Nuestro teorema de clasificación se vería así:

Teorema. Cualquier figura de la imagen tiene alguna de las siguientes formas:

  1. Triángulo
  2. Cuadrado
  3. Círculo

Este teorema de clasificación está padre. Pero puede ser inútil en algunos contextos. Por ejemplo, imagina que las figuras son muestras que está regalando una tienda de pinturas para que puedas llevarlas a tu casa y usarlas para ver si te gustaría pintar una pared con el color dado. Para estos fines es (prácticamente) lo mismo que te den un cuadrado azul o un triángulo azul. Lo único que importa es el color.

Pensar de esta manera nos da otra manera de clasificar a las figuras: por color. Si usamos esta noción de equivalencia, entonces nuestro resultado de clasificación sería muy distinto.

Teorema. Cualquier figura de la imagen es de alguno de los siguientes colores:

  1. Rojo
  2. Naranja
  3. Amarillo
  4. Verde
  5. Azul

Pero podríamos querer ser mucho más estrictos y querer clasificar considerando ambos criterios: tanto la forma como el color. Quizás uno podría pensar que como hay tres figuras y cinco colores, entonces hay $3\cdot 5=15$ posibilidades en esta clasificación. Obtendríamos el siguiente resultado.

Teorema. Cualquier figura de la imagen es de alguno de los siguientes 15 tipos: triángulo rojo, triángulo naranja, triángulo amarillo, triángulo verde, triángulo azul, cuadrado rojo, cuadrado naranja, cuadrado amarillo, cuadrado verde, cuadrado azul, círculo rojo, círculo naranja, círculo amarillo, círculo verde, círculo azul.

Estrictamente hablando, este resultado es correcto: cualquier figura es de alguno de esos tipos. Pero el teorema tiene algo incómodo: nos está dando posibilidades que no suceden. Por ejemplo, no hay cuadrados amarillos, ni círculos azules.

Una clasificación con forma y color que nos dejaría más satisfecho sería la siguiente:

Teorema. Cualquier figura de la imagen es de alguno de los siguientes 11 tipos:

  1. Triángulo rojo
  2. Triángulo naranja
  3. Triángulo amarillo
  4. Triángulo azul
  5. Cuadrado rojo
  6. Cuadrado naranja
  7. Cuadrado azul
  8. Círculo rojo
  9. Círculo naranja
  10. Círculo amarillo
  11. Círculo verde

Más aún, cualquiera de estas posibilidades sucede.

Este resultado se siente mucho más satisfactorio. Por un lado, no está agregando a la lista «opciones de más». Por otro lado, a partir de él podemos demostrar proposiciones sin tener que volver a ver la figura. Algunos ejemplos son los siguientes:

  • Ningún círculo de nuestra figuras es azul.
  • Todas las figuras verdes son círculos.
  • Ninguna figura amarilla es un cuadrado.

Para mostrar cualquiera de estas, basta ver nuestra clasificación.

¿Podemos dar una clasificación mucho más estricta? Sí, por supuesto. Por ejemplo, podemos considerar dos figuras iguales sólo cuando tienen exactamente la misma figura, color y posición. En este caso nuestro teorema de clasificación tendría un tipo por cada una de las 19 figuras. Esta clasificación también se siente un poco insatisfactoria pues en realidad no estamos «agrupando» figuras, sino simplemente «poniendo a cada una en su propio grupo». Pero bueno, es una clasificación válida también.

Uso de relaciones de equivalencia y particiones

Una manera de formalizar una clasificación es a partir de relaciones de equivalencia y particiones. Recordemos las siguientes dos definiciones:

Definición. Una relación de equivalencia en un conjunto $X$ es una colección de parejas $(x,y)$ en $X\times X$ tales que:

  • (Reflexividad) Para cualquier $x$ en $X$ la pareja $(x,x)$ está en la colección.
  • (Simetría) Si para algunos $x,y$ en $X$ se cumple que la pareja $(x,y)$ está en la colección, entonces la pareja $(y,x)$ también está en la colección.
  • (Transitividad) Si para algunos $x,y,z$ en $X$ se cumple que tanto las parejas $(x,y)$ como $(y,z)$ están en la colección, entonces la pareja $(x,z)$ también está.

Las relaciones de equivalencia nos ayudan a decir cuándo dos objetos de $X$ «son iguales» o «son el mismo» bajo algún criterio usualmente más relajado que la igualdad.

Definición. Una partición de un conjunto $X$ es una colección de conjuntos $(A_i)_{i \in I}$ para algún conjunto de índices $I$ tal que ninguno de los $A_i$ es vacío, cualesquiera dos de ellos tienen intersección vacía y $X=\cup_{i\in I}A_i$.

Un resultado clásico de teoría de conjuntos dice que «una relación de equivalencia da una partición, y viceversa». Formalmente, dada una relación de equivalencia $R$ en un conjunto $X$, podemos crear la clase de equivalencia de un elemento $x$ en $X$ como sigue: $$\overline(x):=\{y \in X: (x,y)\in R\}.$$ El conjunto $\{\overline{x}:x\in X\}$ da una colección de conjuntos que es una partición de $X$. Y viceversa, si tenemos una partición $(A_i)_{i \in I}$, entonces podemos considerar las parejas $(x,y)$ de elementos tales que $x$ y $y$ están en un mismo $A_i$, de donde obtenemos una relación de equivalencia.

Regresando a la idea de clasificar, podemos realizar una clasificación a través de una relación de equivalencia o de una partición. Las clases de equivalencia son los «tipos» de objetos que tenemos. Podemos dar un representante «sencillo» dentro de cada clase de equivalencia para hacer nuestra lista de los posibles «tipos» que existen.

Ejemplo. En los números enteros podemos decir que dos enteros $x$ y $y$ están relacionados cuando $x-y$ es un número par. Es fácil mostrar que esto da una relación de equivalencia y que las clases de equivalencia en este caso son los conjuntos:

\begin{align*}
P&=\{\ldots,-4,-2,0,2,4,\ldots\},
Q&=\{\ldots,-3,-1,1,3,\ldots\}.
\end{align*}

Tenemos que $P$ y $Q$ forman una partición del conjunto $\mathbb{Z}$ de números enteros. Así, esta relación clasifica a los enteros en dos tipos: los pares y los impares. Otra forma de dar esta clasificación es diciendo que «Cualquier entero es equivalente al $0$ o al $1$», o más explícitamente, «Para cualquier entero $z$ se tiene que o bien $z$ es par, o bien $z-1$ es par».

$\triangle$

Clasificación de segmentos del plano con transformaciones

Hacia donde queremos ir es hacia una clasificación relacionada con la geometría. Por esta razón, las relaciones de equivalencia, particiones o «tipos» de objetos que obtendremos estarán relacionados con nociones geométricas. Una manera de hacer esto es mediante las transformaciones que estuvimos estudiando en la unidad anterior: transformaciones afines, traslaciones, isometrías, transformaciones ortogonales, etc.

Por ejemplo, pensemos en que estamos hablando de los segmentos cerrados y acotados en el plano cartesiano. Es decir, de acuerdo a lo que estudiamos en la primera unidad, para cualesquiera dos puntos distintos $P$ y $Q$ en el plano estamos considerando el conjunto $$\overline{PQ}=\{pP+qQ:0\leq p \leq 1, 0 \leq q \leq 1, p+q=1\}.$$ En la siguiente figura puedes ver algunos de los (muchos) segmentos que hay en el plano:

Familia de segmentos

¿Cómo podemos clasificar a todos los segmentos que hay en el plano? Antes de cualquier cosa, tenemos que ponernos de acuerdo en la clasificación. Una manera de hacer esto es mediante transformaciones del plano. Veamos un par de ejemplos.

Ejemplo. Una primer opción es que digamos que dos segmentos son del mismo tipo cuando podamos trasladar uno de ellos al otro. Si hacemos esto, casi todos los segmentos de la siguiente figura serían del mismo tipo.

Familia de segmentos

El único que no es del mismo tipo que los demás sería el segmento punteado que, aunque lo dibujamos intencionalmente de la misma longitud que los demás, no resulta ser equivalente pues es imposible trasladarlo a alguno de los otros segmentos. Con esta noción de segmentos equivalentes, ¿qué posibilidades tendríamos? Es más o menos fácil convencerse de que para que dos segmentos sean del mismo tipo con esta clasificación necesitamos que a) sean paralelos y b) tengan la misma longitud. Por ello mismo, no es tampoco difícil convencerse del siguiente teorema de clasificación.

Teorema. Cualquier segmento del plano es equivalente bajo traslaciones a un segmento tal que uno de sus extremos es el origen.

$\square$

Veamos otra manera de clasificar los segmentos del plano.

Ejemplo. Diremos que dos segmentos son del mismo tipo si podemos llevar uno al otro a través de una isometría. Si hacemos esto entonces ahora sí todos los segmentos de la siguiente figura son equivalentes (pensando en que el segmento punteado tiene la misma longitud que los otros).

De hecho, por lo que sabemos de las isometrías podemos afirmar que bajo este criterio dos segmentos son del mismo tipo si y sólo si tienen la misma longitud. Esto nos llevaría a un teorema de clasificación un poco distinto.

Teorema. Cualquier segmento se puede mediante isometrías a un segmento que sale del origen y termina en un punto del la forma $(x,0)$ con $x>0$. Más aún, todos estos segmentos son de distinto tipo.

$\square$

En los dos ejemplos anteriores hemos sido un poco informales, pues dejamos varias cosas sin demostrar. Seguramente podrás detectarlas e intentar completar los argumentos que faltan. Algunas de estas cosas faltantes están en los ejercicios.

Más adelante…

En esta entrada hablamos de la noción de «clasificar» de manera muy general, con el fin de entenderla y ver algunas de las sutilezas que nos encontraremos más adelante. A partir de ahora nos enfocaremos en probar resultados de clasificación muy específicos, relacionados con las cónicas.

Sin embargo, queremos ser muy precisos con respecto a la clasificación que daremos. Por esta razón, en las siguientes dos entradas hablaremos de los objetos específicos que queremos clasificar y de las nociones de equivalencia que permitiremos.

Tarea moral

  1. Verifica que en nuestro ejemplo de juguete la relación «tener el mismo color» es una relación de equivalencia.
  2. Para cada una de las clasificaciones que dimos en nuestro ejemplo de juguete encuentra cuántas de las figuras originales hay en cada una de las clases.
  3. Demuestra que la relación en $\mathbb{Z}$ en la cual tenemos a $(x,y)$ si y sólo si $x-y$ es un número par es una relación de equivalencia. Muestra que en este caso la partición consiste en el conjunto de los números pares, y el conjunto de los números impares.
  4. Sea $S$ el conjunto de segmentos en el plano. Diremos un elemento $s_1$ de $S$ es traslacionalmente equivalente a otro elemento $s_2$ de $S$ si existe una traslación $T$ de $\mathbb{R}^2$ tal que $T(s_1)=s_2$. Demuestra que «ser traslacionalmente equivalente a» es una relación de equivalencia en $S$.
  5. Da teoremas de clasificación de las rectas en $\mathbb{R}$ usando transformaciones para cada una de las siguientes posibilidades:
    1. Dos rectas son del mismo tipo si se puede llevar una a otra mediante una traslación.
    2. Dos rectas son del mismo tipo si se puede llevar una a la otra mediante una rotación.
    3. Dos rectas son del mismo tipo si se puede llevar una a la otra mediante una isometría.

Entradas relacionadas