Análisis, Álgebra

Demostrando desigualdades con geometría simple

Captura1

La anterior figura se ha tomado del texto “When Less is More. Visualizing Basic Inequalities” de Claudi Alsina y Roger B. Nelsen y ejemplifica de manera extraordinaria cómo se relacionan la geometría y el cálculo. Justamente dicho texto nos da algunas interesantes demostraciones de desigualdades clásicas utilizando la representación de números reales mediante segmentos de una línea y los siguientes principios:

  1. El principio de inclusión. Cuando un segmento es subconjunto de otro entonces éste es mayor.
  2. El principio geodésico. En el plano euclídeo el camino de menor longitud que une dos puntos es el segmento de recta que tiene a uno como principio y al otro como extremo.
  3. La comparación Pitagórica. En cualquier triángulo el lado opuesto al mayor ángulo es el mayor lado.
  4. La desigualdad del triángulo. En cualquier triángulo la suma de dos de sus lados es mayor que el lado restante.
  5. Comparación de gráficos de funciones. Si el gráfico de y=f(x) yace por encima del gráfico de y=g(x) en un intervalo I, entonces para cada x de dicho intervalo, el segmento que uno (x,f(x)) y (x,g(x)) es positivo, lo que establece que f(x) \geq g(x).

Vamos a utilizar estos principios para demostrar una curiosa desigualdad (el lector interesado puede encontrar el desarrollo más conciso en el texto mencionado). Probaremos que si a,b son números positivos, entonces
\frac{a+b}{2} \leq \sqrt{\frac{a^2+b^2}{2}} \leq \frac{a+b}{\sqrt{2}}.
Vamos a usar la siguiente figura:

grafico1

La longitud del segmento AB es \sqrt{a^2+b^2}, la longitud del segmento BC es también \sqrt{a^2+b^2} mientras que la longitud del segmento AC es \sqrt{ (a+b)^2 + (a+b)^2}. Como vemos en la figura, la longitud del segmento AC es menor que la de la suma de los segmentos AB y BC (principio geodésico), luego

\sqrt{2} (a+b) \leq 2 \sqrt{a^2+b^2}.

Por otro lado, usando el principio 4 (desigualdad del triángulo), es (a+b)+(a+b) \geq 2 \sqrt{a^2+b^2}, quedando

\sqrt{2} (a+b) \leq 2 \sqrt{a^2 + b^2} \leq 2(a+b).

Si multiplicamos todos los miembros de la desigualdad por \frac{1}{2 \sqrt{2}}, obtenemos

\frac{a+b}{2} \leq \sqrt{\frac{a^2+b^2}{2}} \leq \frac{a+b}{\sqrt{2}}.

Anuncios
Análisis, Álgebra

Ecuaciones cúbicas (2)

Consideremos una ecuación cúbica reducida

x^3+px+q = 0,

donde p y q son diferentes de cero. En la entrada anterior hemos visto cómo podemos resolverla mediante una serie de cambios de variable y usando números complejos. Vamos a resumir todo ese trabajo en una expresión manejable. Consideramos los valores complejos

\alpha = \sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}},

\beta = \sqrt[3]{-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}

Las soluciones se obtienen entonces mediante x = \alpha+\beta. Veamos una aplicación con el ejemplo de la entrada anterior (donde hemos cambiado la variable y por x para ajustarnos a la terminología empleada ahora):

x^3- \frac{1}{3}x -\frac{25}{27} =0.

Entonces p= -1/3 y q = -25/27, quedando

\alpha = \sqrt[3]{-\frac{-25/27}{2}+\sqrt{\frac{(-25/27)^2}{4}+\frac{(-1/3)^3}{27}}} = \sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}},

\beta = \sqrt[3]{-\frac{-25/27}{2}-\sqrt{\frac{(-25/27)^2}{4}+\frac{(-1/3)^3}{27}}} =\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}}.

Añadiendo las raíces cúbicas de la unidad obtenemos los resultados buscados

x_1 = \sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}},

x_2 =(-\frac{1}{2}+i \frac{\sqrt{3}}{2}) [\sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}}]+(-\frac{1}{2}-i \frac{\sqrt{3}}{2})[\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}}],

x_2 =(-\frac{1}{2}-i \frac{\sqrt{3}}{2}) [\sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}}]+(-\frac{1}{2}+i \frac{\sqrt{3}}{2})[\sqrt[3]{\frac{25}{54}-\frac{\sqrt{621}}{54}}],

Estos son los valores exactos pero podemos dar valores aproximados sin más que operar y redondear.

Análisis, Álgebra

Ecuaciones cúbicas (1)

En una entrada anterior del Consultorio Matemático se nos presentaba una ecuación polinómica de tercer grado con coeficientes reales. Ha llegado el momento de explicar el método más usado para su resolución por radicales.
Consideramos ecuaciones de la forma

Ax^3 +Bx^2+Cx+D = 0,

donde A, B, C y D son números reales y A \neq 0. Diremos que la ecuación está normalizada si A=1 y que está en forma reducida si está normalizada y B=0. Esto es, tiene la forma

x^3+cx+d = 0.

Toda ecuación cúbica normalizada puede llevarse a la forma reducida mediante el cambio de variable

x = y-\frac{B}{3}.

Por ejemplo, la ecuación cúbica normalizada x^3-2x^2+x-1=0 se transforma mediante el cambio x = y+\frac{2}{3} en

(y+2/3)^3-2(y+2/3)^2+(y+2/3)-1=0

que desarrollada convenientemente nos lleva a la forma reducida

y^3-\frac{1}{3}y - \frac{25}{27} = 0.

Una vez se halla en forma reducida pasamos a aplicar el cambio y = z-\frac{c}{3z}. En nuestro caso, y = z- \frac{-1/3}{3z} = z+\frac{1}{9z}, quedando

(z+\frac{1}{9z})^3-\frac{1}{3}(z+\frac{1}{9z}) - \frac{25}{27} =0,

que simplificada nos lleva a

z^3+\frac{1}{9^3 z^3}-\frac{25}{27}=0.

Esta ecuación puede hacerse bicuadrada fácilmente al multiplicar ambos miembros por z^3. Es decir,

z^6-\frac{25}{27}z^3+\frac{1}{9^3}=0.

Para resolver la ecuación bicuadrada hacemos z^3 = t y tenemos

t^2-\frac{25}{27} t+\frac{1}{9^3}=0,

cuyas soluciones son
t = \frac{25}{54} +\frac{\sqrt{621}}{54}, t= \frac{25}{54} -\frac{\sqrt{621}}{54}.
Ahora tenemos que “deshacer” los cambios. En primer lugar,

z =\sqrt[3]{t} = \epsilon \sqrt[3]{t},

siendo \epsilon la notación para las tres raíces cúbicas de la unidad en el cuerpo de los complejos. Era inevitable usar números complejos pero he intentado minimizar su “impacto”. Me limitaré a explicar cómo son las tres raíces de la unidad. En primer lugar, escribimos

1 = 1+0i = e^{0i}= 1 ( \cos 0 + i \sin 0).

Sus raíces son

1^{1/3} = \{ 1^{1/3} (\cos \frac{(0+2 k \pi)}{3}+ i \sin \frac{(0+2 k \pi)}{3}), k = 0,1,2 \}.

Es decir,

\epsilon = \{1, -\frac{1}{2}+i \frac{\sqrt{3}}{2}, -\frac{1}{2}-i \frac{\sqrt{3}}{2} \}.

Convenimos en que

\epsilon_1 = 1, \epsilon_2 =-\frac{1}{2}+i \frac{\sqrt{3}}{2}, \epsilon_3 =-\frac{1}{2}-i \frac{\sqrt{3}}{2}.

En consecuencia, tendremos

z =  \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}, z= \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}} .

y = z+\frac{1}{9z} =  \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+ \frac{1}{9 \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}} , y= z+\frac{1}{9z} = \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}} + \frac{1}{9 \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}.

Simplificamos las fracciones multiplicando por sus conjugados. En particular,

\frac{1}{9 \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}} = \frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{9 \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}(\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}})} =\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{ \epsilon} .

Sustituyendo de nuevo vemos que

y = \epsilon \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{ \epsilon}

y = \epsilon \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}}{ \epsilon} .

Ahora deberíamos poner los tres valores de \epsilon para obtener seis soluciones. Sin embargo, teniendo en cuenta que \epsilon_2 \epsilon_3 =1 vemos que \epsilon_2 = \frac{1}{\epsilon_3}, de donde

y_1 =  \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}

y_2 =  \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54}+\frac{\sqrt{621}}{54}} .

y_3 = \epsilon_2\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{ \epsilon_3}

y_4 = \epsilon_2 \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}}{ \epsilon_3} .

y_5 = \epsilon_3 \sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}}{\epsilon_2}

y_6 = \epsilon_3 \sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}+\frac{\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}}{ \epsilon_2} .

Se aprecia pues que y_1=y_2, y_3=y_4 e y_5=y_6, quedando tres soluciones. La primera de ellas es la única real y vale

y =\sqrt[3]{\frac{25}{54} +\frac{\sqrt{621}}{54}}+\sqrt[3]{\frac{25}{54} -\frac{\sqrt{621}}{54}}.

Las otras dos son complejas y su cálculo es un poco más laborioso. Una vez obtenidas, debemos hacer el cambio final x = y+\frac{2}{3}.
Como el lector puede apreciar, este sistema de obtención de soluciones se presenta largo y complicado. Podemos simplificarlo un poco utilizando una fórmula. Pero esto lo veremos en la próxima entrada.

Álgebra

Formas cuadráticas (4 y final)

Daremos un ejemplo de forma bilineal simétrica:

Consideremos E=\mathbb{R}^{2} y sea la forma bilineal simétrica definida sobre \mathbb{R}^{2} mediante f((x_{1}, x_{2}), (y_{1}, y_{2}))= x_{1} y_{1} + 2 x_{2} y_{2}. Su matriz respecto a la base canónica es

matriz4

Por tanto, la expresión matricial queda

matriz5

La forma cuadrática asociada q es q(x_{1},x_{2})= x_{1}^{2} +2 x_{2}^{2}, que expresada en forma matricial es

matriz6

Como hemos visto en el ejemplo anterior, las formas cuadráticas tienen expresiones analíticas en la base canónica que resultan ser polinomios homogéneos de grado n (en el ejemplo, es de grado 2). El resultado recíproco es también cierto como pasamos a probar.

Teorema 1. Todo polinomio homogéneo de grado 2 en n variables x_{1}, x_{2}, \cdots, x_{n} y coeficientes reales puede considerarse como la expresión analítica de una forma cuadrática definida en el espacio vectorial real \mathbb{R}^{n}.

Demostración. Sea p(x_{1}, x_{2}, \cdots, x_{n}) = \sum_{ij=1, i< j}^{n} \lambda_{ij} x_{i}x_{j} un polinomio homogéneo de grado 2 con coeficientes \lambda_{ij} reales. Definimos la matriz cuadrada A=(a_{ij}) de orden n mediante

matriz7

Esta matriz es simétrica (por su misma construcción) y la aplicación q: \mathbb{R}^{n} \rightarrow \mathbb{R}, definida por

matriz8

es una forma cuadrática expresada en forma matricial respecto de la base canónica. Esto termina nuestra demostración.

Las formas cuadráticas ofrecen resultados numéricos, por ello es interesante hallar el signo de tales resultados.

Definición 1. Una forma cuadrática q: E \rightarrow K se dice definida positiva si q(u) \geq 0 para todo u \in E y $q(u)=0$ si y sólo si u=0.
Definición 2. Una forma cuadrática q: E \rightarrow K se dice definida negativa si q(u) \leq 0 para todo u \in E y q(u)=0 si y sólo si u=0.
Definición 3. Una forma cuadrática q: E \rightarrow K se dice semidefinida positiva si q(u) \geq 0 para todo u \in E y existe al menos un u \neq 0 tal que q(u)=0.
Álgebra

Formas cuadráticas (3)

Seguimos con algunos resultados más.

Teorema 1. Sea E un espacio vectorial de dimensión finita, n, sobre un cuerpo K y sea B=(u_{1}, u_{2}, \cdots, u_{n}) una base de E. Toda forma bilineal f: E \times E \rightarrow K es simétrica si y sólo si, su matriz A respecto a la base B es simétrica.

Demostración. Supongamos que f: E \times E \rightarrow K es simétrica. En tal caso la matriz A= (f(u_{j}, u_{i})) verifica A^{T} = (f(u_{j}, u_{i}))^{T} = (f(u_{i}, u_{j}) )= (f(u_{j},u_{i}))= A y resulta una matriz simétrica. Análogamente, si la matriz A= (f(u_{j}, u_{i})) es simétrica, entonces

f(u,v) = u_{B} A (v_{B})^{T} = (u_{B} A (v_{B})^{T})^{T} = v_{B} A^{T} (u_{B})^{T} = v_{B} A (u_{B})^{T} = f(v,u)

lo que prueba que la forma bilineal es simétrica. Aquí termina nuestra demostración.

A continuación vamos a determinar cómo afecta el cambio de base a la expresión matricial de una forma bilineal.

Teorema 2. Sea E un espacio vectorial de dimensión finita, n, sobre un cuerpo K y sean B=(u_{1}, u_{2}, \cdots, u_{n}) y B'=(v_{1}, v_{2}, \cdots, v_{n}) bases de E. Sea también una forma bilineal f: E \times E \rightarrow K con matriz A respecto a la base B. Si P es la matriz de paso de B a B', entonces la matriz de f respecto a la base B' es P A P^{T}

Demostración. Como P es la matriz de paso de latex $B$ a B' tenemos que u_{B'}P = u_{B}, para todo u \in E, por lo que podemos escribir

f(u,v)=  u_{B} A (v_{B})^{T} =  u_{B'} P  A (v_{B'}P )^{T} = u_{B'} P  A  P^{T} (v_{B'} )^{T}

Esto significa que la matriz P  A  P^{T} es la correspondiente a la forma bilineal en la base B'. Esto termina nuestra demostración.

Recordemos que dos matrices cuadradas de la misma dimensión A y B se dicen congruentes si existe una matriz P, tal que B = P A P^{T}. Así pues, todas las matrices correspondientes a una misma forma bilineal en distintas bases son congruentes entre sí.

Vamos a definir ya lo que entendemos por forma cuadrática.

Definición 1. Sea f: E \times E \rightarrow K una forma bilineal simétrica. La aplicación q: E \rightarrow K, dada por q(u)=f(u,u) se denomina forma cuadrática asociada a f.

En el caso de trabajar en espacios vectoriales de dimensión finita, resulta sencillo obtener la expresión matricial de una forma cuadrática a partir de la expresión matricial de la forma bilineal a la que está asociada. Así si f(u,v) = u_{B} A (v_{B})^{T}, tenemos que q(u) = u_{B} A (u_{B})^{T}, siendo A una matriz simétrica.

Álgebra

Formas cuadráticas (2)

Vamos a ver ahora la expresión de una forma bilineal definida sobre espacios vectoriales de dimensiones finitas.

Teorema 1. Sean E y F dos K-espacios vectoriales de dimensiones m y n, respectivamente, y sean B=(u_{1}, u_{2}, \cdots, u_{m}) una base de E y B'= (v_{1}, v_{2}, \cdots, v_{n}) una base de F. Entonces, dada una forma bilineal f: E \times F \rightarrow K existe una y sólo una matriz A=(a_{ji}) de dimensiones mn tal que
matriz1

Demostración. Expresando los vectores x \in E e y \in F mediante las bases respectivas B y B' y aplicando la condición de bilinealidad, tenemos

matriz2

Llamando f(u_{j}, v_{i} ) = a_{ji}, para (j,i) \in \{1, 2, \cdots, m \} \times \{1,2, \cdots, n \} tenemos

matriz3

Si A=(a_{ji}) es la matriz mn formada por los valores a_{ji} =f(u_{j},v_{i}), se tiene que por construcción es única y cumple las condiciones del teorema. Esto termina nuestra demostración.

Utilizando los resultados del teorema anterior, podemos expresar matricialmente las formas bilineales sobre espacios vectoriales de dimensiones finitas. En efecto, si E y F son espacios vectoriales de dimensiones m y n, respectivamente, sobre un mismo cuerpo K y B=(u_{1}, \cdots u_{m}) es una base de E y B'=(v_{1}, \cdots, v_{n}) una base de F, toda forma bilineal f: E \times F \rightarrow K se puede expresar mediante

f(u,v) = u_{B} A (v_{B'})^{T}.

donde u_{B} es el vector fila formado por las coordenadas de u en la base B, v_{B'}, el vector fila formado por las coordenadas de v en la base B' y A es la matriz de f en las bases B y B', de dimensiones mn y componentes f(u_{j},v_{i}). En el caso de que E=F y \dim(E)=n, es usual escoger una misma base B y, entonces la matriz A = (f(u_{j},u_{i})) es cuadrada de orden n.

Álgebra

Formas cuadráticas (1)

Consideremos tres espacios vectoriales E, F y G, todos sobre el mismo cuerpo conmutativo K. Una aplicación

f: E \times F \rightarrow G

se dice que es bilineal si para cada x \in E y cada y \in F, las restricciones

f_{x} : F \rightarrow G ,\quad f_{x}(y) =f(x,y),

f_{y} : E \rightarrow G,\quad f_{y}(x) =f(x,y),

son aplicaciones lineales. Esto es equivalente a afirmar que para cada \alpha, \beta pertenecientes al cuerpo K y para cada x, x' \in E y cada y, y' \in F, se tiene que

f(\alpha x + \beta x', y ) = \alpha f(x,y)+ \beta f(x',y),

f(x,\alpha y+ \beta y') = \alpha f(x,y)+ \beta f(x,y').

Consideremos los espacios vectoriales E=F=\mathbb{R}^{2} y G=\mathbb{R}^{3}, todos sobre el cuerpo de los números reales. La aplicación f:\mathbb{R}^{2} \times \mathbb{R}^{2} \rightarrow \mathbb{R}^{3}, definida por

f((x,y), (u,v)) = (0, 0, 0)

es bilineal. En efecto, si restringimos f a un valor (x_{0},y_{0}) fijo, la aplicación resultante f(u,v) = (0, 0, 0) es lineal y lo mismo ocurre si restringimos f a un valor (u_{0}, v_{0}) fijo. Esta aplicación bilineal se llamará degenerada o trivial.

Definición 1. Sean E y F dos espacios vectoriales sobre un mismo cuerpo K y consideremos el espacio vectorial usual formado por el cuerpo K sobre sí mismo. Toda aplicación bilineal f: E \times F \rightarrow K se llamará forma bilineal.

Observemos que en las formas bilineales las imágenes son siempre valores del cuerpo K.
La aplicación

f:\mathbb{R}^{2} \times \mathbb{R}^{2} \rightarrow \mathbb{R}

dada por

f((x,y),(u,v)) = xu+yv

es una forma bilineal. En efecto, sea (x_{0}, y_{0}) fijo, la restricción a dicho valor resulta la aplicación

f_{(x_{0},y_{0})}(u,v) = x_{0}u+y_{0}v

la cual es lineal y el lector puede comprobar que también lo es la restricción a cualquier (u_{0}, v_{0}). Obsérvese que esta forma bilineal no es más que el producto escalar.

Definición 2. Una forma bilineal f: E \times E \rightarrow K se dice simétrica si f(x,y)=f(y,x) para todos (x,y) \in E \times E.
Definición 3. Una forma bilineal f: E \times E \rightarrow K se dice antisimétrica o alternada si f(x,x)=0 para todos x \in E.

Obsérvese que en la definición de formas simétricas y antisimétricas hemos considerado sólo formas bilineales donde los espacios vectoriales que forman el dominio son el mismo. El siguiente resultado nos proporciona una condición equivalente para el carácter alterno de una forma bilineal.

Teorema 1. Una forma bilineal f: E \times E \rightarrow K es alternada si y sólo si f(x,y) = -f(y,x)

Demostración. Supongamos que f es alternada, entonces tomando x,y \in E, tenemos que f(x+y, x+y) = 0, de donde

0=f(x+y,x+y) = f(x,x+y)+f(y,x+y) =

f(x,x)+f(x,y)+f(y,x)+f(y,y) =

0+f(x,y)+f(y,x)+0 = f(x,y)+f(y,x).

Lo que nos lleva a concluir que f(x,y) = -f(y,x). Recíprocamente, si f(x,y) = -f(y,x) para todo x,y \in E, entonces haciendo x=y, sería f(x,x) = -f(x,x), de donde f(x,x)=0. Esto termina nuestra demostración.