El principio arquimediano y sus equivalencias

En el cuerpo de los números reales sabemos que se verifica el principio arquimediano. Esto es, que dados x,y, números reales positivos, existe al menos un entero n para el que y< nx. La prueba de este hecho suele derivarse del axioma del supremo. También se suele utilizar el principio arquimediano para probar que el conjunto de los racionales es denso en los reales. En esta entrada vamos a partir del contexto más general de un cuerpo ordenado cualquiera y vamos a demostrar que el principio arquimediano es en realidad equivalente a la densidad de los racionales, los cuales se hallan presentes en dicho cuerpo mediante el isomorfismo natural.

Teorema: Sea K un cuerpo conmutativo totalmente ordenado. Son equivalentes

(a) Para todo x \in K, existe un entero positivo n \in K, tal que x <n.

(b) Para todos x,y de K, con y>0, podemos hallar un entero positivo n \in K que verifica x <ny.

(c) Para todo \epsilon >0, existe un entero positivo n \in K, tal que \frac{1}{n} < \epsilon.

(d) El conjunto de los racionales de K es denso en K.

Demostración. (a) implica (b). Como y>0, concluimos que existe y^{-1} >0 por lo que tomando xy^{-1} y aplicando (a) vemos que existe un entero positivo n que cumple

xy^{-1} <n.

Multiplicando ambos miembros por y llegamos a x <ny. El lector debe observar que esta desigualdad es equivalente a la que hemos dado para el caso de los números reales.

(b) implica (c). Sean x=1 e y= \epsilon>0. En virtud de (b), existe n \in K para el que

1 <n \epsilon.

Es decir, \frac{1}{ \epsilon} <n.

(c) implica (d). Este apartado es el más complicado de probar. Hemos de concluir que para todo x<y existe un racional z \in K, de forma que x<z<y. Vamos a analizar cuatro casos:

(1) Si es x <0 <y. La conclusión es inmediata haciendo z = 0.

(2) Si es 0< x <y, tomamos \epsilon = y-x >0 y aplicando (c) existe al menos un entero positivo n \in K para el que \frac{1}{n} < y-x. El valor \frac{1}{ny} es también positivo y aplicando de nuevo (c), hallamos p, entero positivo, que cumple \frac{1}{p} < \frac{1}{ny}, o lo que es lo mismo y < \frac{p}{n}. Por tanto, el conjunto

A= \{ p \in \mathbb{N} : y \leq \frac{p}{n} \}

es no vacío. Aplicando la buena ordenación de los naturales hallaremos un mínimo q para el conjunto A. Dicho mínimo será positivo (pues y>0 y permite afirmar que

z=\frac{q-1}{n} <y,

ya que q-1 \notin A. Finalmente de

x =y-(y-x) < \frac{q}{n} -\frac{1}{n} = \frac{q-1}{n},

vemos que x < \frac{q-1}{n} <y y este cociente de enteros es el racional z buscado.

(3) Si es x <y <0, entonces 0<-y <-x y aplicamos (2), con la salvedad de que si 0<-y<z<-x, entonces x<-z<y<0.

(4). Supongamos que x=0<y. Aplicando (c) deducimos que para \epsilon =y existe n, entero positivo, que cumple x=0< \frac{1}{n} <y. Esto significa que el racional buscado es z = \frac{1}{n}. Si es x<y=0, entonces 0=y<-x y aplicamos lo mismo,

(d) implica (a). Sea x \in K. Si x <1, trivialmente basta tomar n=1 y no hay nada que probar. Supongamos que x>1. Entonces \frac{1}{x} >0 y como los racionales de K son densos en K, hallamos \frac{m}{n}, de manera que

0<\frac{m}{n} < \frac{1}{x}.

Obviamente es mx = x+x+ \ldots +x \quad (m \quad \text{veces})> x,  pues x>0. En consecuencia,

0<x <mx = \frac{m}{n} nx <\frac{1}{x} nx = n.

Esto termina la demostración.

Anuncios

Ejercicios de Demidovich (2)

Seguimos con problemas del texto de Demidovich:

Imagen

10. Es fácil ver que la función

g(x) = \frac{|x|+x}{2}

verifica g =f. En efecto, los dominios de ambas son iguales (toda la recta real) y si x > 0, entonces

f(x) = x = \frac{x+x}{2} =\frac{|x|+x}{2} = g(x),

y si x \leq 0, entonces

f(x) = 0 = \frac{x-x}{2} = \frac{x+|x|}{2} = g(x).

En consecuencia, f(x) = g(x) para todo x \in \mathbb{R}.

11. a) Debemos exigir que x+1 \geq 0. Por tanto, x \geq -1 y el dominio de esta función es el intervalo [-1 \infty). El apartado b) es muy diferente. Al ser una raíz cúbica, el radicando puede adoptar cualquier valor real y el dominio es todo \mathbb{R}.

12. El denominador de esta función no puede anularse, por lo que resolvemos la ecuación 4-x^2 = 0 y obtenemos las soluciones x = -2,2. El dominio es entonces, el conjunto (-\infty, -2) \cup (-2,2) \cup (2, \infty), o lo que es lo mismo \mathbb{R} - \{-2,2\}.

13. a) Como en 11, exigimos que x^2-2 \geq 0. Esta inecuación es de segundo grado y debemos estudiarla recurriendo a la ecuación correspondiente x^2-2 = 0, cuyas soluciones son x = -\sqrt{2}, \sqrt{2}. La obtención de las soluciones permite factorizar x^2-2 = (x-\sqrt{2})(x+\sqrt{2}) y la inecuación queda como (x-\sqrt{2})(x+\sqrt{2}) \geq 0. Es decir, ambos factores han de ser del mismo signo. Esto se puede estudiar cómodamente viendo el signo de cada factor en los intervalos determinados por las raíces: (-\infty, -\sqrt{2}), (-\sqrt{2}, \sqrt{2}), (\sqrt{2}, +\infty). Si hacemos esto vemos que en los intervalos (-\infty, -\sqrt{2}) y (\sqrt{2}, +\infty) el producto de ambos factores es positivo. En consecuencia, el dominio es la unión (-\infty, -\sqrt{2}] \cup [\sqrt{2}, +\infty), pues también admitimos que el producto sea nulo. Una forma equivalente de llegar al mismo resultado es observar la gráfica de y=x^2-2, la cual es una parábola que da valores positivos precisamente en los intervalos señalados:

Imagen

El apartado b) es análogo.

14. Debemos resolver la inecuación 2+x-x^2 \geq 0. El procedimiento a seguir es el mismo que en 13.

15. Aquí la solución viene de la intersección de los dominios de las funciones y_1 = \sqrt{-x} e y_2 = \frac{1}{\sqrt{2+x}}. En definitiva, resolvemos el sistema:

-x \geq 0,

2+x >0.

Esto es fácil, tenemos que la solución de la primera inecuación es x \leq 0 y la de la segunda x >-2. Por tanto, el dominio buscado es (-\infty, 0] \cap (-2, \infty) = (-2,0].

Una definición equivalente de grupo ordenado

Leyendo el texto “Elements of Abstract Anaylisis” ( Mícheál Ó Seracóid, Ed. Springer Verlag) me he encontrado con una definición de grupo totalmente ordenado equivalente a la dada en anteriores entradas de esta bitácora. Cito la definición tal como aparece en el texto:Imagen

Vamos a comentar esta definición pero antes daremos unos conceptos sobre orden.

Una relación binaria R sobre un conjunto X, se dice que es un orden estricto si es antireflexiva y transitiva. Es decir, si para cada x \in X es (x,x) \notin R y para cada x,y,z \in X, si (x,y),(y,z) \in R, entonces (x,z) \in R. Escribimos entonces \prec en lugar de R y la definición anterior queda una forma más familiar:

a) Para todo x \in X, x \nprec x.

b) Para todos x,y,z \in X, si x \prec y e y \prec z, entonces x \prec z.

Todo orden estricto cumple la antisimetría y que si x \prec y e y \prec x, entonces por b) sería x \prec x. Pero esto contradice a) por lo que o bien se cumple una de las dos desigualdades anteriores o ninguna.

A partir de un orden estricto siempre se puede obtener un orden parcial. Basta añadir la diagonal de X a la relación. Es decir, si R es un orden estricto en dicho conjunto, R \cup \{(x,x) : x \in X es un orden parcial.

Consideremos ahora un grupo abeliano (G,+) y una partición de G en tres subconjuntos: P, (-P), \{0\}, de forma que (P,+) es un semigrupo. Esto significa que

i) P \cup (-P) \cup \{0\} = G.

ii) P \cap (-P) = \emptyset, P \cap \{0\} = \emptyset, (-P) \cap \{0 \} = \emptyset.

iii) P+P \subset P.

Definimos una relación en G mediante x \prec y, si y sólo si y-x \in P. Esta relación es un orden estricto conexo. En efecto, sean x,y,z \in G. Como x-x = 0 \notin P, se sigue que x \nprec x y la relación es antireflexiva. Si x \prec y e y \prec z, tenemos que (y-x), (z-y) \in P por lo que z-x =(z-y)+(y-x) \in P, lo que prueba que $x \prec z$ y la relación es transitiva. Para acabar, la diferencia x-y es un elemento de G por lo sólo puede ser nula, pertenecer a P o a -P, siendo estas posibilidades mutuamente excluyentes. En el primer caso, x=y. En el segundo, y \prec x y en el tercero y-x =-(x-y) \in P y x \prec y. Por tanto, todos los elementos de G son comparables en esta relación.

Para acabar, bastará añadir a este orden estricto conexo los elementos (x,x) para obtener un orden total \preceq. Este orden total conserva la operación del grupo. Sean x,y,z \in G y supongamos que x \preceq y. Entonces (y-x) \in P o x=y. En el primer caso, (y+z)-(x+z) =(y+z)-(z+x)=y+(z-z)-x = y-x \in P, por lo que x+z \preceq y+z y en el segundo trivialmente x+z = y+z y también x+z \preceq y+z.

Un lema para la demostración de la equicardinalidad de las bases de espacios vectoriales de dimensión finita

Sabemos, en virtud del Lema de Zorn, que todo espacio vectorial tiene al menos una base (en el caso del espacio vectorial trivial se conviene que dicha base esté formada sólo por el conjunto vacío).  Si la base de dicho espacio vectorial tiene cardinal finito se dice que el espacio vectorial es de dimensión finita. Se puede probar que cualquier otra base de dicho espacio tendrá el mismo cardinal finito que la encontrada en primer lugar. En virtud de esto es posible definir la idea de dimensión como un invariante de dicho espacio vectorial. La prueba de la equicardinalidad se basa en una serie de sustituciones. Nosotros daremos aquí un lema que vamos a utilizar para el desarrollo final de esta prueba (que daremos en una entrada posterior).

Sea E un K espacio vectorial no trivial y sea A=(x_{i})_{i=1}^{n} una base de E con n elementos. Supongamos que y es un vector no nulo de E; entonces podemos obtener una nueva base de E eliminando un elemento de A y sustituyéndolo por el vector y.

Como A es una base e y \neq 0, hallaremos que y = \sum_{i=1}^{n} \lambda_{i} x_{i} con no todos los \lambda_{i} nulos. Por tanto, el conjunto de índices
S= \{ i \in \{1,2, \ldots,n\} : \lambda_{i} \neq 0 \}
es no vacío y el conjunto de vectores F(y)= \{x_{i} \in A : i \in S \} es un subconjunto no vacío de A. Sea k un elemento de S, y sea z = x_{k} un elemento de F(y), podemos escribir
y = \sum_{i \in S} \lambda_{i} x_{i}= \lambda_{k} z + \sum_{i \in S- \{k \} } \lambda_{i} x_{i}.
Despejando el valor de z obtenemos

z = \lambda_{k}^{-1} (y - \sum_{i \in S-\{k\}} \lambda_{i} x_{i}).

Probaremos que A_{1} = (A- \{z \}) \cup \{ y \} es una base de E. En primer lugar, para cualquier x de E, sabemos que x pertenece a la envoltura lineal de A y, en consecuencia, se puede obtener como combinación lineal de los elementos de A. Si en tal combinación sustituimos el valor de z por el valor despejado en la ecuación anterior es evidente que x pertenece a la envoltura lineal de A_{1}. Por tanto, E está generado por A_{1}. Veremos finalmente que A_{1} es linealmente independiente. En primer lugar, A-\{z \} es linealmente independiente al ser subconjunto de un conjunto A que es linealmente independiente. Por otro lado, y es no nulo y no depende linealmente de A- \{z \} pues en caso contrario tendría dos expresiones como combinación lineal de elementos de A: una en la que interviene el vector z y otra en la que no. Así pues, A_{1} =(A-\{z \})\cup \{y \} es linealmente independiente y esto acaba nuestra demostración.

 

Semimétricas (o seudométricas)

Hemos visto en la entrada anterior la definición de métrica sobre un conjunto E. Vimos que se trataba de una función real d definida en E \times E con la propiedad de ser no negativa, de verificar la simetría d(x,y) = d(y,x) para cada par (x,y) de E \times E, de cumplir la desigualdad triangular d(x,z) \leq d(x,y)+d(y,z) para x,y,z \in E y de anularse exclusivamente en el caso de que el par (x,y) verifique x=y. También vimos que existe otra manera de definirla con menos condiciones, pero una de esas nuevas condiciones era precisamente la anulación de la función sólo en el caso de que los dos componentes del par sean iguales. Cuando esta condición se “relaja” obtenemos lo que se denomina una semimétrica. Es decir, \rho es una semimétrica sobre E si es una aplicación

\rho: E \times E \rightarrow \mathbb{R}

que verifica

(i) si x=y, entonces \rho (x,y) =0.

(ii)  para todos x,y,z \in E, \rho (x,y) \leq \rho (x,z) + \rho (y,z).

Es fácil comprobar siguiendo los desarrollos de la entrada anterior que estas dos condiciones dan lugar a la definición usual de semimétrica. El lector debe darse cuenta que en este caso la ecuación

\rho (x,y) =0

no implica x =y.

 

Bases de Filtro (2)

Vamos a continuar con algunas propiedades de las bases de filtro. En primer lugar, veremos que se conservan a través de las aplicaciones.
Sean X e Y dos conjuntos no vacíos. Sea \mathcal{H} una base de filtro sobre X y sea f una aplicación de X en Y. Afirmamos que la clase
f(\mathcal{H}) = \{f(A) : A \in \mathcal{H} \}
es una base de filtro sobre Y.
En primer lugar, la clase \mathcal{H} es no vacía por lo que f(\mathcal{H}) será no vacía. Además como el vacío no pertenece a \mathcal{H}, se sigue que para todo A de \mathcal{H} es f(A) no vacío y, por tanto, la clase f(\mathcal{H}) no contiene al vacío. Sean U y V elementos de f(\mathcal{H}). Hallaremos A y B de \mathcal{H}, tales que U = f(A) y V = f(B). Además, como \mathcal{H} es una base de filtro, existe C en \mathcal{H}, no vacío, tal que C \subset A \cap B . El conjunto W = f(C) es no vacío, pertenece a f(\mathcal{H}) y verifica
W= f(C) \subset f(A \cap B) \subset f(A) \cap f(B) = U \cap V .
Esto termina la demostración.
Por otro lado, supongamos que X e Y son dos conjuntos no vacíos. y \mathcal{J} es una familia fundamental sobre Y y f una aplicación de X en Y. Si para todo B de \mathcal{J} es B \cap f(X) no vacío, entonces la clase de las imágenes inversas f^{-1}(\mathcal{J}) = \{ f^{-1} (B) : B \in \mathcal{J} \} es una familia fundamental sobre X. Veamos la prueba. Sean A_{1}, A_{2} dos elementos de f^{-1}(\mathcal{J}). Hallaremos dos conjuntos B_{1}, B_{2} \in \mathcal{J}, tales que A_{1}= f^{-1}(B_{1}),A_{2}= f^{-1}(B_{2}). Entonces

A_{1} \cap A_{2} = f^{-1}(B_{1}) \cap f^{-1}(B_{2}) = f^{-1} (B_{1} \cap B_{2}).

Pero como \mathcal{J} es una familia fundamental, sabemos que existe B_{3} \in \mathcal{J} con B_{3} \subset B_{1} \cap B_{2}, por lo que

f^{-1} (B_3) \subset f^{-1}(B_1 \cap B_2) = A_1 \cap A_2
Si la intersección A_{1} \cap A_{2} fuera vacía, entonces como B_{1} \cap B_{2} \cap f(X) \neq \emptyset, concluiríamos que la intersección B_{1} \cap B_{2} es vacía pues en otro caso su imagen inversa no sería vacía. Así pues, B_{3} = \emptyset y f^{-1} (B_{3}) = \emptyset. Para acabar, si la intersección A_{1} \cap A_{2} no fuera vacía, entonces el conjunto B_{1} \cap B_{2} es no vacío y también son  B_{3} y A_{3} = f^{-1} (B_{3}) no vacíos.

En el teorema anterior, la condición de corte de todo B \in \mathcal{J} con el recorrido de la aplicación f: X \rightarrow Y es esencial. En efecto, podemos asegurar en esas circunstancias que el vacío se obtiene sólo como imagen inversa del vacío.