Teorema de Hanh-Banach — Forma Analítica-Algebráica

Teorema 1. Sea \(E\) un espacio vectorial sobre \(\mathbb{K}\), \(F\) un subespacio vectorial de \(E\) y \(g\colon F \rightarrow \mathbb{K}\) un funcional lineal tal que

\[\begin{cases} g(x) \leq p(x) & \quad \forall x\in F \quad \text{ si }\quad \mathbb{K}=\mathbb{R}\\ \text{Re}(g(x)) \leq p(x) & \quad \forall x\in F \quad \text{ si }\quad \mathbb{K}=\mathbb{C} \end{cases}\]

donde \(p\) es un funcional sublineal sobre \(E\). Entonces, existe\(f\colon E \rightarrow \mathbb{K}\)un funcional lineal tal que

  1. \(f|_F = g\);

  2. \[\begin{cases} f(x) \leq p(x) & \quad \forall x\in E \quad \text{ si }\quad \mathbb{K}=\mathbb{R}\\ \text{Re}(f(x)) \leq p(x) & \quad \forall x\in E \quad \text{ si }\quad \mathbb{K}=\mathbb{R} \end{cases}\]

Demostración. Para la elaboración de esta demostración vamos a proceder por etapas; además, en la primera versión, demostraremos el caso real. Luego, a partir, del caso real, extenderemos el resultado al caso complejo.

  • Etapa 1: Extendemos el funcional a un subespacio vectorial con una dimensión adicional.

    Así, supongamos que \(E\neq F\). (¿por qué?) Para \(z\in E\smallsetminus F\), se define el siguiente espacio vectorial:

    \[F_z = \{y+tz\,:\, y\in F \text{ y } t\in\mathbb{R}\}.\]

    Notemos que (Observación: Claramente se ve que la dimensión de \(F_z\) es mayor en una unidad que la dimensión de \(F\))

    • \(F_z\) es un subespacio vectorial

    • Todo elemento de \(F_z\) tiene una representación única.

    Para la primera parte: Notemos que, en efecto, es un subespacio vectorial de \(E\). Para ello, claramente \(0\in F\), pues \(F\) es subespacio vectorial y \(0\in\mathbb{R}\); análogamente, se tienen las propiedades restantes y se demuestra lo requerido.

    Así, podemos definir el siguiente funcional (Observación: Este funcional es la «primera extensión que planteamos de \(g\), por lo tanto, debemos verificar las condiciones. Es decir, estamos construyendo lo que necesitamos.)

    \[% { \begin{array}{r@{\,}ccl} f\colon & F_z & \longrightarrow & \mathbb{R}\\ & y+tz & \longmapsto & \displaystyle f(y+tz)= g(y)+t\alpha \end{array} }\]

    donde \(\alpha\in\mathbb{R}\) es una constante por determinar más adelante y cuya función sea garantizar las propiedades buscadas.

    Para cumplir con los requerimientos del teorema, necesitamos que el funcional que definimos, satisfaga la dominación local (sobre \(F\)), es decir,

    \[f(y+tz) \leq p(y+tz) \quad \forall y\in F, \quad \forall t\in\mathbb{R}.\]

    Ahora, por la definición de \(f\), se tiene que la desigualdad anterior es equivalente a tener lo siguiente

    \[\tag{1}\label{1} g(y)+ t\alpha \leq p(y+tz) \quad \forall y\in F, \quad \forall t\in\mathbb{R}.\]

    Así, para comprobar lo requerido, consideremos los siguientes casos:

    • si \(t=0\), entonces en la ecuación (1)

      \[g(y) \leq p(y) \quad \forall y\in F,\]

      lo cual es cierto pues por hipótesis se tiene.

    • si \(t>0\), entonces, dividiendo la ecuación (1) para \(t\), se tiene que

      \[\frac{g(y)}{t} + \alpha \leq \frac{p(y+tz)}{t} \Longleftrightarrow g\left(\frac{y}{t}\right) + \alpha \leq p\left(\frac{y}{t}+z\right) \quad \forall y \in F.\]

      Luego, definiendo \(u = y/t\), se tiene que, en la ecuación anterior,

      \[g(u)+\alpha \leq p(u+z) \quad \forall u\in F;\]

      y por lo tanto,

      \[\tag{2}\label{2} \alpha \leq p(u+z) -g(u) \quad \forall u\in F.\]

    • si \(t<0\), entonces, dividiendo la ecuación (1) para \(-t\), se tiene que

      \[\frac{g(y)}{-t} – \alpha \leq \frac{p(y+tz)}{-t} \Longleftrightarrow g\left(-\frac{y}{t}\right) – \alpha \leq p\left(-\frac{y}{t}-z\right) \quad \forall v \in F.\]

      Luego, definiendo \(v=-\frac{y}{t}\), se tiene que

      \[\tag{3}\label{3} g(v) – p(v-z) \leq \alpha \quad \forall v\in F.\]

    Así, por (2) y (3), se sigue que

    \[\tag{4}\label{4} g(v)-p(v-z) \leq \alpha \leq p(u+z)-g(u) \quad u,v\in F.\]

    Pero, para que se tenga la expresión de la ecuación (4), se debe cumplir al menos que

    \[g(v)-p(v-z)\leq p(u+z)-g(u)\quad \forall u,v\in\mathbb{F};\]

    por lo tanto, verifiquemos esto. Sean \(u,v\in F\), notemos que

    \[\begin{aligned} g(u)+g(v) & = g(u+v) && \text{Pues es lineal}\\ & \leq p(u+v) && \text{por hipótesis}\\ & \leq p(u+z) + p(v-z) && \text{por se sublineal}\end{aligned}\]

    De donde, se puede concluir que

    \[g(v)-p(v-z) \leq p(u+z) + g(u) \quad \forall u,v\in F,\]

    como se quería. Así, la expresión en (4) está bien definida. (Observación: Esto se dice pues en el peor de los casos, se tendría que el \(\alpha\) simplemente sería igual a las expresiones restantes de la desigualdad.) Ahora, en (4), puesto que \(\alpha\) es cota superior e inferior, se sigue que podemos tomar \(\alpha\in\mathbb{R}\) tal que

    \[\sup_{v\in F}\{g(v)-p(v-z)\}\leq \alpha \leq \inf_{v\in F}\{p(u+z)-g(u)\}.\]

    Así, se tiene que \(f\) está dominado por \(p\), es lineal y es una extensión de \(g\) a \(F_z\).

  • Etapa 2: Extendemos el funcional a todo el espacio \(E\) mediante el lema de Zorn.

    Definamos el conjunto

    \[\Omega:= \left\{ (Z,L_Z)\,:\, \begin{array}{l} z \text{ es un subespacio vectorial de } E \text{ tal que } F\subseteq Z \\ L_Z\colon Z \rightarrow \mathbb{R} \text{ es lineal}\\ L_Z|_F = g \\ \forall x\in Z\,:\, L_z(x) \leq p(x). \end{array}\right\}\]

    y la siguiente relación de orden parcial sobre \(\Omega\)

    \[(Z_1,L_{Z_1}) \leq (Z_2,L_{Z_2}) \quad\text{si y solo si}\quad Z_1\subseteq Z_2 \qquad\text{y}\qquad L_{Z_2}|_{Z_1} = L_{z_1}\]

    Así, notemos que \(\Omega\) es no vacío pues \(g\in \Omega\).

    Ahora, sea \(\{(Z_i,L_{Z_i})_i\}_{i\in I}\subseteq \Omega\) un subconjunto totalmente ordenado cualquiera y \(Z=\bigcup_{i\in I}Z_i\), definamos

    \[% { \begin{array}{r@{\,}ccl} L_Z\colon & Z & \longrightarrow & \mathbb{R}\\ & x & \longmapsto & \displaystyle L_Z(x) = L_{Z_i}(x), \end{array} }\]

    con \(x\in Z_i\). Así, \(L_z\) está bien definida, es decir, la definición de \(L_Z\) no depende del índice elegido (Observación: Del índice \(i\in I\)).

    Vamos a probar que \(L_Z\) está bien definida.

    Sea \(x\in Z_i \cap Z_j\) con \(i\neq j\), como \(\{(Z_i,L_{Z_i})_i\}_{i\in I}\) es totalmente ordenado, entonces

    \[(Z_i,L_{Z_i}) \leq (Z_j,L_{Z_j}) \qquad\text{o}\qquad(Z_j,L_{Z_j}) \leq (Z_i,L_{Z_i}).\]

    Así, sin pérdida de generalidad podemos tomar que

    \[(Z_i,L_{Z_i}) \leq (Z_j,L_{Z_j});\]

    por la relación de orden, tenemos que

    \[Z_i \subseteq Z_j \qquad\text{y}\qquad L_{Z_j}|Z_i = L_{Z_i},\]

    luego, como \(x\in Z_i\cap Z_j\), entonces

    \[L_z(x) = L_{Z_i}(x) = L_{Z_j}(x) y\]

    por tanto \(L_Z\) está bien definida.

    Vamos a probar que \((L_Z,Z)\) está en \(\Omega\)

    Como \(\{(Z_i,L_{Z_i})_i\}_{i\in I}\) es totalmente ordenado, entonces, se tiene que \(Z\) es un subespacio vectorial (Observación: Pues todos los \(Z_i\) están incluidos entre sí) y \(L_Z\) es lineal pues el \(L_{Z_i}\) es lineal por hipótesis. Por otro lado, también tenemos que \(F\subseteq Z\) pues para cada \(Z_i\), se tiene que \(F\subseteq Z_i\), del mismo modo, \(L_{Z_i}|_F = g\), pues cada \(L_{Z_i}\) extiende a \(g\) para todo \(i\in I\), finalmente \(L_z(x)\leq p(x)\) para todo \(x\in Z\) pues para cada \(i\in I\), se tiene que

    \[L_{Z_i} (x) \leq p(x) \quad \forall x\in Z_i\]

    Finalmente, notemos que \((Z,L_Z)\) es cota superior de \(\{(Z_i,L_{Z_i})_i\}_{i\in I}\) por la definición propia de \((Z,L_Z)\).

    De esta manera, aplicando el lema de Zorn, existe al menos un elemento maximal para \(\Omega\), digamos \((\hat{Z},L_{\hat{Z}})\). Finalmente, vamos a probar que \(Z= E\). Para probar este paso, supongamos por absurdo que \(Z\neq E\); así, usando el desarrollo de la Etapa 1, se tiene que, por un lado podemos tomar \(z\in E\smallsetminus Z\), el cual es no nulo pues \(Z\) es un subespacio vectorial. Luego, tomando \(g= L_{\hat{H}}\), tenemos que, por un lado

    \[g(x) = L_{\hat{H}}(x) = F_z(x) \quad \forall x \in \mathop{\mathrm{Dom}}g,\]

    además, \(F_Z(x)\) es lineal y está dominado por \(p\). De esta manera, hemos encontrado un elemento \((\mathop{\mathrm{Dom}}F_Z,F_Z(x))\) distinto de \((\hat{Z},L_{\hat{Z}})\), tal que

    \[(\hat{Z},L_{\hat{Z}}) \leq (\mathop{\mathrm{Dom}}F_Z,F_Z(x)).\]

    Pero esto no es posible pues contradice el hecho de que \((\hat{Z},L_{\hat{Z}})\) es un elemento maximal de \(\Omega\), por lo tanto, se concluye que \(Z=E\) y tomando \(f=L_{\hat{Z}}\), se sigue lo requerido.

 

Demostración – Caso Complejo. Para el caso complejo, notemos que el funcional \(g\) es un funcional \(\mathbb{C}-lineal\), el cual se puede escribir como la suma de la parte real y la parte imaginaria

\[% { \begin{array}{r@{\,}ccl} g\colon & F & \longrightarrow & \mathbb{C}\\ & x & \longmapsto & \displaystyle g(x) = g_1(x)+ig_2(x), \end{array} }\]

donde \(g_1,g_2\colon F \rightarrow \mathbb{C}\) son funciones \(\mathbb{R}-lineales\)

Sea \(E\) un espacio vectorial sobre \(\mathbb{K}\), y \(f\colon E \rightarrow \mathbb{K}\) un funcional. Se dice que \(f\) es \(\mathbb{K}-lineal\) si

\[f(\lambda x+y) = \lambda f(x) + f(y) \quad \forall x,y\in E \qquad\text{y}\qquad\forall \lambda \in\mathbb{K}.\]

Así, notemos que todo funcional \(\mathbb{C}-lineal\) es \(\mathbb{R}-lineal\), pues todo espacio vectorial sobre \(\mathbb{C}\), también es un espacio vectorial sobre \(\mathbb{R}\). No obstante, la recíproca no es cierta. Por ejemplo, \(\mathbb{R}^2\) es un espacio vectorial real pero no complejo. Por ejemplo,

\[F(x,y) = (x-y,x+y)\]

es \(\mathbb{R}-lineal\) pero no \(\mathbb{C}-lineal\).

Además, por hipótesis, se sabe que

\[\text{Re}(g(x)) = g_1(x) \leq p(x), \quad \forall x\in F_\mathbb{R};\]

así, por el teorema de Hang-Banach, caso real, se tiene que existe \(f_1\colon E_\mathbb{R} \rightarrow \mathbb{R}\) \(\mathbb{R}-lineal\) tal que

  • \(f_1|_{F_\mathbb{R}}= g_1\)

  • \(f_1(x)\leq p(x)\) para todo \(x\in E_\mathbb{R}\).

Ahora, como para todo \(z\in \mathbb{C}\), se tiene que

\[\text{Im}(z)= – \text{Re}(iz)\]

En efecto, como

\[Z = \text{Re}(z)+i\mathop{\mathrm{Im}}{z} \Longrightarrow iz = i\text{Re}(z) – \mathop{\mathrm{Im}}{z}= \text{Re}(iz)+i\mathop{\mathrm{Im}}{iz}\]

De esta manera, se sigue que

\[\mathop{\mathrm{Im}}{z} = – \text{Re}(iz).\]

Así, definimos el siguiente funcional

\[% { \begin{array}{r@{\,}ccl} f\colon & E & \longrightarrow & \mathbb{C}\\ & x & \longmapsto & \displaystyle f(x)= f_1(x)-if_1(ix), \end{array} }\]

Notemos que \(f\) es \(\mathbb{R}-lineal\) y por la definición de \(f\), se sigue que \(f(ix)=if(x)\), para todo \(x\in E\), entonces \(f\) también va a ser \(\mathbb{C}-lineal\).

Además, claramente, se tiene que \(f|_F=g\) y además, \(\text{Re}(f(x))\leq g(x)\) para todo \(x\in E\)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *