数学笔记 3.6-3.8

rfsfreffr · 2024-11-20 15:59:36 · 个人记录

6. Normed vector space

定义 6.1(绝对值): 设 K 是一个域，如果映射 :
|. | : K \to \R_{\ge 0}
满足以下条件 :
(1).$ $\forall a \in K , (|a| = 0) \Leftrightarrow (a=0) $(3).$ $\forall a,b \in K, |a+b| \le |a| + |b|$. (三角形不等式) 则称之为域上的**绝对值**. **Remark 6.2:** 有了域上的绝对值，我们就可以定义一个诱导度量 : $$d_{| \cdot|} : K \times K \to \R_{\ge 0}$$ $$(a,b) \to |a-b|$$ 不难验证其的确是一个度量 . 进一步的，如果由 $|\cdot|$ 诱导得度量 $d_{|\cdot|}$ 使得 $K$ 成为一个完备得度量空间，则称资料 $(K,|\cdot|)$ 是一个完备域 ($\text{Complete valued field}$). **定义 6.3(范数与半范数):** 设 $(K,|\cdot|)$ 是一个配备了绝对值的域，而 $V$ 是一个 $K$-向量空间，如果映射: $$\| \cdot\|: V \to \R_{\ge 0}$$ $$v \to \| v \|$$ 满足以下条件 : $(1).$ $\forall (a,v) \in K \times V, \| av \| = |a| \cdot \| v \| (2).$ $\forall (v_1,v_2) \in V \times V$, $\|v_1 +v_2 \| \le \| v_1 \| + \| v_2 \|
则称其为半范数，如果还满足 :
(3).$ $\forall v \in V , (v =0) \Leftrightarrow (\| v \| =0)
则称其为是范数. 称资料 (V, \| \cdot \|) 是赋范向量空间.

同理，我们也可以根据向量空间上的范数定义向量空间上的诱导度量.

从现在开始我们固定一个 K-向量空间 V, 且 (K,|\cdot|) 是一个完备域，(V,\| \cdot \|) 是一个赋范向量空间.

定义 6.4(商空间上的商范数): 设 W \subseteq V 是一个线性子空间, 则定义 :
\| \cdot \|_{V / W} : V /W \to \R_{\ge 0} \alpha \to \inf_{s \in \alpha} \| s \|
为 V/W 商空间上的商范数.

我们取 \alpha 中的代表元 s_0 有 \alpha = [s_0], 即有 \forall v \in \alpha , v-s_0 \in W，故而我们这也考虑商范数 :

\| \alpha \|_{V/W} = \| [s_0] \|_{V/W} = \inf_{w \in W} \| s_0 + w \| = \inf_{w \in W} \| s_0 -w \|

故而商范数可以被视为在 \alpha 中任取一点到 W 的最小距离，而以上讨论也向我们展示了，这个最小距离和 s_0 \in \alpha 的选取无关.

现在我们验证，若 \| \cdot \| : V \to \R_{\ge 0} 已经是半范数，则 \| \cdot \|_{V/W} : V/W \to \R_{\ge 0} 至少是一个半范数.

对于 (k,\alpha) \in K \times V/W , \alpha = [s_0]:

\| k \alpha \|_{V/W}= \inf_{w \in W} \| k s_0 -w \| = \inf_{w \in W} \| ks_0 - kw \| = | k | \inf_{w \in W} \| s_0 -w \| =|k| \| \alpha \|_{V/W}

至于三角形不等式，对于 (\alpha,\beta) \in V/W \times V/W , \alpha = [s_1], \beta = [s_2] :

\| \alpha + \beta \| = \inf_{w \in W} \| s_1 + s_2 -w \| = \inf_{w \in W} \| s_1 + s_2 -2w \| \le \inf_{w \in W} \| s_1 -w \| + \| s_2 -w \|

\le

命题 6.5： 对向量空间和其上的半范数 (V, \| \cdot \|) ，子集 N = \{ s\in V | \| s \| =0 \} 是一个向量子空间 . 且 (V / N , \| \cdot \|_{V/N}) 是一个范数.

证明 : 先验证 N 是一个线性子空间

\forall (s_1,s_2) \in N \times N , \| s_1 + s_2 \| \le \| s_1 \| + \| s_2 \| =0 , 故 s_1 + s_2 \in N

\forall (k,s) \in K \times N , \| ks \| = | k | \| s \| =0 ,故 \ ks \in N

故而 N 是一个线性子空间.

考虑 \alpha \in V/N, 设 \alpha = [s]，则:

\forall t \in N , \| s + t \| \le \| s \| + \| t\| = \| s\| = \| s+ t + (-t) \| \le \| s+ t \| + \| -t \| = \| s+ t\|

故而 \| s + t \| \ge \| s \| \ge \| s + t \|, 也就是说 \| s \| = \| s+ t\|, 即 \| \alpha \|_{V/N} = \| s \| .

故而 \| \alpha \|_{V/N} \Leftrightarrow \exist s \in \alpha , s \in N \Leftrightarrow \alpha =N = [0].

这也就验证了其实一个范数.

进一步的，我们也可以在向量空间上诱导拓扑，简单来说有 :

\text{Norm / seminorm} \xrightarrow{} \text{metric space} \xrightarrow{} \text{topology space}

不过以半范数诱导的度量诱导出的拓扑一般不是豪斯多夫的.

Denote 6.6: 设 (V, \| . \|) 是一个 K 上向量空间，且装配了一个半范数，则对于 x \in V , 0 \le r \in \R_{\ge 0}, 我们记 :
B(x,r) = \{ y \in V | \| y-x \| < r \} \bar B(x,r) = \{ y \in V | \| y-x \| \le r \}
注意到，如果我们仍然取子空间 N = \{ s \in V | \| s \| =0 \}, 则对于任意 r>0 , x \in V, 我们有 :
x +N \subseteq \bar B (x,r)
故而其将不是一个豪斯多夫空间. 半范数诱导的拓扑一般是不太好的.

回忆映射的连续性我们是通过拓扑来定义的，而我们在度量空间上可以定义映射的有界性，只是在向量空间上可以定义一类基本的线性映射。我们现在考虑把他们之间的关系.

定义 6.7(有界映射): 设 (V, \| . \|_1),(W, \| . \|_2) 是赋范向量空间，称映射 f: V \to W 是有界的，如果:
\exist c>0 , \forall x \in V , \| f(x) \|_2 \le c \| x \|_1
Lemma 6.8: 如果 (V, \| . \|) 是一个 K 上向量空间，且装配了一个半范数，我们按先前的讨论给其配备一个度量以及一个拓扑. 则 N_{\| . \|} = \{ s \in V | \| s \| =0 \} 是闭集.

证明 : 即说明集合 V \setminus N_{\| . \|} = \{ s \in V | \| s \| >0 \} 是开集. 只需说明其中的每一个元素，都存一个被这个集合包含的开集包含这个元素即可.

设 s\in V \setminus N_{\| . \|} , \| s \| =\varepsilon, 我们取开集 B(s, \dfrac{\varepsilon}{2}) ，下论证 B(s,\dfrac{\varepsilon}{2}) \subseteq V \setminus N_{\| . \|}.

\forall x \in B(s, \frac{\varepsilon}{2}), \| x \| \ge |\| s \| - \| s-x \| | \ge \| s \| - \frac{\varepsilon}{2} = \frac{\varepsilon}{2} >0

第一个大于号来自于:

\| x \| + \|s-x \| \ge \| s \|

\| x \| + \|s \| = \| -x \| + \| s \| \ge \| s -x \|

至于 \| x\| = \| -x \|, 也是对三角形不等式的直接应用.

第二个大于号则来自于 :

x \in B(s, \frac{\varepsilon}{2}) \Rightarrow \| s-x \| < \frac{\varepsilon}{2}

即证.

Theorem 6.9: 设 (V_1, \| . \|_1) 和 (V_2, \| . \|_2) 是赋范向量空间，f : V_1 \to V_2 是线性映射 .
$(2).$ 如果 $f$ 是有界的，则 $f$ 是连续的. $(3).$ 如果 $f$ 是连续的，且 $|. |$ 是 $\text{Non-trival}$ 的 $K$ 上绝对值, 则 $f$ 是有界的.

证明：(1). 由于 f 是连续的，根据 Lemma 6.8 , 可以得出 f^{-1} (N_{\| . \|_2}) 也是闭集.

回忆定义：一个集合的闭包即所有这个集合的聚点组成的集合（在这里滤子取所有包含这个集合的邻域基组成的集合即可）

只需论证任意 x \in N_{\| .\|_1} 的邻域都与 0 的邻域基有交即可.

而显然 \forall x \in N_{\| . \|_1} ,\varepsilon >0 我们显然有 0 \in B(x,\varepsilon), 即你无论怎么取开集（邻域基），他们都必然同时包含了 x 和 0, 故而 x \in \{ \bar 0 \}.

而由闭集的性质有 :

0 \in f^{-1} (N_{\|. \|_2}) \Rightarrow \{ \bar 0 \} = N_{\| . \|_1 } \subseteq f^{-1}(N_{\| . \|_2})

即设 $(x_n)_{n \in \N}$ 是 $V_1$ 中收敛到 $x \in V_1$ 的序列，即 $\lim_{n\to +\infty} \| x_n - x \|_1 =0$ . 只需验证 $(f(x_n))_{n \in \N}$ 在 $V_2$ 中收敛到 $f(x)$ 即可. 这是简单的： $$\lim_{n \to +\infty} \| f(x_n) - f(x) \|_2 = \lim_{n \to +\infty} \| f(x_n-x) \|_2 \le \lim_{n \to +\infty} c \| x_n - x \|_1 =0$$ 这就说明了 $f$ 连续. $(3).$ 下证连续可以推出有界，以及条件绝对值的 $\text{Non-trival}$ 的关键之处. 由于 $f$ 是连续的， $f^{-1} (\{ y \in V_2 | \| y \|_2 <1 \}\})$ 是一个开集, 故存在一个开圆盘包含于这个子集，即： $\exist \varepsilon >0$ 满足 $\forall x \in V_1 , \| x \|_1 <\varepsilon$ 且 $\| f(x) \|_2 <1$. 值得注意的是，这个断言在拓扑是离散拓扑时并不成立，而只有当绝对值 $\text{Non-trival}$ 时其诱导出的拓扑才不是离散拓扑. 而由于 $| . |$ 是 $\text{Non-trival}$ 的，则存在 $ a\in K , 0 < | a | <1$. 我们在绝对值上可以一般的论证，$|1_K| =1 , |a ^{-1}|= |a|^{-1}$, 故而只要其是 $\text{Non-trival}$ 的，就可以取到我们想要的 $a$. 下面我们有断言： $$\forall x \in V_1, \| f(x) \|_2 \le \frac{1}{\varepsilon | a|} \| x \|_1$$ 对于 $\| x \|_1=0$ 的情形已在 $(1)$ 做了充足讨论 . 下面考虑 $\| x \|_1 >0$ 的情形，由简单的讨论可知： $$\forall x \in V_1, \| x \|_1 >0, \exist n \in \Z , \| a^n x \|_1 = | a|^n \| x \| _1 <\varepsilon \le \| a^{n-1} x \| = |a|^{n-1} \| x \|_1$$ 故而: $$|a|^n \| f(x)\|_2 = \| f(a^n x)\|_2 <1$$ 这也我们就可以快乐的放缩了： $$\| f(x) \|_2 < \frac{1}{|a|^n} = \frac{1}{| a|^{n-1}} \frac{1}{|a|} \le \frac{1}{\varepsilon |a|} \| x \|_1$$ 这个证明还挺妙的，作为结论，对于赋范向量空间之间的线性映射，连续和有界是等价的. 反过来思考的话，就是一个线性连续的映射，我们总可以找到一个常数做很好的放缩。故而就引出了以下讨论。 > **定义 6.10(算子半范数):** 设 $(V_1,\|. \|_1) ,(V_2,\|.\|_2)$ 都是赋范向量空间，对于映射 $f :V_1 \to V_2$, 我们定义 : > > $$\| f \| := \begin{cases} \sup_{x \in V_1 \setminus N_{\| .\|_1}} \dfrac{\| f(x) \|_2}{\| x \|_1} , & f(N_{\| . \|_1}) \subseteq N_{\| . \|_2} \\ + \infty , & f(N_{\| .\|_1}) \nsubseteq N_{\| . \|_2} \end{cases}$$ > > 我们在记 $\mathscr L (V_1,V_2)$ 是所有有界线性 $K$-映射组成的集合，其显然是 $\text{Hom}_K (V_1,V_2)$ 的线性子空间. 而 $\| .\|$ 定义了 $\mathscr L(V_1,V_2)$ 上的范数/半范数. (验证是容易的) > **命题 6.11:** 如果 $\|.\|_2$ 是范数，则 $\|.\|$ 是一个范数. 证明：因为如果 $f \neq 0$ （不是零映射）, 则存在 $\| x \|_1 \neq 0$ 使得 $\dfrac{\| f(x) \|_2}{ \| x \|_1} >0$, （即 $f(x) \neq 0 $ ，由于 $\| .\|_2$ 是范数，我们有 $\| f(x) \|_2 >0$), 这蕴含了 $\| f \| >0$. 即 $\| . \|$ 是个范数. > **定义 6.12:** 设 $(V,\|. \|)$ 是一个赋范向量空间，且其诱导的度量是完备的，则称其是 $\text{Banach space}$. > **Theorem 6.13:** 如果 $(V_2, \| . \|_2)$ 是 $\text{Banach space}$ , 则 $\mathscr L(V_1,V_2)$ 也是 $\text{Banach space}$. 证明： ## 7. differential 接下来我们来考虑可微性，在此我们固定一个完备的域 $(K,|.|)$,且 $|.|$ 是 $\text{Non-trival}$. 我们在此以拓扑的语言引入一次小 $o$ 和大 $o$ 的记号 : > **定义 7.1:** 设 $E$ 是 $K$ 上赋范向量空间, $X$ 是一个拓扑空间。我们考虑映射 $f : X \to E$ 以及非零映射 $g : X \to \R_{\ge 0}$ , 取元素 $p \in X$. > > $(1).$ 记号 $f(x) = O(g(x)) , x \to p$ 蕴含 : > > $$对于任意 p 的邻域 V， \exist c>0, \forall x \in V , \| f(x) \| \le c g(x)$$ > > $(2).$ 记号 $f(x) = o(g(x)), x \to p$ 蕴含 > > $$\exist p 的邻域 V, 映射 \varepsilon : V \to \R_{\ge 0}$$ > > $$此映射满足 \forall \delta >0 , \exist 开邻域 p \in U \subseteq V, 使 \forall x \in U, \varepsilon(x) \le \delta$$ > > $$即 \lim_{x \in V, x \to p} \varepsilon (x)=0$$ > > $$满足 \forall x \in V, \| f(x) \| \le \varepsilon (x) g(x)$$ > **定义 7.2:** 设 $E,F$ 都是 $K$ 上的赋范向量空间，按标准手法诱导上面的度量以及拓扑，设 $U \subseteq E$ 是开集，我们考虑映射 $f: U \to F$. > > 对于 $p \in U$, 如果存在 $\varphi \in \mathscr L(E,F)$ 满足 : > > $$f(x) = f(p) + \varphi (x-p) + o( \| x - p \|) , x \to p$$ > > 则称 $f$ 在 $p$ 点可微，且称 $\varphi$ 为 $f$ 在 $p$ 点微分. 在这里 $f$ 只不过是任意的映射，而微分即是在局部邻域用线性映射逼近 $f$ 的变化. 按小 $o$ 记号的定义展开，微分 $\varphi \in \mathscr L(E,F)$ 满足：存在一个开邻域 $V$ 使得 $p \in V \subseteq U$, 以及映射 $\varepsilon : V \to \R_{\ge 0}$ 满足 $\lim_{x \to p} \varepsilon (x) =0$ 使得: $$\forall x \in V, \| f(x)- f(p) - \varphi(x-p) \| \le \varepsilon (x) \| x -p \| $$ 从定义上看的确封装的有点冗杂，但就实际操作而言是比较易于计算的. 为何在赋范向量空间之间的映射才可定义可微？微分说白了就是我们用一个线性的函数去在局部的逼近一般的函数，而逼近的程度，即的确恰好给他逼近到了，我们必须得有一个度量去描述逼近的程度，以及极限来说清楚的确在那一点是逼近到的，而这些都需要极限语言和范数来描述。下面我们来说明可微则微分唯一. > **Theorem 7.3** 设 $f: U \to F$ 在 $p$ 点可微，则微分唯一，我们记其为 $\text{d}f_p$. 证明：还是挺巧妙地，由于 $(F,\| .\|)$ 是范数，故而 $\mathscr L(E,F)$ 上的 $\|.\|$ 是范数，我们取 $\varphi_1,\varphi_2 \in \mathscr L (E,F)$ 都是 $f$ 在 $p$ 点的微分，我们对 $\| \varphi_1 -\varphi_2 \|$ 做讨论 . 根据定义减一下易得 : $$(\varphi_1 -\varphi_2 )(x -p) = o(\| x-p\|)$$ 在 $|.|$ 是 $\text{Non-trival}$ 的情形下，我们有很好的局部考虑策略 : $$\forall \delta >0, \| \varphi_1 - \varphi_2 \| = \sup_{y \in E \setminus \{ 0\}} \dfrac{\| (\varphi_1-\varphi_2)(y) \|}{\| y \|}$$ $$= \sup_{y \in E \setminus \{ 0 \} , \| y \| < \delta} \dfrac{\| (\varphi_1 - \varphi_2)(y) \|}{ \| y \|}$$ 故而，一个线性映射的范数是多少，只需在一个很小的邻域( $0$ 的邻域)内就可以被确定. 而再对小 $o$ 记号做处理，即存在 $\varepsilon :V \to \R_{\ge 0}$, 其中 $V$ 是 $p$ 的邻域，满足 $p \in V \subseteq U$, 且 $\lim_{x \to p} \varepsilon(x)=0$. 按定义展开有 : $$\| (\varphi_1 - \varphi_2 )(x-p)\| \le \varepsilon (x) \| x-p \| , x \to p$$ 故: $$\| \varphi_1 - \varphi_2 \| = \inf_{\delta >0} \sup_{y \in E, 0< \| y-p \| \le \delta} \dfrac{\| (\varphi_1-\varphi_2)(y-p) \|}{\| y-p \|}$$ $$\inf_{\delta >0} \sup_{y \in E, 0 < \| y-p \| \le \delta} \varepsilon (y) = \limsup_{y \to p} \varepsilon(y) =0$$ 故而 $\varphi_1 =\varphi_2$. > **Example 7.4:** > > $(1).$ $f : U \to F$ 为常值函数 $f(x)= c \in F$,则 $\text d f_p =0

$(3).$ 取赋范向量空间 $E \times E$ 和 $E$, 其上的范数分别定义为 : $$E : \|. \|$$ $$E \times E : \| (x,y) \| = \| x \| + \| y \|$$ 定义映射 $f : E\ \times E \to E$ 为 : $$f : E \times E \to E$$ $$(x,y) \to x+y$$ 显然其是有界线性映射，故而 $\text d f_{(p,q)}=f$. $(4).$ 这是一个不那么平凡的例子，我们考虑赋范向量空间 $(K,E),E$. 其上的范数定义为 : $$E : \|. \|$$ $$K \times E : \| (\lambda,x) \| = \| \lambda x \|$$ 现在我们考虑映射 : $$m : K \times E \to E$$ $$(\lambda,x) \to \lambda x$$ 我们来计算其在 $(a,p) \in K \times E$ 处的微分是什么 . 考虑： $$\lambda x -ap = (\lambda -a) p + a(x-p) + (\lambda-a)(x-p)$$ 以及 : $$\| \lambda x - ap - \text d m_{a,p}(\lambda -a, x-p) \| = o(\|(\lambda-a),(x-p)\|)$$ $$= o(\| (\lambda-a)(x-p) \|)$$ 容易看出 : $$\forall (\mu,y) \in K \times E , d m_{a,p}(\mu,y)=\mu p + ay$$ **Theorem 7.5(Chain rule of differential):** 设 $E,F,G$ 都是赋范线性空间，对于开集 $U \subseteq E, V \subseteq F$ 定义映射 $f : U \to F, g : V \to G$. 如果 $f(U) \subseteq V, p \in U$. $f$ 在 $p$ 可微且 $g$ 在 $f(p)$ 可微，则 $g \circ f$ 在 $p$ 可微，且 : $$\text d (g \circ f)_p = \text d g_{f(p)} \circ \text d f_p$$

证明 : 无非是一些计算和放缩

f(x)-f(p) = \text d f_p (x-p) + o (\| x -p \|) \le \| \text d f_p \| \cdot \|x -p \| + o (\| x - p \|) = O(\| x-p \|) , x \to p

那么：

(g\circ f)(x) = g(f(p)) + \text d g_{f(p)} (f(x) - f(p)) + o (\| f(x) - f(p) \|) ,x \to p

= g(f(p)) + \text d g_{f(p)} (\text d f_p (x-p) + o(\| x -p \|)) + o(O(\| x -p \|)) , x \to p

=g(f(p)) + \text d g_{f(p)} \text d f_p(x-p) + o(\| x -p \|), x \to p

故而：

\text d (g \circ f)_p = \text d g_{f(p)} \circ \text d f_p

从某种意义上来说，我们是构造了一个符合条件的微分，并以此说明了可微性以及我们想要证明的公式 .

推论 7.6: 设 E,F 都是赋范向量空间， U \subseteq E 是开集, 定义映射 f : U \to K , g : U \to F, 取 p \in U. 若 f,g 都是在 p 可微的，定义映射 :
fg : U \to F x \to f(x) g(x)
则:
\text d fg_p = g(p) \text d f_p + f(p) \text d g_p
特别的，当 F=K 时，此即乘积求微的法则.

证明：将 fg 考虑为映射的合成 :

U \xrightarrow{h} K \times F \xrightarrow{m} F

x \to (f(x),g(x)) \to f(x)g(x)

然后再应用 \text{Theorem 7.5} 以及 \text{Example 7.4(4)} 中的结果 :

\text d fg_p (x) = \text d (m \circ h)_p(x)

= \text d m_{h(p)} (\text d h_p (x))=\text d m_{f(p),g(p)} (\text d f_p (x), \text d g_p(x))

=g(p) \text d f_p (x) + f(p) \text d g_p (x)

Denote 7.7: 设 p \in U \subseteq K 是开集，(F, \| . \|) 是赋范向量空间，如果映射 f : U \to F 在 p 可微, 那么记 \text d f_p (1) \in F 为 f'(p) , 且称其为 f 在 p 的导数 .

Example 7.8: 对于映射:
f_n : K \to K x \to x^n
可以归纳的证明 \text d f_n (x)