向量范数这东西在数学里实际上就是一把尺子,用来衡量一个向量有多“长”要么有多“胖”。想象你在拿一根棍子去推墙,要么盯着一个向量看,它是个啥样的形状。最经典的范数叫欧几里得范数,也就是咱们高中几何里那个直角三角形斜边的长度。对于一个三维空间里的点 (x, y, z),它的长度就是 $sqrt{x^2 + y^2 + z^2}$。
这个公式看着挺复杂,但实际上就是勾股定理的三次方根形式。
要是你在二维平面里,就是个直角三角形的斜边,没难题;到了四维就连更高维,你只需求想象一个直角四面体,把对边连起来,开四次方根就行,彻底没毛病。 我们再来看看$L_1$范数,这个在计算机科学里挺常见的,特别是在讲$L_1$正则化要么$L_1$投影的时候。它叫“曼哈顿距离”,实际上就是你数数一个格子里有多少个非零元素。
比如一个向量是 $(3, 1, 2, 0)$,算作$L_1$范数的话,就是数一下里面非零的数字个数,正好是 3。
这玩意儿别看不是直接算长度,但它实际上挺像一种“坚持”的度量:只要方向不对,哪怕数值挺大,也不影响计数结局。
这种范数在最优解里时常出现,比如判断一个向量是否能由一组基向量线性表示。 $L_infty$范数嘛,就好办多了,叫“最大绝对值”要么“无穷范数”。
要是你看那个向量 $(3, 1, 2, 0)$,它的$L_infty$范数就是取里面最大的那个数,也就是 3。
这和你在地图上看坐标,只看哪个分量最大是一样的。
这种范数在计算几何里特别有用,特别是涉及到旋转矩阵要么数据压缩的时候,只要有一个分量特别大,整个数值就会被放大。 要是把它们拼起来,$L_2$范数就是平方、求和再开根号,$L_1$是绝对值求和,$L_infty$是绝对值开各自的最大值,这就构成了最常见的几种范数家族。 算范数实际上挺有意思的,它不只是是个公式,更是一个关于空间结构的直觉。
比方说,当一个向量挺长时,它的$L_2$范数肯定挺大,出于平方之后数值会暴增;但在$L_1$范数里,长向量要是大局部是零,数值并不会像$L_2$那样爆炸。
这就好比你在跑步,$L_2$看的是你总跑的距离,$L_1$看的是你有多少个非零步态。 有时候你会认定公式忒死板,认定它只适合做题。
实际上不然。在实际工程中,比如神经网络训练,我们时常用到$L_1$范数,出于它能让模型更稀疏,也就是让某些权重变成零,这样计算量就小了。
要么在图像处理里,用$L_1$范数做某种度量,能更好地保留边缘信息。
这些应用场景说明,范数不只是为了好看,而是为了更贴合我们处理数据的方式。 再说说具体例子。假设你有一个向量 $mathbf{v} = [5, 10, 15]$,你想算它的最短距离要么某种代价。用$L_2$算,就是 $sqrt{25 + 100 + 225} = sqrt{350} approx 18.7$。用$L_1$算,就是 $5 + 10 + 15 = 30$。
这两个结局差别一大,这就体现了范数选择的关键性。
要是你希望距离更敏感于大数值的变化,要么希望向量能“贴近”原点而不被某些分量拖住,$L_2$可能更合适;要是你希望惩罚大的分量,要么鼓励解的稀疏性,$L_1$就是神器。 还有时候,范数在定义上也有点“任性”。
比如$L_p$范数,当$p=2$时是欧几里得距离,但当$p$取其他值时,它的几何意义就启动变了。有些$p$值会让范数变得不那么连续,就连在某些特定的子空间里表现得贼怪异,这时候算起来就不撇脱。 最终总结一下,向量范数就是给向量量身定做的度量工具。哪些范数好,往往取决于你的具体难题。
有没有啥数学直觉?自然有。你认定目前的 $L_2$ 范数是不是有点过于对称了?实际上想想看,在概率论里,$L_2$范数常和距离的平方相关,但或许在某些极端情况下,$L_1$要么$L_infty$会显得更有用。数学的魅力就在于这种“工具之故此好用,是出于它恰好解决了某种特定需求”的辩证关系。别再死记公式了,试着去理解它背后对空间结构的描述,你会发现,那个 $sqrt{sum x_i^2}$ 实际上更像是在描述一种“整体平衡”的感觉,而不只是长度。