导航
当前位置:首页 > 公式大全

卷积的计算公式-卷积计算公式

2026-06-19 04:52:20 作者 :佚名 围观 : 2次

卷积这事儿实际上挺像人脑处理图像的那套机制。
你想想看,当你在看一张图时,眼不是整体扫视,而是先聚焦在某个小方块上,再慢慢往四周辐射。卷积就是把这个小方块,也就是“感受野”,给挖出来,然后跟输入图上的内容拼一拼,算出一个“平均反应”。 具体如何算,实际上就是一堆加减乘除和移位。拿数学公式来说,输入图是 $G(x, y)$,卷积核是 $H(u, v)$,输出图就是 $O(x, y)$。你先把那个卷积核 $H$ 在输入图 $G$ 上往上下左右挪。挪的时候,不能只平移一行一列,要沿着网格走,要是遇到边界了,就得按规矩处理,比如补个零要么剪掉,总而言之别让啥负数浮出来。每挪一步,就做一次“点积”运算。点积就是向量乘法,把对应的值乘起来再加起来。但这一步忒脏了,全是乘法,还得切一下,感觉像是在把手里那些乱七八糟的数字和单位换算成标准单位。算完这一堆加起来,这就是一个像素点的输出。 不过这玩意儿范围也忒广了,一次卷积要算整个图,那就得算 $N times M$ 个卷积核,每个都要算 $N$ 次,$M$ 次。
要是分辨率挺高,这工作量简直恐怖,时常要算几分钟。
那会儿有人试过把输入图切成小块,每块都卷积一遍,那叫“分块卷积”,叫卷积池化,叫“上采样”,这种在某些地方能略微省点工夫,但整体还是慢。目前流行的是“整体卷积”,就是整个图一次性算完,速度快,并且能理解整张图的全貌,但这确实忒难弄了,几百万的运算压力,连目前的 GPU 都快扛不住了。 为了把难题简化点,能不能像切香肠一样,只算局部?这就是卷积池化,也叫“下采样”。你先把输入图切成小方格,每个方格就是一个卷积核。操作起来跟上面一样,只是输入图变小了几倍,输出图也就变小了几倍。
比如 $N times M$ 的图,切成 $N/2 times M/2$ 的池化核,那输出就是 $N/2 times M/2$ 的图。如此做有个益处,卷积核的尺寸变小了,运算量也明显少了。
不过,这种池化有个致命伤,把输出变小了,信息就丢失了。
比如原本 28x28 的图,切成 14x14,就只剩了一半像素,细节肯定没了,这就是常说的“分辨率下降”。为了补偿这个损失,还得用“上采样”,就是反过来,把小图变大。
这时候卷积核的尺寸就得变回原来的大小,那就得重新算一遍,要么用“跳个卷积”技巧,把小图分两次卷积,算出两个不同的结局,再拼在一起,补回丢失的信息。 说到卷积核本身,它的形状拍板了它到底能“看”啥。
比如 3x3 的卷积,只能看到前景的 8 个像素,取平均后,边缘和纹理细节就抓不住,只会变成一个不清楚的块。
要是换成 7x7 的卷积,它的感受野就大了一倍,能覆盖 49 个像素,看局部细节的本事就强了。
这种卷积核一般有两类,一个是“对称卷积核”,比如 2x2 的,输入里的一些信息会被来回打转,最终变成一个整体平均值,常用于特征取。另一个是“非对称卷积核”,比如 5x3 的,输入点的信息不会重复利用,每次移动都算新的,适合处理边缘要么序列数据。
还有“对角线卷积核”,它的步长取 1,转了 45 度,能检测到对角线方向的特征。 在实际应用里,卷积核的尺寸和输出尺寸是不对等的。
比如输入是 5x5,卷积核是 3x3,输出就是 5x5;但要是是输入 224x224,卷积核 3x3,输出就是 222x222。
要是卷积核比输入大呢?比如输入 2x2,卷积核 5x5。
这时候卷积核会超出边界,得处理掉,一般就是按零补要么丢弃。输出尺寸也会变小,变成 1x1。
这就好比你拿一把大刷子去刷一个小格子,刷出来的结局肯定比大刷子的面积小。 有人可能会问,既然卷积能如此快地把图变成不同分辨率,那为啥还要干别的?实际上,卷积的核心目标就是在“信息”和“计算难度”之间找平衡。用大卷积核,信息保留得多,但计算慢;用小卷积核,计算快,但信息丢失多。卷积池化让我们能在速度飙升的与此同时,牺牲一点分辨率,换取速度。上采样再把分辨率补回来,别看多运算一次,但能找回细节。 举个具体的例子,假设我们要在手机上实时人脸识别。输入照片是 416x340,直接卷积忒慢了。
那就用 7x7 的卷积核做下采样,输出变成 290x258。
这时候别看分辨率降了,但识别速度够快。
要是在识别完之后,再用一个 11x11 的卷积核做上采样,输出就回去了 340x416,这时候人脸特征就整个了,识别准率就能提上来。
这就是卷积在日常生活中的真样子,它不是那种完美的数学公式,而是工程师们为了在速度和精度之间妥协,发明出来的一套实用手段。别看过程中有丢数据、有补数据、有重复计算,但它确实是让机器也能像人眼一样,快速看懂图像本质的关键。
相关标签:
相关文章
  • 通风换气量计算公式-通风换气量计算公式

    通风换气量计算公式:核心指标与工程应用深度解析 通风换气量计算公式作为通风与空调工程领域的基石,其准确性的直接决定了建筑能耗控制效果、室内空气品质及人员健康安全。长期以来,该公式在各类职业资格考试及

    2026-05-23
  • 解一元二次方程公式法-一元二次方程公式法

    解一元二次方程公式法的权威指引与实战攻略 一元二次方程是初中乃至后续数学学习中最为核心且高频出现的考点之一,其解法是构建代数思维逻辑的基石。长期以来,学生在学习此类题目时往往陷入盲目试算的困境,无法

    2026-05-23
  • 比例计算方法及公式-比例计算方法公式

    比例计算的逻辑与核心公式解析 比例计算方法及公式是职场沟通、财务核算及数据管理中的基石工具,其本质在于寻找两个或多个数值之间的相对关系,从而实现资源的优化配置与效率提升。在职场环境中,无论是分配奖金

    2026-05-23
  • 多重指数导数公式大全-多重指数导数公式全

    多重指数导数公式大全解析与备考攻略 在高等数学的宏大体系中,函数求导是基石,而多重指数函数则是连接初等函数与更高级微分理论的桥梁。多重指数导数公式大全作为学习这一领域不可或缺的权威工具,其重要性不言

    2026-05-23
  • 经验熵公式-经验熵公式改写

    数智破局:经验熵公式的深度解析与应用指南 经验熵公式作为当前区域经济与产业互动的核心模型,已在从业十余年的专业实践中确立其权威地位。它超越了传统线性预测的局限,通过引入动态的熵值机制,精准捕捉了复杂

    2026-05-23