TensorFlow的tf.nn.max_pool中'SAME'和'VALID'填充有什么区别？

原作者: [db:作者] 来自: [db:来源] 收藏邀请

在tensorflow的tf.nn.max_pool中’SAME’和’VALID’填充有什么区别？

在我看来，’VALID’意味着做最大池时，边外没有零填充。

根据A guide to convolution arithmetic for deep learning，它表示池化操作符中没有填充，即只使用tensorflow的’VALID’。但是什么是tensorflow中最大池的’SAME’填充？

最佳解决方案

我举一个例子来说明一点：

x：shape[2,3]，1通道的输入图像
valid_pad：具有2×2内核，步幅2和VALID填充的最大池化。
same_pad：最大池化，2×2内核，步幅2和SAME填充(这是经典的方法)

输出形状为：

valid_pad：这里没有填充，所以输出形状为[1,1]
same_pad：在这里，我们将图像填充到形状[2,4](使用-inf，然后应用最大池化)，因此输出形状为[1,2]

x = tf.constant([[1., 2., 3.],
                 [4., 5., 6.]])

x = tf.reshape(x, [1, 2, 3, 1])  # give a shape accepted by tf.nn.max_pool

valid_pad = tf.nn.max_pool(x, [1, 2, 2, 1], [1, 2, 2, 1], padding='VALID')
same_pad = tf.nn.max_pool(x, [1, 2, 2, 1], [1, 2, 2, 1], padding='SAME')

valid_pad.get_shape() == [1, 1, 1, 1]  # valid_pad is [5.]
same_pad.get_shape() == [1, 1, 2, 1]   # same_pad is  [5., 6.]

次佳解决方案

如果你喜欢ascii art：

"VALID" =没有填充：

   inputs:         1  2  3  4  5  6  7  8  9  10 11 (12 13)
                  |________________|                dropped
                                 |_________________|

"SAME" =零填充：

               pad|                                      |pad
   inputs:      0 |1  2  3  4  5  6  7  8  9  10 11 12 13|0  0
               |________________|
                              |_________________|
                                             |________________|

在这个例子中：

输入宽度= 13
过滤宽度= 6
步幅= 5

注意：

"VALID"只丢弃最右边的列(或最底部的行)。
"SAME"尝试向左和向右均匀填充，但如果要添加的列数是奇数，它将向右添加额外的列，如本示例中的情况(相同的逻辑垂直应用：可能有一个额外的底部的一排零)。

第三种解决方案

TensorFlow Convolution示例概述了SAME和VALID之间的差异：

对于SAME填充，输出高度和宽度计算如下：

out_height = ceil(float(in_height)/float(strides [1]))

out_width = ceil(float(in_width)/float(strides [2]))

和

对于VALID填充，输出高度和宽度计算如下：

out_height = ceil(float(in_height – filter_height + 1)/float(strides [1]))

out_width = ceil(float(in_width – filter_width + 1)/float(strides [2]))

第四种方案

当stride为1时(更常见的是卷积而不是合并)，我们可以想到以下区别：

"SAME"：输出大小与输入大小相同。这需要过滤器窗口在输入映射外滑动，因此需要填充。
"VALID"：过滤器窗口保持在输入映射内的有效位置，因此输出大小会缩小filter_size - 1。没有填充。

第五种方案

填充是一种增加输入数据大小的操作。在一维数据的情况下，您只需在数组中附加/前置一个常数，使用这些常数在2维度环绕矩阵中。在n-dim中，您可以使用常量包围n-dim超立方体。在大多数情况下，此常数为零，称为zero-padding。

以下是zero-padding与p=1应用于2-d张量的示例：

您可以为内核使用任意填充，但某些填充值的使用频率高于其他填充值：

有效填充。最简单的情况，意味着根本没有填充。只需保留您的数据即可。
SAME填充有时称为HALF填充。它被称为SAME，因为对于stride = 1的卷积(或用于汇集)，它应该产生与输入相同大小的输出。它被称为HALF，因为对于大小为k的内核
FULL填充是最大填充，不会导致仅填充元素的卷积。对于大小为k的内核，此填充等于k - 1。

要在TF中使用任意填充，可以使用tf.pad()

第六种方案

填充有三种选择：有效(无填充)，相同(或一半)，填充。你可以在这里找到解释(在Theano)：http://deeplearning.net/software/theano/tutorial/conv_arithmetic.html

有效或无填充：

有效填充不涉及零填充，因此它仅覆盖有效输入，不包括人工生成的零。如果步幅s = 1，则输出的长度是((输入的长度) – (k-1))对于内核大小k。

相同或半填充：

当s = 1时，相同的填充使输出的大小与输入的大小相同。如果s = 1，则填充的零的数量是(k-1)。

全填充：

完整填充意味着内核在整个输入上运行，因此在最后，内核可能只满足一个输入和零。如果s = 1，填充的零的数量是2(k-1)。如果s = 1，则输出长度为((输入长度)+(k-1))。

因此，填充数量:(有效)< =(相同)< =(完整)

第七种方案

快速解释

VALID：不要应用任何填充，即假设所有尺寸都有效，以便输入图像完全被过滤器覆盖并按指定步幅覆盖。

SAME：将填充应用于输入(如果需要)，以便输入图像被过滤器完全覆盖并按指定步幅。对于步幅1，这将确保输出图像大小与输入相同。

注意

这同样适用于coov图层和最大池化图层
术语”valid”有点用词不当，因为如果丢弃部分图像，事情就不会变成”invalid”。有时你甚至可能想要那样。这可能应该被称为”NO_PADDING”。
术语”same”也是用词不当，因为当输出维数与输入维度相同时，它只对1的步幅有意义。例如，对于2的步幅，输出尺寸将是一半。这可能应该被称为”AUTO_PADDING”。
在SAME(即auto-pad模式)中，Tensorflow将尝试在左右两侧均匀分布填充。
在VALID中(即无填充模式)，如果过滤器和步幅未完全覆盖输入图像，则Tensorflow将向右和/或底部单元格下降。

第八种方案

我从官方tensorflow docs https://www.tensorflow.org/api_guides/python/nn#Convolution引用这个答案对于’SAME’填充，输出高度和宽度计算如下：

out_height = ceil(float(in_height) / float(strides[1]))
out_width  = ceil(float(in_width) / float(strides[2]))

并且顶部和左侧的填充计算如下：

pad_along_height = max((out_height - 1) * strides[1] +
                    filter_height - in_height, 0)
pad_along_width = max((out_width - 1) * strides[2] +
                   filter_width - in_width, 0)
pad_top = pad_along_height // 2
pad_bottom = pad_along_height - pad_top
pad_left = pad_along_width // 2
pad_right = pad_along_width - pad_left

对于’VALID’填充，输出高度和宽度计算如下：

out_height = ceil(float(in_height - filter_height + 1) / float(strides[1]))
out_width  = ceil(float(in_width - filter_width + 1) / float(strides[2]))

并且填充值始终为零。

参考资料

What is the difference between ‘SAME’ and ‘VALID’ padding in tf.nn.max_pool of tensorflow?

鲜花

握手

雷人

路过

鸡蛋

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

SQL实现AUC的代码发布时间：2022-05-14

在PyTorch中保存训练模型的最佳方法？发布时间：2022-05-14

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：19131|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9973|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8317|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8686|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8627|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9643|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8611|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7991|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8642|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7527|2022-11-06

客服电话

电子邮件

TensorFlow的tf.nn.max_pool中'SAME'和'VALID'填充有什么区别？

最佳解决方案

次佳解决方案

第三种解决方案

第四种方案

第五种方案

第六种方案

第七种方案

第八种方案

参考资料

上一篇：

下一篇：

CVE-2022-35316

librespeed/speedtest: Self-hosted Speedt

markushi/android-ui: Android UI library.

avehtari/BDA_m_demos: Bayesian Data Anal

四维彩超怎么看性别？四维看男孩女孩诀窍

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053