Skip to content

卷积操作

介绍

import torch.nn.functional as F

这里function是nn的子包,但是很常用,一般单独导入。

然后介绍卷积操作:

​ 卷积操作目的是减少图片维度(减少了参数数量),保留关键信息。

具体操作是卷积核对位相乘作为结果,算完之后往后往下走。

这里不想多记。

然后代码:

import torch
import torch.nn.functional as F  # 制作一个函数的句柄,后面方便直接使用了

input = torch.tensor([[1, 2, 0, 3, 1],
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]])

kernel = torch.tensor([[1, 2, 1],
                       [0, 1, 0],
                       [2, 1, 0]])
print("input:", input)
print("kernel:", kernel)

print("input.shape:", input.shape)
print("kernel.shape:", kernel.shape)


#  要想用 torch.nn.functional.conv2d 这个函数,就必须满足形状的要求,上述的尺寸不满足,要做处理
#  上述的尺寸,只有input.shape: torch.Size([5, 5]), kernel.shape: torch.Size([3, 3]),并没有4个通道


input = torch.reshape(input, (1, 1, 5, 5))  # 注意这4个数字的意义,分别是:batch_size, in_channel, H, W , 变换形状之后,重新赋值给 input
kernel = torch.reshape(kernel, (1, 1, 3, 3))  # 注意这4个数字的意义,跟上面的不一样了

print("input.shape:", input.shape)
print("kernel.shape:", kernel.shape)

output = F.conv2d(input, kernel, stride=1)
print(output)

output2 = F.conv2d(input, kernel, stride=2)
print(output2)

output3 = F.conv2d(input, kernel, stride=1, padding=1)  # padding 设置的值,是往外扩充的行列数,值都是0,至于想要修改这个值,还有另外一个参数,一般不改
print(output3)

output4 = F.conv2d(input, kernel, stride=1, padding=0)  # padding 默认值是 0
print(output4)

注意的几个点:

​ 1.注意卷积要求的输入维度,参数要四个batch_size(批量大小),in_channel(输入通道数),高和宽

​ 2.参数说明:

​ stride 步长,即每次卷积运算完成走几个格子。

​ padding 填充,上下左右都填充,填充1即3x3变5x5

​ 图片辅助理解: