Tag Archive: CNN

Deep Learning Note: 4-5 卷积神经网络案例分析(1)

1. 经典网络 1.1. LeNet-5   LeNet-5 是一个用于识别手写数字的网络,由 Yann LeCun 等人于 1998 年提出。其结构如图 1 所示。   LeNet-5 的输入是一张 $32 \times 32$ 的灰度图像,只有一个通道。先是两组卷积层和池化层的组合,然后是两个全连接层,输出 $84 \times 1$ 的向量,再通过一个特定的分类器得到预测值 $\hat{y}…
Read more

Deep Learning Note: 4-4 卷积神经网络:一个例子

1. 一个卷积神经网路的例子   图 1 展示了一个用于识别手写数字的卷积神经网络。   网络输入为 $32 \times 32 \times 3$ 的手写数字图像,第 1 个卷积层 CONV 1 使用 6 个 $5 \times 5$ 的过滤器,步长为 1,输出大小为 $28 \times 28 \times 6$,然后通过第 1 个池化层 POLL 1,数据大小降至原来的一半,即 $14 \t…
Read more

Deep Learning Note: 4-3 卷积神经网络:基本结构

1. RGB 图像上的卷积   前文中展示了灰阶图像上的卷积,对于 RGB 图像,它有三个颜色通道,此时需要使用三个过滤器进行卷积,如图 1 所示:   使用 $高 \times 宽 \times 通道数$ 的方式表示图像的大小,在图 1 中,一个 $6 \times 6 \times 3$ 的图像与一个 $3 \times 3 \times 3$ 的过滤器相卷积,可以将 $3 \times 3 …
Read more

Deep Learning Note: 4-1 卷积神经网络:边缘检测

1. 计算机视觉   一些计算机视觉问题有: 图像分类(Image Classification):判断图像中物体的分类,如输入一张图像,判断它是否为猫的照片。 对象检测(Object Detection):不仅要判断图像中是否有目标物体,还找出各个目标物体的位置,如检测汽车前方路况图像中障碍物的具体位置。 神经风格迁移(Neural Style Transfer):使用一张图像的风格迁移到量一张…
Read more