VGG16：深度卷积神经网络的开创性模型 (vgg16网络结构详解)

AI项目2年前 (2024)发布 whatai

👇复制口令打开淘宝免单奶茶和25红包👇

￥XT7U4sdjF9I￥/ HU7405

深度卷积神经网络的开创性模型

Table of Contents

简介

VGG16 是一个深度卷积神经网络，由牛津大学视觉几何组（VGG）在 2014 年提出。它以其 simple 的结构和出色的图像分类性能而闻名，被广泛用于计算机视觉领域。

VGG16 的网络结构由 13 个卷积层、3 个全连接层和 2 个池化层组成。其详细结构如下表所示：

层	类型	内核大小	步长	padding	输出大小
conv1_1	卷积	3×3	1	1	224x224x64
conv1_2	卷积	3×3	1	1	224x224x64
pool1	最大池化	2×2	2	0	112x112x64
conv2_1	卷积	3×3	1	1	112x112x128
conv2_2	卷积	3×3	1	1	112x112x128
pool2	最大池化	2×2	2	0	56x56x128
conv3_1	卷积	3×3	1	1	56x56x256
conv3_2	卷积	3×3	1	1	56x56x256
conv3_3	卷积	3×3	1	1	56x56x256
pool3	最大池化	2×2	2	0	28x28x256
conv4_1	卷积	3×3	1	1	28x28x512
conv4_2	卷积	3×3	1	1	28x28x512
conv4_3	卷积	3×3	1	1	28x28x512
pool4	最大池化	2×2	2	0	14x14x512
conv5_1	卷积	3×3	1	1	14x14x512
conv5_2	卷积	3×3	1	1	14x14x512
conv5_3	卷积	3×3	1	1	14x14x512
pool5	最大池化	2×2	2	0	7x7x512
fc6	全连接	4096
fc7	全连接	4096
fc8	全连接	1000

在 ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 2014 比赛中，VGG16 在图像分类任务上取得了出色的成绩，获得了当时最优的 top-5 错误率。

VGG16 被广泛应用于计算机视觉领域，包括：

在 VGG16 的基础上，衍生出了多种变体，包括：

文章版权归作者所有，未经允许请勿转载。

您必须登录才能参与评论！

暂无评论...