Table of Contents
2014’de ImageNet ILSVRC (Büyük Ölçekli Görsel Tanıma Yarışması)’de sunuldu. Yarışmayı, GoogleLeNet modelinden sonra tamamlayarak ikinci oldu. VGG Group (Oxford) tarafından sunulmuştur. Ağın derinliğinin önemi üzerinde durulmuştur. Farklı sürümleri de bulunur. AlexNet mimarisinde kullanılan yüksek kernel boyutları azaltılmıştır. Sadece 3×3 filtre ve 2×2 lik havuz boyutları kullanılarak ağa basit kazandırılmış ve derinlik korunmuştur.
Mimarisi
TensorFlow ile VGG-16
# VGG-16
model = Sequential([
Conv2D(filters=64, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=64, kernel_size=(3,3), padding="same", activation="relu"),
MaxPooling2D((2, 2)),
Conv2D(filters=128, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=128, kernel_size=(3,3), padding="same", activation="relu"),
MaxPooling2D((2, 2)),
Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
MaxPooling2D((2, 2)),
Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
MaxPooling2D((2, 2)),
Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
MaxPooling2D((2, 2)),
Flatten(),
Dense(4096, activation="relu"),
Dense(4096, activation="relu"),
Dense(1000, activation="softmax")
])