2017 yılında Geoffrey Hinton ve arkadaşları tarafından tanıtılmıştır. Nesnelerin poziysonel bilgilerini ve hiyerarşik özelliklerini daha iyi temsil eder. CNN’ler belirli özellikleri yakalamak için eğitilirken Kapsüller o özelliğin farklı durumlara ait özelliklerini bulması için eğitilir. Her kapsül, bir nesnesinin belirli bir özelliğini ve o özelliğin görüntüdeki konumunu temsil eder. Kapsül ağları, bir alt katmandaki kapsüllerin üst katmandaki kapsüllerle eşleşmesini sağlar. Kapsüller arasındaki bağlantılar, dinamik yönlendirme mekanizması kullanılarak güncellenir.