Multi-layer Perceptron | Cyber Data Science

Perceptron, 1950’lerde F. Rozenblat tarafından önerilmiştir. Yapay sinir ağlarının ilk modellerindendir. Perceptronların öğrenme algoritması, gelişmiş öğrenme algoritmalarının temelini oluşturmuştur. Perceptron, birçok girişten oluşan bir vektörü alır ve bu girişlerin her birini belirli bir ağırlıkla çarparak bir çıktı üretir. Bu çıktı daha sonra bir eşik değeriyle karşılaştırılır ve bir aktivasyon fonksiyonu kullanılarak sonuç belirlenir. Ağırlıklar, başlangıçta rastgele atanmış bir diziyle başlar. Eğitim sürecinde, ağırlıkları güncellemek için geri yayılım algoritması kullanılır. Perceptron’un MLP’den farkı, Perceptron tek katmandan oluşur. MLP’ler ise birbirine bağı birçok perceptron katmanı içerir. Perceptron kullanılarak OR, AND gibi tek karar düzeyi gerektiren problemler çözülebilir.

MLP, yapay sinir ağları (ANN) ailesine ait bir modeldir. MLP, en az bir gizli katman içeren bir yapay sinir ağıdır ve en az bir giriş ve bir çıkış katmanı bulunur. Her katmandaki düğümler bir önceki katmandaki tüm düğümlerle bağlanır ve ağında içindeki bilgi akışını sağlar.

Çalışma Adımları

MLP modeli oluşturulur.
Başlangıç ağırlıkları rastgele atanır.
Giriş verisi her bir gizli katmandaki düğümler arasından çıkış katmanına doğru ilerler (forward propagation). Bu işlem, her bir katmandaki düğümlerde aktivasyon fonksiyonunun uygulanmasıyla gerçekleşir.
İleri yayılma işleminden sonra tahmin edilen çıktılar ile gerçek değerler arasındaki hata hesaplanır.
Hata hesaplamasından sonra geri yayılma (backward propagation) işlemi gerçekleştirilir. Geri yayılma, ağın içindeki hata miktarını geriye doğru hesaplar ve her bir ağırlığın bu hataya katkısını belirler.
Gradyan iniş (gardient descent) ile geri yayılma işleminden elde edilen hata miktarına dayanarak, ağdaki ağırlıklar güncellenir.
Belirli bir iterasyona kadar bu işlem tekrarlanır.

Hiperparametreler

Parametre	Type	Default	Açıklama
hidden_layer_sizes	array	(100,)	Gizli katman sayısı.
activation	“identity”, “logistic”, “tanh”, “relu”	“relu”	Aktivasyon fonksiyonu.
solver	“lbfgs”, “sgd”, “adam”	“adam”	Ağırlıkları güncellemek için kullanılan optimizasyon algoritması.
learning_rate	“constant”, “invscaling”, “adaptive”	“constant”	Öğrenme oranı.
alpha	float	0.0001	Ağırlık düzenlemesi için kullanılır.
batch_size	int	“auto”	Ağırlık güncellemesi sırasında kullanılan mini-batch sayısını belirler.
max_iter	int	20	İterasyon sayısı.

Table of Contents

Çalışma Adımları

Hiperparametreler

Related News

Genetik Algoritmalar

LSA ve LDA

Optimizasyon Algoritmaları

CatBoost