Giriş katmanında birden fazla kanal olduğunda konvolusyon işlemi nasıl yapılır? (ör. RGB)Konvolüsyonel Yapay Sinir Ağları - Çok Kanallı
Bir CNN'nin mimarisi/uygulamasında biraz okuma yaptıktan sonra, bir özellik haritasındaki her bir nöronun, çekirdek boyutunda tanımlandığı gibi bir görüntünün NxM piksellerini referans aldığı anlaşılır. Daha sonra her piksel, öğrenilen NxM ağırlık seti (çekirdek/filtre), özetlenen ve aktivasyon fonksiyonuna giren özellik haritaları tarafından belirlenir. Basit bir gri görüntü için, ben operasyon şey şu sözde kod bağlı olacağını hayal:
for i in range(0, image_width-kernel_width+1):
for j in range(0, image_height-kernel_height+1):
for x in range(0, kernel_width):
for y in range(0, kernel_height):
sum += kernel[x,y] * image[i+x,j+y]
feature_map[i,j] = act_func(sum)
sum = 0.0
Ancak birden fazla kanalı işlemek için bu modeli nasıl genişletileceğini anlamıyorum. Her bir renk arasında paylaşılan özellik haritası başına üç ayrı ağırlık seti mi gerekiyor?
Bu eğiticinin 'Paylaşılan Ağırlıkları' bölümüne başvurma: http://deeplearning.net/tutorial/lenet.html Özellik haritadaki her bir nöron, m-1 katmanını farklı nöronlardan referans alınan renklerle referanslar. Burada ifade ettikleri ilişkiyi anlamıyorum. Nöronlar çekirdekler veya pikseller ve neden görüntünün ayrı kısımlarına referans veriyorlar?
Örneğime dayanarak, tek bir nöron çekirdeğinin bir görüntüdeki belirli bir bölgeye özel olduğu anlaşılıyor. Neden RGB bileşenini çeşitli bölgelere ayırdılar?
Bu soruyu off-topic olarak kapatmayı seçiyorum çünkü bu istatistik stats.stackexchange'e aittir – jopasserat