Yalnızca yerel belleğin, kayıttaki iki bellek türü olan kayıt belleğinden daha yavaş olduğunu belirttim.Yerel bellek, CUDA'da paylaşılan bellekten daha yavaş mı?
Paylaşılan belleğin hızlı olması gerekiyordu, ancak yerel bellekten [thread] daha hızlı mı?
Yapmak istediğim, medyan bir filtredir, ancak medyan yerine belirli bir persentildir. Bu yüzden listenin parçalarını almam, sıralamalıyım ve sonra uygun olanı seçmem gerekiyor. Ama paylaşımlı bellek listesini veya yanlış giden şeyleri sıralamaya başlayamıyorum. Yerel belleğe kopyalayarak çok fazla performans kaybeder miyim?
Bu gerçekten programlama ile ilgili değil, değil mi? Mathematica etiketine de güçlü bir bağlantı göremiyorum. –
@Sjoerd C. de Vries: CUDA bağlamında, programlama ile ilgili bir soru - mimarinin eşit olmayan bir bellek alanı vardır ve programcı, hangi kod türlerinde ve hangi yöntemlerde kullanıldığını açık bir şekilde seçmelidir. yazıyor. CUDA programlamanın temel ilkesidir. – talonmies
@talonmies Bunu anlıyorum, ama yine de bu soru programsal olarak belleği seçmekle ilgili değil, wrt API'ları, programlama yazmaçları ile programlama belleği vs arasındaki farklar. Temelde hangi bellek türünün daha hızlı olduğu. Bu bir donanım sorusu. OP'nin soruyu yeniden yorumlaması gerektiğini düşünüyorum, örneğin CUDA'da paylaşılan hafızayı kullanarak verilerin belirli bir yüzdesini bulma problemi doğrultusunda. –