Bazı hesaplamalar yapıyorum ve farklı BLAS uygulamalarının güçleri ve zayıflıkları üzerine bazı analizler yapıyorum. ancak bir problemle karşılaştım.Bir matrisi blas kullanarak en iyi şekilde nasıl aktarılır?
cuBlas'i test ediyorum, GPU üzerinde linAlg yapmak iyi bir fikir gibi görünebilir, ancak bir sorun var.
Kolon-ana formatı kullanarak cuBlas uygulaması, ve sonunda ihtiyacım olan şey olmadığı için, BLAS'ın matris-transpoze olmasını sağlayabilecek bir yöntem varsa merak ediyorum.
".... ve sonuçta bunun sonu değil .....". Birkaç kelimeyi mi özledin? – talonmies
CUDA 5.0'dan başlayarak cuBLAS, matris aktarımını gerçekleştirmek için çok verimli bir rutin olan " geam" küplerine sahiptir. Bu çözümü uygulayan ve Thrust kullanarak matris aktarımı ile performansı karşılaştıran tam bir kod için, [CUDA'da bir matrisi dönüştürmenin en etkili yolu nedir?] (Http://stackoverflow.com/questions/15458552/what-is- -en verimli yollu için-devrik-a-matrisini-içinde-cuda/21803459 # 21803459). –
JackOLantern