NVCC, cihaz kodunu ne kadar iyi kullanır? Sürekli katlama ve ortak alt-ifade eleme gibi herhangi bir optimizasyon yapar mı? BunaKod optimizasyonlarında NVCC ne kadar iyi?
float a = 1/sqrtf(2 * M_PI);
float b = c/sqrtf(2 * M_PI);
:
Örn, aşağıdaki azaltacaktır
float a = 1/sqrtf(c * M_PI);
float b = c/sqrtf(M_PI);
için:
float sqrt_2pi = sqrtf(2 * M_PI); // Compile time constant
float a = 1/sqrt_2pi;
float b = c/sqrt_2pi;
ne matematik fonksiyonlarının semantiğini edeceğini içeren daha zeki optimizasyonları, yaklaşık bu:
float sqrt_pi = sqrtf(M_PI); // Compile time constant
float a = 1/(sqrt_pi * sqrtf(c));
float b = c/sqrt_pi;
Yani, * sabit katlama o zaman? Ve ne derleyici nvOpen64 nedir? NVidia veya bir OSS sürümü mü? İkinci davadan ne haber? –
nvOpen64 NVIDIA derleyicisidir, [Open64] (http://www.open64.net/) (not nvcc bir derleyici değildir), – talonmies
Pardon benim cehaletimdir, fakat bir derleyici değilse nvcc tam olarak nedir? –