2016-04-04 29 views
1

Donanım: 2 780Ti kartları, Yazılım: Ubuntu 14.01 LTS NVIDIA UNIX x86_64 Çekirdek Modül 352,79 Çar 13 Ocak 16:17:53 PST 2016 GCC sürümü: gcc sürüm 4.8.4 (Ubuntu 4.8.4-2ubuntu1 ~ 14.04.1) CUDA 7,5cuda deviceQuery döner 1 yerine 2

nvidia-smi Şekil

+------------------------------------------------------+      
| NVIDIA-SMI 352.79  Driver Version: 352.79   |      
|-------------------------------+----------------------+----------------------+ 
| GPU Name  Persistence-M| Bus-Id  Disp.A | Volatile Uncorr. ECC | 
| Fan Temp Perf Pwr:Usage/Cap|   Memory-Usage | GPU-Util Compute M. | 
|===============================+======================+======================| 
| 0 GeForce GTX 780 Ti Off | 0000:01:00.0  N/A |     N/A | 
| 30% 43C P2 N/A/N/A | 877MiB/3071MiB |  N/A  Default | 
+-------------------------------+----------------------+----------------------+ 
| 1 GeForce GTX 780 Ti Off | 0000:03:00.0  N/A |     N/A | 
| 29% 25C P8 N/A/N/A |  11MiB/3071MiB |  N/A  Default | 
+-------------------------------+----------------------+----------------------+ 

deviceQuery

CUDA Device Query (Runtime API) version (CUDART static linking) 

Detected 1 CUDA Capable device(s) 

Device 0: "GeForce GTX 780 Ti" 
    CUDA Driver Version/Runtime Version   7.5/7.5 
    CUDA Capability Major/Minor version number: 3.5 
    Total amount of global memory:     3072 MBytes (3221028864 bytes) 
    (15) Multiprocessors, (192) CUDA Cores/MP:  2880 CUDA Cores 
    GPU Max Clock rate:       1084 MHz (1.08 GHz) 
    Memory Clock rate:        3500 Mhz 
    Memory Bus Width:        384-bit 
    L2 Cache Size:         1572864 bytes 
    Maximum Texture Dimension Size (x,y,z)   1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096) 
    Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers 
    Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers 
    Total amount of constant memory:    65536 bytes 
    Total amount of shared memory per block:  49152 bytes 
    Total number of registers available per block: 65536 
    Warp size:          32 
    Maximum number of threads per multiprocessor: 2048 
    Maximum number of threads per block:   1024 
    Max dimension size of a thread block (x,y,z): (1024, 1024, 64) 
    Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535) 
    Maximum memory pitch:       2147483647 bytes 
    Texture alignment:        512 bytes 
    Concurrent copy and kernel execution:   Yes with 1 copy engine(s) 
    Run time limit on kernels:      No 
    Integrated GPU sharing Host Memory:   No 
    Support host page-locked memory mapping:  Yes 
    Alignment requirement for Surfaces:   Yes 
    Device has ECC support:      Disabled 
    Device supports Unified Addressing (UVA):  Yes 
    Device PCI Domain ID/Bus ID/location ID: 0/3/0 
    Compute Mode: 
    < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) > 

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 7.5, CUDA Runtime Version = 7.5, NumDevs = 1, Device0 = GeForce GTX 780 Ti 
Result = PASS 
göstermektedir/Dev nvidia dosyaları için

izni şunlardır:

crw-rw-rw- 1 root root 195, 0 Apr 3 21:18 nvidia0 
crw-rw-rw- 1 root root 195, 1 Apr 3 21:18 nvidia1 
crw-rw-rw- 1 root root 195, 255 Apr 3 21:18 nvidiactl 
crw-rw-rw- 1 root root 244, 0 Apr 3 21:24 nvidia-uvm 

Neden deviceQuery sadece 1 gpu gösterir?

+0

İkinci kartı nvidia sürücülerinden sonra mı yüklediniz? P8/P2 durumunu merak ediyorum. Eğer bu sürücü iki kartı yönetmiyorsa. Yeni sürücünün yüklenmesi yardımcı olabilir. –

+0

Bu soru [SO] için tamamen konu dışı ve ben kapatmak için oy kullandım – talonmies

cevap

-1

Sadece bir tahmin, ama herhangi bir şansla CUDA_VISIBLE_DEVICES propery setin var mı?

+0

her iki yolu denedim - bu ortam değişkeni ayarlanmış ve bu ortam değişkeni 1 olarak ayarlanmış (cihazQuery görmediği kart). AMA, sanırım konu deviceQuery çünkü nvidia-smi -l ile performansı izlediğimde 1 --query --display = PERFORMANS --filename = gpu_utillization.log Ben derlenmiş bir cuda çalıştırdığımda BOTH kartlarının performans durumunu görüyorum parçacıklar gibi uygulama. – aquagremlin

+0

"0,1" 'olarak ayarlamayı denediniz mi? –

+0

Evet, "0,1" ve ayrıca 0,1 denedim. Bkz. Http://askubuntu.com/questions/752534/assign-cuda-to-a-specific-gpu/753544#753544 Ancak, env değişkenini '1' olarak ayarladığımda bile, her iki kartın da performansı artırdığını görüyorum. SLI köprüsünün kafa karıştırıcı olup olmadığını merak ediyorum. – aquagremlin

-2

Bu cuda örneklerinin çoğu basitçe iki kart kullanmak kodlanmadığından çıkıyor. Doğru şekilde kodlandığında, her iki gpus kullanılır.

+1

Bilgim olsun, cihaz sorgusu tüm kartları görmek için tasarlanmıştır. Aklında başka bir örnek var mı? –