CUDA özellikli cihaz algılanmadı (ubuntu 12.04.4 sunucusu kullanılarak)


1

Yararlı olduğunu düşündüğüm için bu gönderinin kapatıldığı yerdeki yığın taşmasından taşıma

Yakın zamanda cuda toolkit 5.5'i driver 331.67 ile kurdum (bir GeForce GTX 680 var). Nedense, test komut dosyalarının hiçbirini çalıştıramıyorum:

$./NVIDIA_CUDA-5.5_Samples/1_Utilities/deviceQuery/deviceQuery 
./NVIDIA_CUDA-5.5_Samples/1_Utilities/deviceQuery/deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL

Burada "başlangıç ​​kılavuzu" adımlarını izledim.

http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/

ve başlangıçta karakter cihaz dosyalarını oluşturmak için bir komut dosyası hazırladı (Ubuntu sunucu sürümünü çalıştırdığım için bu tür grafik dosyaları varsayılan olarak oluşturulmadı):

$ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195,   0 Apr 11 17:29 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Apr 11 17:29 /dev/nvidiactl

Komutu çalıştırmak için çıktı nvidia-smi -a (hem normal kullanıcı hem de kök kullanıcı için):

Failed to initialize NVML: Unknown Error

İşte nvidia modülü hakkında bazı bilgiler

$ lsmod | grep nvidia
nvidia              11335080  0 
$ modinfo nvidia
filename:       /lib/modules/3.11.0-17-generic/updates/dkms/nvidia.ko
alias:          char-major-195-*
version:        331.67
supported:      external
license:        NVIDIA
...
...

Herhangi bir öneri ? Teşekkürler.

# 1 DÜZENLEME 319.76 numaralı sürücüye indirmeyi denedim:

$ modinfo nvidia
filename:       /lib/modules/3.11.0-17-generic/updates/dkms/nvidia.ko
alias:          char-major-195-*
version:        319.76
supported:      external
...

Şimdi kaçtığımda nvidia-smi -a Aşağıdakileri alıyorum:

NVIDIA: API mismatch: the NVIDIA kernel module has version 304.116,
but this NVIDIA driver component has version 319.76.  Please make
sure that the kernel module and all NVIDIA driver components
have the same version.
Failed to initialize NVML: Unknown Error

Kurdum nvidia-current-updates ve nvidia-settings-updates Sürücü dosyasını yüklemeden önce depolardan paketler ve çakışan yer burası sanırım. Bir çözüm bulamadım, ama sanırım bu bir adım daha yakın. İşte sonucu modprobe -l | grep nvidia

kernel/drivers/video/nvidia/nvidiafb.ko
kernel/drivers/net/ethernet/nvidia/forcedeth.ko
updates/dkms/nvidia.ko
updates/dkms/nvidia_304_updates.k

Yanıtlar:


1

Bu cevap yığın taşmasından taşınmış

Bu yüzden karşılaştığım asıl hatanın, nvidia çekirdek modülü ile sürücü bileşeni arasında bir sürüm uyuşmazlığı olmasıydı. İşte bir çözüm bulmama yardımcı olan attığım adımlar.

1) sürücüyü düşürmek görmeme izin verdi nvidia-smi -a Bir sürücü bileşeni uyumsuzluğundan şikayetçi. Bunun başlangıçta sorun olacağından emin değildim. Bunun bir sorun olduğunu söylemeyen bir CUDA araç kiti kurulum kılavuzunu izliyordum.

2) Çekirdek modüllerini repolardan kurduğumda, ilgili sürücü bileşenini doğru sürümüyle seçtim. Kurulu çekirdek modülünüzün sürümünü bilmiyorsanız, modprobe ve modinfo kullanabilirsiniz. Örneğin, sistemimde

$ modprobe -l | grep nvidia
kernel/drivers/video/nvidia/nvidiafb.ko
kernel/drivers/net/ethernet/nvidia/forcedeth.ko
updates/dkms/nvidia.ko
updates/dkms/nvidia_304_updates.ko

Nvidia_304_updates modülü repolardan (nvidia-update-current paketi) yüklendi. Tam sürümü modinfo ile bulunur

$ modinfo /lib/modules/3.11.0-17-generic/updates/dkms/nvidia_304_updates.ko 
filename:       /lib/modules/3.11.0-17-generic/updates/dkms/nvidia_304_updates.ko
alias:          char-major-195-*
version:        304.116
supported:      external

İlgili sürücü bileşenini nvidia web sitesindeki arşivden indirip kurduktan sonra,

http://www.nvidia.com/Download/Find.aspx?lang=en-us

, Komutu çalıştırabildim

$ nvidia-smi -a

==============NVSMI LOG==============

Timestamp                       : Mon Apr 14 15:17:44 2014
Driver Version                  : 304.116

Attached GPUs                   : 1
GPU 0000:04:00.0
    Product Name                : GeForce GTX 680
...
...

Ve çalıştırmaya çalıştığım orijinal senaryo

$ ./deviceQuery 
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 680"
  CUDA Driver Version / Runtime Version          5.0 / 5.0
  CUDA Capability Major/Minor version number:    3.0
  Total amount of global memory:                 2047 MBytes (2146762752 bytes)
  ( 8) Multiprocessors x (192) CUDA Cores/MP:    1536 CUDA Cores
  ...
  ...
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.