CentOS 5.4にCUDA開発環境(ver 2.3)をインストールする

cudadriver_2.3_linux_64_190.18.run
cudatoolkit_2.3_linux_64_rhel5.3.run
cudasdk_2.3_linux.run

の順番でインストール。

ホームディレクトリに

NVIDIA_GPU_Computing_SDK

というディレクトリが作成される。

サンプルプログラムをコンパイルするため

NVIDIA_GPU_Computing_SDK/C

に移動してmakeする

/usr/bin/ld: cannot find -lXi

でエラーになったので

yum install libXi-devel.x86_64

でインストールする。

再度makeすると今度は

/usr/bin/ld: cannot find -lXmu

でエラーになったので

yum install libXmu-devel.x86_64

でインストールする。

再度コンパイルすると無事通ったので、

~/NVIDIA_GPU_Computing_SDK/C/bin/linux/release

に移動して

./deviceQuery

を実行してグラボを確認するも

There is no device supporting CUDA.
Device 0: "Device Emulation (CPU)"
・
・
・

になっていて、グラボが認識されていない。


調べるとXは起動したか?みたいな書き込みがあったので、そういえばサーバーマシンとしてしか考えていないからXなんて起動したことないな(ってか入ってるのかすらわからない)、と思いつつ起動してみる。

(EE) Failed to initialize GLX extension (Compatible NVIDIA X driver not found)
localuser:hogehoge being added to access control list
ユーザ 'hogehoge' のプロファイルが見つかりませんでした
Smart Common Input Method 1.4.4

Launching a SCIM daemon with Socket FrontEnd...
Loading simple Config module ...
Creating backend ...

waiting for X server to shut down FreeFontPath: FPE "unix/:7100" refcount is 2, should be 1; fixing.

で起動しなかったが(当たり前だけど)、もう一度deviceQueryを実行するとなぜか無事認識した。。。

CUDA Device Query (Runtime API) version (CUDART static linking)
There is 1 device supporting CUDA

Device 0: "GeForce 9800 GT"
  CUDA Driver Version:                           2.30
  CUDA Runtime Version:                          2.30
  CUDA Capability Major revision number:         1
  CUDA Capability Minor revision number:         1
  Total amount of global memory:                 1073020928 bytes
  Number of multiprocessors:                     14
  Number of cores:                               112
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       16384 bytes
  Total number of registers available per block: 8192
  Warp size:                                     32
  Maximum number of threads per block:           512
  Maximum sizes of each dimension of a block:    512 x 512 x 64
  Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
  Maximum memory pitch:                          262144 bytes
  Texture alignment:                             256 bytes
  Clock rate:                                    1.35 GHz
  Concurrent copy and execution:                 Yes
  Run time limit on kernels:                     No
  Integrated:                                    No
  Support host page-locked memory mapping:       No
  Compute mode:                                  Default (multiple host threads can use this device simultaneously)

Test PASSED

これでやっと開発入れるわー