CUDAで行列計算のサンプルを動かしてみた

http://www.kumikomi.net/archives/2008/10/22gpu2.php?page=1
にあるサンプルコードを実行してみた。
※SetTimer()はWin32APIの関数みたいなので、Linux上で実行できるようにするため実行速度計測用の関数を持ってきて書き換えました。
http://kzk9.net/column/time.html



Mac上でのエミュレーションモードでの実行結果(GPUなし)

cudaカーネルでの計算時間 = 88.653453826904296875000000000000
 計算結果=17614889811968.000000
cudaなしの計算時間 = 1.043962001800537109375000000000
計算結果=17614889811968.000000

当然遅い、、、、
MAC上のアクティビティモニタで見るとスレッドが250ぐらい立ち上がってたw


GPU搭載サーバ上での実行結果(CentOS5.4,corei3、mem4G,GeForce 9800GT)

cudaカーネルでの計算時間 = 0.005260944366455078125000000000
 計算結果=17614889811968.000000
cudaなしの計算時間 = 0.989577054977416992187500000000
計算結果=17614889811968.000000

はやいぜ!