夜行録 - 酔歩.net
日暮れて道遠し さらに夜道を行く もって夜行録と名付く
tesla壊した…orz
どうやら玩具にしてる Tesla を壊してしまった模様……。
計算させようとすると、
> ./NVIDIA_GPU_Computing_SDK/C/bin/linux/release/reduction [reduction] starting... Using Device 0: Tesla C2050 Reducing array of type int 16777216 elements 256 threads (max) 64 blocks reduction.cpp(473) : cudaSafeCallNoSync() Runtime API error 39 : uncorrectable ECC error encountered.
ってなことに…。
可能性の一つとして、kernel moduleがなにかと干渉しているというのもありえるんだけど、とりあえず3.2から.2.6.38, 2.6.35と落してみたけど改善しない。
致命的に死んでいるわけではなくて、deviceQueryには答えるし、ecc-config=0にしてやるとちゃんと動くことは確認。
しかし…、ECC off の Tesla で実計算は、さすがに止めた方がいいかなぁ…。
とりあえず、開発遊びにだけなら、まだ使えるということか…。
壊れるに至った流れは、 ubuntuのversion上げた→kernelが上がった→driverが消えたのでcuda driver再インストール→Nouveau Driverが干渉するので次回から読み込ませないね→reboot→何故か最後にGPUファンが全力で回る→以降、deviceはちゃんと見えるんだが、mallocは全部失敗。
C2075買えってことかな?。keplerいつ来るのかな???
2012年05月17日 (Thu) - 14:12:18 - その他雑記 - 3750x - permalink
Karma points: 7. Do you like this article? [yes/no]
Karma points: 7. Do you like this article? [yes/no]
- Use this Trackback URL for ping (right mouse click and copy URL).
- You can [print] this article, DISALLOWED (MailToAFriend) it, or export a [PDF].