夜行録 - 酔歩.net
Calendar
Mon | Tue | Wed | Thu | Fri | Sat | Sun |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
Monday, 21.06.10
cuda 進展
ここ1ヶ月くらい頓挫していた cuda のコード。CPUコード的には正しく動くものを block と thread で並列化考えて実装してみたんだがどうも駄目。というより、問題は、なにがどう駄目かよく判らんこと…。
アルゴリズム的には正しいはずが、リソースが足んないとか言われたり。そのたびにデータ構造からいじる羽目になったり。
で、並列性が綺麗じゃないのか、こんなエラーが出ててずっと悩んでいて、いやしかし、計算量少くするとちゃんと終了するし…しかし減らしちゃ全くプログラムに意味なくなるし…と悩んでいたが…。
cuda calc all done : the launch timed out and was terminated
ふと、検索してみると(覚書/未分類/CUDAのタイムアウト時間 - PukiWiki、CUDAの10秒制限はどうなっているのだろうか? ? Satoshi OHSHIMA’s website)、そのものずばりで kernel の計算って時間制限あったのか?!
以下のような変なコード書いたらちゃんと動くようになった…。でも遅い…。つーか、答え合ってない……。
なんの計算かは秘密。……、つーか引数多くね?