既存のコードを、loop最深部だけ cuda kernel で置き換えてやれって書き換えていてハマる。
nvcc 挙動がワガママすぎね?
,cuファイルじゃないとタダの C/C++ だと思うの?オプションで操作できねーの?別に cuda 専用アプリを開発しようってんじゃないんで、コンパイル時に色々変えたいんだがなぁ…。
gcc でコンパイルしたコードと混ぜるとおかしくなる?ってか、オプティマイズ強くかけるとちゃんと動くはずのコードで実行時の挙動が変ってエラー処理に落ちるんですが? cuda 部分以外も自前処理なのか?
include <iostream> するとusing namespace std; じゃないとエラーになるのはさすがにマズくね?
とか undocumented な謎に悩まされて一日とか平気で潰すんだがどうよ?