やっと解決した。
コード中で使ってた class ごとに test code を書いていたがちっともはかばかしくなくて、結局、からの main() 関数にからの constructor に・・・ってコードを削りまくっていって探索した。
エラーになっていたのは、メルセンヌ・ツイスターの dSFMT の SSE を利用するコード。 m128 とかそういうデータ構造。
dSFMT は最初に疑ったんだが、よく見たら最適化とか外してチェックしていた。 SSE 使わなきゃ通るようだ。
ちなみに dSFMT は PGI コンパイラでも引っかかってやがる。パフォーマンス勝負させてみたかったのに・・・