Intel からメールが来ていたのを思い出して見てみると、新 version /評価版のご案内であった。
そういや、OSX で Intel って試したことなかったな、 PGI と比較できんなってんで落してみる。
OSX 日本語環境だとインストーラが凍るよく判らない bug に気づかず、数日潰す。
で、問題の結果だが、
GCC/PGI より2倍近く速いんですけど、どんなインチキやってんだゴルァ。
ありえん……。最適化っつーレベルじゃねー。
これでも、俺が元のコード書き換えて、5倍くらい速くしてんだがなぁ…。元プログラムの GCC 版から比べれば10倍か。
そういや数年前、windows 上で Microsoft の Visual C++ と Intel C++ でベンチマークを取ったことがあって(VC++ 2003 (最適化可能版) vs ICC 9.1)、その時は3次元の有限差分というひたすら計算だけするプログラムだったんだが、この時は VC++ になかなか ICC が追い付けないという結果だった…。PentiumM だったからかなぁ…。
まぁ、メッシュ数で簡単に色々と状況が変わった気もする。結局この時は、コードを直しまくって MKL の力を借りてどうにか勝ったのだった。
しみじみ見ると結構変な結果だな…。当時の記録。
VC++ | Intel | |
---|---|---|
orig. | 6'15" | 11'00" |
改良版 | 6'22" | 10'04" |
+ BLAS | 6'04" | 4'54" |
+ scal() | 3'26" | 2'41" |
+ VML() | 3'29" | 2'26" |