- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- 不適切なコンテンツを報告
It seems to me that the new version of FFTW (released this january) is faster (e.g. ~20% for 512 points complex 1d double_precision) than the MKL8.0 routines, at least on Itanium systems.
I just did some rough performance analysis with a code using either FFTW3.1 or MKL8.0. Does anybody have detailed data? The Intel page deals with the outdated FFTW3.0.1 only.
cheers
Stefan
I just did some rough performance analysis with a code using either FFTW3.1 or MKL8.0. Does anybody have detailed data? The Intel page deals with the outdated FFTW3.0.1 only.
cheers
Stefan
コピーされたリンク
2 返答(返信)
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- 不適切なコンテンツを報告
My God! MKL8.0.1 is even faster than AMD Core Math Library (ACML3.0) on Opteron.
Opteron is so slow! So poor the float-point preformence!
http://www.fftw.org/speed/opteron-2.2GHz-64bit/
Opteron is so slow! So poor the float-point preformence!
http://www.fftw.org/speed/opteron-2.2GHz-64bit/