最近、ちょっとした調べ物がてら、SSE2とFPUに単純に浮動小数の四則演算をさせたときにどれほど速度差が生じているのかをベンチしてみました。測定環境は下記の通り。

Windows XP Pro(32ビット)

Pentium M 1.2GHz

512MB メモリー

四則演算(1ループ4回の演算処理)を10億回繰り返します。

結果・・・・・

  • FPU … 38秒
  • SSE2 … 39秒

・・・・・

びみょ〜

SSE2は、並列演算を行うからこそ、高速化が望めるものだと実感できました。まぁ、他のCPUで試していないのでなんともいえませんが、何かの足しになれば…。