cuda-tutorial

4.3 章末課題

32bit浮動小数点型のベクトルの加算について、マシンパワーの評価を行う。 問4以外、ベクトルの次元はN = 1000000とする。

問1 CUDA Coreの性能

1コアあたりのCPUの性能とGPU性能を比較・評価せよ。

問2 スレッドによる並列化の性能評価

ブロック数をNB = 1にしてスレッド数を変化させることでGPUの性能がどのように上昇するか比較・評価せよ。

問3 ブロック数による並列化の性能評価

スレッド数をNT = 1にしてブロック数を変化させることでGPUの性能がどのように上昇するか比較・評価せよ。

問4 ベクトルの次元による性能評価

スレッド数、ブロック数をNT = 512, NB = (int)((N + NT - 1)/NT)にして、ベクトルの次元を変化させることで、計算にかかる時間がどのように変化するか調べよ。 そして、複数人共用のGPUを使う際は、どの程度の次元からGPUを用いた計算をする意義があるか考えよ。

引用、紹介