cuda-tutorial

6.2 章末課題

問1 Nmatによる性能評価

スレッド数、ブロック数をNT = 32, NB = (int)((Nmat + NT - 1)/NT)にして、Nmatを変化させることで、計算にかかる時間がどのように変化するか、CPUとGPU(Globalメモリ)、GPU(Sharedメモリ)で比較・評価せよ。

問2 任意の行列積

m行l列の行列Aとl行m列nの行列Bについて、行列積C = ABを行うアルゴリズムを書け。ただしl, m, nは任意の自然数とする。