スレッド数、ブロック数をNT = 32, NB = (int)((Nmat + NT - 1)/NT)にして、Nmatを変化させることで、計算にかかる時間がどのように変化するか、CPUとGPU(Globalメモリ)、GPU(Sharedメモリ)で比較・評価せよ。
NT = 32, NB = (int)((Nmat + NT - 1)/NT)
m行l列の行列Aとl行m列nの行列Bについて、行列積C = ABを行うアルゴリズムを書け。ただしl, m, nは任意の自然数とする。