最佳答案
CUDA 核心、流式多处理器和 CUDA 模块和线程之间的关系是什么?
什么被映射到什么,什么被并行化,以及如何并行化?哪个更有效,最大化块的数量还是线程的数量?
我目前的理解是每个多处理器有8个 Cuda 核。每个 Cuda 核心都能一次执行一个 Cuda 块。并且该块中的所有线程都在该特定核中串行执行。
是这样吗?