最佳答案
我试图优化一些矩阵计算,我想知道是否有可能在编译时检测,如果 SSE/SSE2/AVX/AVX2/AVX-512/AVX-128-FMA/KCVI[1]是由编译器启用?理想的海湾合作委员会和叮当,但我可以管理,只有其中之一。
我不确定这是否可行,也许我会使用我自己的宏,但我宁愿检测它,而不是要求用户选择它。
[1] “ KCVI”代表骑士角向量指令优化。像 FFTW 这样的库检测/利用这些新的指令优化。