Visual-C + + 中没有128位整数,因为 Microsoft 调用约定只允许返回 RAX: EAX 对中的2个32位值。当你将两个整数相乘,结果是一个两字整数时,它会给你带来持续的麻烦。大多数加载和存储机器支持处理两个 CPU 字大小的整数,但处理4需要软件黑客技术,所以32位 CPU 不能处理128位整数,8位和16位 CPU 不能处理64位整数,除非有一个相当昂贵的软件黑客技术。64位 CPU 可以并且经常处理128位整数,因为如果你将两个64位整数相乘得到一个128位整数,所以 GCC 版本4.6确实支持128位整数。这给编写可移植代码带来了一个问题,因为您必须进行一个丑陋的黑客操作,即在返回寄存器中返回一个64位字,并使用引用传递另一个字。例如,为了用 格里苏快速打印浮点数,我们使用128位无符号乘法,如下所示:
#include <cstdint>
#if defined(_MSC_VER) && defined(_M_AMD64)
#define USING_VISUAL_CPP_X64 1
#include <intrin.h>
#include <intrin0.h>
#pragma intrinsic(_umul128)
#elif (__GNUC__ > 4 || (__GNUC__ == 4 && __GNUC_MINOR__ >= 6))
#define USING_GCC 1
#if defined(__x86_64__)
#define COMPILER_SUPPORTS_128_BIT_INTEGERS 1
#endif
#endif
#if USING_VISUAL_CPP_X64
UI8 h;
UI8 l = _umul128(f, rhs_f, &h);
if (l & (UI8(1) << 63)) // rounding
h++;
return TBinary(h, e + rhs_e + 64);
#elif USING_GCC
UIH p = static_cast<UIH>(f) * static_cast<UIH>(rhs_f);
UI8 h = p >> 64;
UI8 l = static_cast<UI8>(p);
if (l & (UI8(1) << 63)) // rounding
h++;
return TBinary(h, e + rhs_e + 64);
#else
const UI8 M32 = 0xFFFFFFFF;
const UI8 a = f >> 32;
const UI8 b = f & M32;
const UI8 c = rhs_f >> 32;
const UI8 d = rhs_f & M32;
const UI8 ac = a * c;
const UI8 bc = b * c;
const UI8 ad = a * d;
const UI8 bd = b * d;
UI8 tmp = (bd >> 32) + (ad & M32) + (bc & M32);
tmp += 1U << 31; /// mult_round
return TBinary(ac + (ad >> 32) + (bc >> 32) + (tmp >> 32), e + rhs_e + 64);
#endif
}