最佳答案
Unicode 标准中有足够的代码点,需要4个字节来存储所有代码点。这就是 UTF-32编码的作用。然而,UTF-8编码通过使用一种叫做“可变宽度编码”的方法将这些信息压缩到更小的空间中。
事实上,它只用一个字节表示了 US-ASCII 的前127个字符,看起来与真正的 ASCII 完全一样,因此您可以将大量的 ASCII 文本解释为 UTF-8,而不需要对其做任何处理。干得漂亮。那么它是如何工作的呢?
我要在这里提出并回答我自己的问题,因为我刚刚读了一些资料来弄明白,我认为这可能会节省其他人的一些时间。而且如果我说错了,也许有人能纠正我。