最佳答案
试图理解现代Unicode的微妙之处让我头疼。特别是,代码点、字符、符号和字母素之间的区别——在简单的情况下,当使用ASCII字符处理英语文本时,这些概念彼此之间都有一对一的关系——给我带来了麻烦。
看到这些术语是如何在Matthias Bynens的JavaScript有unicode问题或维基百科关于韩统一的文章中使用的,我已经收集到这些概念不是同一件事,合并它们是危险的,但我有点努力掌握每个术语意味着。
Unicode联盟提供了术语表来解释这些东西,但它充满了像这样的“定义”:
< em >抽象字符< / em >。用于组织、控制或表示文本数据的信息单位. ...
...
< em >字符< / em >……(2)抽象字符的同义词。(3)编码的基本单位为Unicode字符编码. ...
...
< em >字形< / em >。(1)表示一个或多个字形图像的抽象形式。(2)字形图像的同义词。在显示Unicode字符数据时,可以选择一个或多个符号来描述特定的字符。
...
< em >字母< / em >。(1)在特定书写系统. ...的上下文中具有最低限度独特的书写单元
这些定义大多具有听起来非常学术和正式的性质,但缺乏意味着什么的性质,否则将定义问题推迟到标准的另一个术语表条目或部分。
因此,我向那些比我更有学问的人寻求神秘的智慧,这些概念之间究竟有什么不同?在什么情况下,它们彼此之间不会有一对一的关系?