Languages supported by "latin" vs "latin-extended" glyphs in fonts on Google Web Fonts?

Google Web Fonts Select Character Sets

Some fonts on Google Web Fonts support multiple "character sets". The thing is, if the web font I use only serves the "latin" glyphs, users who translate the page to a language whose glyphs aren't supported will clearly notice the messed up text.

I'd like my web fonts to support the most popular languages in the world aside from English, for example, Spanish, German, French, etc.

For this purpose, I'd like to know, which languages exactly, the "latin" and "latin-extended" cater to, individually.

I expect the answer to look like:

Latin Character Set & Supported Languages:


- ..........
- ..........
- ..........


Latin-Extended Character Set & Supported Languages:


- ..........
- ..........
- ..........

I couldn't find this info in Google Web Fonts documentation, or by Googling.

67237 次浏览

拉丁文

又名 Unicode 拉丁文1-补充资料(U + 0080 to U + 00 FF)主要用于支持西欧语言(如你提到的法语、德语、西班牙语,还有葡萄牙语、意大利语、爱尔兰语、冰岛语、斯堪的纳维亚语言,以及下面列表中无意中提到的其他语言)。标准 ASCII 支持英语。ASCII (前127个字符,其中95个是字母 U + 0020到 U + 007E)作为 Unicode 中的第一个块被命名为基本拉丁文。这个块被认为是“拉丁文”的一部分,通常支持非拉丁文字体,允许它们用作系统字体(大多数非本地化的低级程序都使用 ASCII 硬编码)。

拉丁语延伸

拉丁扩展在谷歌字体实际上意味着块 拉丁文扩展 A(U + 0100至 U + 017 F) ,这应该(结合“拉丁”)支持所有基于欧洲的拉丁文本。互联网出现在美国,所以 ASCII 是它的本地代码。然后定义了适用于8位代码页上半部分的 ISO-8859-1(Latin1)标准以支持西欧,并将其转换为 Latin1-Supplement Unicode 块。其他8位 ISO-8859欧洲拉丁文标准(拉丁文2 East,拉丁文3 South,拉丁文4 North)被合并并移动到 LatinExtended-A 块。这些拉丁文标准与拉丁文1共享许多字符,因此几乎所有欧洲语言(除了马耳他语、拉脱维亚语、立陶宛语)在“拉丁文扩展”范围内也需要拉丁文1补充。这意味着支持“拉丁扩展”的字体自然应该包括“拉丁”类别,但是有些字体可能决定只支持选定的语言(比如只支持波兰字符的拉托字体——作者是波兰人)。因此,如果你没有特别针对上面提到的三种语言中的一些,如果你选择“拉丁语扩展”,一定要选择“拉丁语”。

在 Unicode 中,还有一个拉丁-Extended-B 块,它主要支持非欧洲拉丁字母,阿塞拜疆语和罗马尼亚语,但是这些字符经常被来自 Extended-A (尽管我的罗马尼亚朋友告诉我这是不可接受的替代品)的 Ä 所替代。支持还包括越南语 something,something (但这在谷歌字体上有自己的分类)和一些非洲语言,这也需要拉丁-扩展-附加块。

谷歌的拉丁扩展类别不支持大多数非洲拉丁语言(兼容的谷歌字体列表如下)。还有更多奇特的 C、 D 和 E 扩展(总共252个字符) ,它们包含过时的字母和符号,如今大多数都是无用的。下表总结了这一点(不是100% 正确,只是为了了解块的主要意图) :

--------------------------------------------------------------------
| Unicode Latin Set         | Latin Support       | Google Name    |
|==================================================================|
| Basic Latin (aka ASCII)   | English             |                |
| Latin1-Supplement         | Western European    | Latin          |
|------------------------------------------------------------------|
| Latin Extended A          | European based      | Latin Extended |
|------------------------------------------------------------------|
| Latin Extended B          | non-European        | Vietnamese     |
|------------------------------------------------------------------|
| Latin Extended Additional | African             |                |
|------------------------------------------------------------------|
| Latin Extended C, D, E    | Historical, Exotic  |                |
--------------------------------------------------------------------

谷歌如何对字体进行分类

如果字体包含拉丁扩展 A 块中的某些字符,Google 会将其放入拉丁扩展类别中。如果字体支持块中的所有字符,则没有信息: 字体详细信息中的 象形文字选项卡不显示所有字形。

谷歌字体上的“语言”过滤器是相当混乱和不清楚的: 它包含 Devanagari (这不是一种语言,但书写系统和 Unicode 块) ,“拉丁”和“拉丁扩展”(这不是语言,但谷歌的伪块)和一些语言,使用一些字符从其他块。这里没有明确的区分块支持和语言支持,也没有区分支持是完全的还是部分的。目前,找出这个问题的唯一方法是尝试显示下面列表中的字符。

语言支持

来自 < a href = “ https://en.wikipedia.org/wiki/List _ of _ Laden-script _ alphabet”rel = “ nofollow noReferrer”> 拉丁文字母列表 以下检查的 Omniglot和其他来源,我不计算:

  • 从拉丁扩展的有向图 IJ,DZ,D,LJ,NJ-在现实世界中,它们总是作为单独的字符使用,并且有许多有向图(如捷克 CH)从未成为任何标准的一部分
  • 非拉丁字母 ,因为这个问题是关于拉丁字母与拉丁字母的比较。有些语言使用两种书写系统: 我不包括那些拉丁语很少见的地方(阿布哈兹、 Quasquai、维吾尔语) ,直到正式采取行动(哈萨克语)
  • 少数民族和死亡语言(阿迪格、阿拉贡、 Archi、阿雷恩特、波罗的语族、 Bislama、辛布里安、查莫罗、楚瓦什、塞浦路斯、达利卡里安、埃克斯特马杜拉、 Fala、 Elfdalian、法罗群岛、弗里西亚、吉尔伯特、热那亚、 Glosa、,海达和爱斯基摩-阿留申语系,Ikizu,Iñupiaq,Istriot,拉加利亚,利沃尼亚,Ladin,利昂,Kashubian,马绍尔,马恩岛,米兰达斯,古斯堪的纳维亚语、 Nuxalk 语、 Occitan 语、罗曼什语、罗托卡斯语、萨米语、萨摩亚语、上下索布亚语、塔希提语、 Tawlu 语、德顿语、汤加语、乌利西亚语、 Votic 语、雅浦语、祖尼语、印度本地拉丁字母)
  • 政治性强的语言,只是其他语言的一种方言,有着相同的地名(美式英语,波斯尼亚语,黑山语,摩尔多瓦语,印度尼西亚语,瓦隆语)
  • 洋泾浜和克里奥尔语 (像阿尔萨斯语) ,因为它们很难分类和混合在两种语言之间,字母表作为这两种语言的子集
  • 历史字符 在最新版本的字母表中未使用(如双重重音符号,在传统的爱尔兰字母 s 上方的点)
  • 货币符号 ,因为它不是语言不可分割的一部分
  • 音译字符 几乎是语言学家独有的,即 Pinyin、 IPa、 UPA

请评论是否有重要的东西丢失或者在电子通信中使用了少数民族语言。波尔兹是全国的主要官方语言。在这个列表中,至少有几十万人使用不同的语言。

ASCII (基本拉丁文,通常支持非拉丁文字体)

古典拉丁语,艾马拉语(玻利维亚) 南非荷兰语(南非) ,阿斯图里亚语(西班牙) ,科尔苏语(法国) ,妲奇斐济说英语格陵兰语,盖尔语(苏格兰) ,Gilbertese(基里巴斯) ,海地人,Hiligaynon (菲律宾) ,Lombard (意大利) ,马来语,绍纳语(津巴布韦) ,西西里语,斯瓦希里语(中非)。

拉丁文

  • 阿罗马尼亚(巴尔干半岛)
  • 巴斯克(又名埃斯卡拉)(西班牙)
  • 布列塔尼(法国)
  • 阿尔巴尼亚语(不是 Arbëresh 方言)
  • 加泰罗尼亚语(西班牙语) À,É,È,Í,Ï,L · ,Ó,Ò,Ú,Ü,Ç (来自 Ext-A 的 L · 可以写成 L,中间有点 · 字符)
  • 塞布阿诺(菲律宾)
  • 丹麦语 剧情,Å,Ø,something (来自 Ext-B 非常罕见)
  • 爱沙尼亚
  • (,从 Ext-A 很少使用,可以使用 S,Z)
  • [菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律宾语][菲律
  • 法语“/strong > 剧情,”,“(来自 Ext-A,用于路标,但人们通常在信息中使用 oe,Ext-A 很少使用法语名称,其余包括在拉丁语补充,背后的故事维基百科注释[ en ])
  • 加利西亚(西班牙)
  • (德语)
  • 冰岛剧情,剧情,生活,快乐,快乐,我,看,管,校
  • 爱尔兰人,爱尔兰人,爱尔兰人,爱尔兰人,爱尔兰人,爱尔兰人
  • 意大利语 Ì,Ù,a,o (最后两个有时强调,在英语中也流行在 Numero-No)
  • (印度语)
  • (卢森堡语)
  • 挪威 剧情,Å,Ø
  • (意大利)
  • 克丘亚(玻利维亚)
  • (葡萄牙语)
  • 撒丁岛(意大利)
  • (西班牙语)
  • 瑞典

拉丁语延伸

  • 阿塞拜疆语 Ç,I (无点小写) ,Ö,Ü,something (来自 Ext-B 的 something 可以被 Ä 取代,然后与土耳其语相同的字母表)
  • 克里米亚鞑靼(俄罗斯)
  • 捷克语,看,
  • 世界语(国际)
  • Friulian (意大利)
  • Gagauz (Moldavia) Ä,Ç,Ê,I (无头小写) ,址,..
  • 瓜拉尼语(巴拉圭语) Á,Í,Ó,ü,something,g,Ñ,Õ,something (来自 Ext-A,something,something 来自 Ext-add,G 不是 Unicode,只是结合了附加符号) Ext-A 范围以外的字符经常被回旋转录(Ê,Î,Û,)
  • 夏威夷菜
  • 匈牙利人 & # 8226; & # 8226; & # 8226; & # 8226; & # 8226; & # 8226; & # 8226;
  • 哈萨克语 (2017-2025年计划从西里尔文) Ä,Ç,,I (无点小写) ,,,址,Ü (修订多次,2019年版本)
  • 库尔德人
  • 拉脱维亚人
  • 立陶宛语 ,,,,,,
  • 马耳他,
  • 毛利人,,(少数民族,但自2015年以来更广为人知和流行)
  • 波兰语
  • 罗马尼亚语(国际) ,(口语,但很少书面语言)
  • 罗马尼亚语 ,μ,something,something (something,something 来自拉丁语 Ext-B,可以使用,来自 Ext-A)
  • 萨米语(北方,少数民族语言,但在 Ext-A 中有独家报道)
  • 塞尔维亚-克罗地亚语
  • (斯洛伐克语)
  • 斯洛文尼亚
  • 鞑靼(自2012年起)
  • 土耳其语 Ç,,I (无点小写) ,,址,&
  • 土库曼斯坦
  • 越南语: 强调,强调,强调,强调,强调,强调,强调,强调(强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,强调,
  • (威尔士语)

拉丁扩展,非洲(大多数不支持拉丁扩展字体) 。完全支持 abc0的有 Ubuntu,Fira Sans,Garamond,Tinos,新闻周期,Didact 哥特式,m Plus,Sawarabi,Cousine,Caudex,Judson,Andika (当然还有 Noto,见下文)

  • 巴里(刚果) ,址
  • 班巴拉 (马里) something,something,something (都来自 Ext-B)
  • 柏柏尔(图阿雷格) (撒哈拉) ,something,something,something,something,something,something,something (something,something from Ext-B,chars with dot under from Ext-add)
  • 奇切瓦(Chewa) (东非)
  • 达巴尼 (刚果) something,something,something,(something,something,something 来自 Ext-B)
  • 丁卡语 (苏丹语) Ä,Ë,something,something,something,Ï,Ö,something,something (something,something,something,something 来自 Ext-B,something,something 不是 Unicode 语言,只有结合附加符号)
  • Fula (Western Africa) something,something,something,(from Ext-A,rest from Ext-B)
  • Hausa (Chad) something,something,something,something,R (不在 Unicode 中,只与附加符号组合,其余来自 Ext-B)
  • 伊博 (尼日利亚) something,something (扩展-附加)
  • 马达加斯加语 (马达加斯加语) N (不是 Unicode 语,只能用附加符号结合,可以用拉丁语的 Ñ 代替)
  • 泛尼日利亚语 something,something,something,something,something,something,something (something,something,something,something 来自 Ext-B,something,something,something 来自 Ext-Add)
  • [塞内加尔][塞内加尔][塞内加尔][塞内加尔][塞内加尔][塞内加尔][塞内加尔][塞内加尔][塞内加尔][塞内加尔]
  • 约鲁巴语 (西非) something,something,something (外加 + 组合音素 Á,À,)

结合发音符号

或者,字体可以支持组合发音符号块: U + 0300到 U + 036F。例如,Ř可以输入为 U+0158(又名 预组字元)或 R + U+030C。支持 Unicode 的程序应该同时显示和处理这两个问题,并提供一些 API 来处理它——就像 标准化()分解变音符一样——但是如果程序或字体不支持 剧目,合并附加符号可能会有点错位(喜欢太低的元音似乎在这个字体中得到了修复) ,请参阅这个主题的非常详细的 Unicode 问答

拉丁语中的非拉丁字符

许多拉丁字体支持拉丁范围之外的一些字符,因为它们在拉丁文本中很常见,即:

  • 希腊字母 μ (用作从希腊和科普特 Unicode 块 U + 0370到 U + 03FF 的 微观) ,也许还有其他一些常用的字母(λ,π,α,β,γ,δ,ε,Σ,Ω)——谷歌一半的拉丁扩展字体都不支持这个
  • 项目符号 (用于 Unicode 块 U + 2000到 U + 206F 之间的列表)
  • 开始和结束引号 “ ,”,“ ,”,可能还有他们的低开头版本“和”-请参阅维基百科上引号的正确使用 < a href = “ https://en.Wikipedia.org/wiki/Quotation _ mark”rel = “ nofollow noReferrer”>
  • 破折号 U + 2010 to U + 2015,参见维基百科上破折号的正确使用
  • 也许有一些从 U + 20 A0到 U + 20 CF 的 货币符号(something 是最常见的并且在谷歌字体上得到很好的支持)

如果你的字体不支持它们,我建议试着看看它是如何与后备字体结合的,就像这句话(复制粘贴包括项目符号在内的字体)

•“我们出售的‘便宜’电容器在 μF-mF 范围内,每组2 something”

自定义字体

您可能希望通过 松鼠字体服务自定义一些字体(如果他们的许可允许的话) ,或者使用它们作为备份。

大量字符的字体:

  • 我真的很喜欢漂亮的衬线 基维拉开放式字体与11 + k 字符,1.5 MB
  • 许多计算机都安装了 Arial Unicode (MS Office 的一部分,50 + k 字符,22 MB)
  • 有一个由谷歌的 不行,其中包含所有但最新的 Unicode 字符在 serif,sans-serif 和 UI 字体很好地排序块支持(1.1 GB)
  • 作为最后的备份字体,你可以考虑丑陋的 统一字体(50 + k 字符,但只有11MB 和嵌入式设备友好)

如果你真的喜欢一些字体,缺乏支持一些变音符,这是很容易添加的支持使用字体锻造。在这种情况下,仔细阅读字体许可证: 从法律的角度来看,字体是软件。