概述

ASCII 字符编码标准是以 7 位字节字符串为基础的 ASCII 编码标准,其字符数量足以对英文文本进行编码,但无法对其他主要书面语言进行编码。

国际标准化组织为不同的拉丁文书写系统组制定了 ASCII 的若干 8 位扩展标准。 ISO 8859 标准还包含西里尔文、阿拉伯文、希腊文、希伯来文和泰文部分。

  • Latin-1支持西欧语言,被广泛使用。
  • 采用Latin-9(对Latin-1 稍作改动),以包含欧元符号 (€)。

char 和 varchar 被视为Latin-9编码。 Latin-9取代Latin-1,成为西欧字符数据的首选 8 位编码。

Latin-9包括大多数西欧书面语言,如法语、西班牙语、加泰罗尼亚语、加利西亚语、巴斯克语、葡萄牙语、意大利语、阿尔巴尼亚语、南非荷兰语、荷兰语、德语、丹麦语、瑞典语、挪威语、芬兰语、法罗语、冰岛语、爱尔兰语、苏格兰语、英语,但不包括波兰语、捷克语、匈牙利语、罗马尼亚语等中欧语言。 Unicode 是处理不在Latin-9列表中的书面语言的无问题方法。