字符
COBOL 语言最基本、最不可分割的单位是字符。 基本字符集包括拉丁字母,数字和特殊字符的字母。
在 COBOL 语言中,单个字符连接成字符串和分隔符。 然后,使用字符串和分隔符来构成构成语言的单词,文字,短语,子句,语句和句子。
源代码中用于形成字符串和分隔符的基本字符如表1 所示。
对于某些语言元素,基本字符集使用 以下字符集进行扩展,具体取决于编译时使用的 代码页 :
- ASCII 双字节字符集 (DBCS)。 DBCS 字符占用 2 个相邻字节以表示一个字符。 在本文档中,以源代码中的多个字节 (包括 DBCS 字符) 表示的字符称为 多字节字符。 仅包含 DBCS 字符的字符串也称为 DBCS 字符串 或 双字节字符串。
- UTF-8, Unicode 字符集的编码格式。 UTF-8 字符占用每个字符 1 到 4 个字节。 在本文档中,占用 2 个或更多字节的 UTF-8 字符称为 多字节字符。
- 扩展 UNIX 代码 (EUC)。 EUC 字符占用每个字符 1 个字节到 4 个字节 (或 1 个字节到 3 个字节,具体取决于代码页)。 在本文档中,占用 2 个或更多字节的 EUC 字符称为 多字节字符 。
多字节 字符可用于构成用户定义的词。
字母数字文字,注释行和注释条目的内容可以包含计算机的编译时字符集中的任何字符,并且可以同时包含单字节和 多字节 字符。
运行时数据可以包含计算机的运行时字符集中的任何字符。 计算机的运行时字符集可以包含字母数字字符, 多字节 字符, 和本地字符。 本地字符以 UTF-16表示,这是 Unicode 的 16 位编码格式。
当 NSYMBOL (NATIONAL) 编译器选项生效时,由开头定界符 N "或 N" 标识的字面值是本地字面值,并且可以包含对 编译时代码页。 有效的任何单字节和/或 多字节 字符 在运行时,包含在本地文字中的字符表示为本地字符。
详情请参阅用户自定义的多字节字符、 双字节字符集文字和国家文字。
| 字符 | 含义 | 使用 | 示例 |
|---|---|---|---|
| 空间 | 标点字符 |
|
|
| + | 加号 | 算术运算符 |
|
| 编辑字符 |
|
||
| - | 减号或连字符 | 算术运算符 |
|
| 编辑字符 |
|
||
| 连续字符 |
|
||
| COBOL 词素 |
|
||
| * | 星号 | 算术运算符 |
|
| 编辑字符 |
|
||
| 注释字符 |
|
||
| / | 正斜杠或 solidus | 算术运算符 |
|
| 编辑字符 |
|
||
| 连续字符 |
|
||
| = | 等号 | 分配字符 |
|
| 关系字符 |
|
||
| $ | 货币符号 | 编辑字符 |
|
| , | 逗号 | 编辑字符 |
|
| 标点字符 |
|
||
| ; | 分号 | 标点字符 |
|
. |
小数点或句点 | 编辑字符 |
|
| 标点字符 |
|
||
" |
引号 | 标点字符 |
|
' |
APOSTROPHE | 标点字符 |
|
| ( | 左括号 | 标点字符 |
|
| ) | 右括号 | 标点字符 |
|
| > | 大于 | 关系字符 |
|
| < | 小于 | 关系字符 |
|
| : | 科隆 | 关系字符 |
|
| _ | 下划线 | 用户定义的词元素 |
|
| A-Z | Alphabet (大写) | 字母字符 | / |
| 阿兹 | Alphabet (小写) | 字母字符 | / |
| 0 - 9 | 数字字符 | 数字字符 | / |