字符
COBOL 语言的最基本且不可分割的单元是 字符。 基本字符集包括拉丁字母,数字和特殊字符的字母。
在 COBOL 语言中,将连接各个字符以形成 character-strings 和 分隔符。 然后,使用字符串和分隔符来构成构成语言的单词,文字,短语,子句,语句和句子。
源代码中用于形成字符串和分隔符的基本字符如表1 所示。
对于某些语言元素,基本字符集使用 EBCDIC 双字节字符集 (DBCS) 进行扩展。
DBCS 字符可用于构成用户定义的字。
字母数字文字,注释行和注释项的内容可以包含计算机的编译时字符集中的任何字符,并且可以同时包含单字节和 DBCS 字符。
运行时数据可以包含计算机的运行时字符集中的任何字符。 计算机的运行时字符集可以包含字母数字字符, DBCS 字符, 本地字符和 UTF-8 字符。 本地字符以 UTF-16表示,这是 Unicode 的 16 位编码格式。 UTF-8 字符以 UTF-8表示,这是 Unicode (每个字符 1 到 4 字节) 的可变长度编码格式。
当 NSYMBOL (NATIONAL) 编译器选项生效时,由开头定界符 N "或 N" 标识的字面值是本地字面值,并且可以包含对 有效的编译时代码页 (缺省代码页或为 CODEPAGE 编译器选项指定的代码页)。 有效的任何单字节和/或 双字节 字符 在运行时,包含在本地文字中的字符表示为本地字符。
详情请参阅用户自定义的DBCS字符、 DBCS文字和民族文字。
由开始定界符 U" 或 U' 标识的字面值为 UTF-8 字面值。 它们可以包含对有效的编译时代码页 (缺省代码页或为 CODEPAGE 编译器选项指定的代码页) 有效的任何单字节和/或双字节字符。 UTF-8 字面值中包含的字符在运行时表示为 UTF-8 字符。
| 字符 | 含义 | 使用 | 示例 |
|---|---|---|---|
| 空格 | 标点字符 |
|
|
| + | 加号 | 算术运算符 |
|
| 编辑字符 |
|
||
| - | 减号或连字符 | 算术运算符 |
|
| 编辑字符 |
|
||
| 连续字符 |
|
||
| COBOL 字元素 |
|
||
| * | 星号 | 算术运算符 |
|
| 编辑字符 |
|
||
| 注释字符 |
|
||
| / | 正斜杠或 solidus | 算术运算符 |
|
| 编辑字符 |
|
||
| 连续字符 |
|
||
| = | 等号 | 分配字符 |
|
| 关系字符 |
|
||
| $ | 货币符号1 | 编辑字符 |
|
| , | 逗号 | 编辑字符 |
|
| 标点字符 |
|
||
| ; | 分号 | 标点字符 |
|
. |
小数点或句点 | 编辑字符 |
|
| 标点字符 |
|
||
" |
引号2 | 标点字符 |
|
' |
APOSTROPHE | 标点字符 |
|
| ( | 左括号 | 标点字符 |
|
| ) | 右括号 | 标点字符 |
|
| > | 大于 | 关系字符 |
|
| < | 小于 | 关系字符 |
|
| : | 科隆 | 关系字符 |
|
| _ | 下划线 | 用户定义的词元素 |
|
| A-Z | Alphabet (大写) | 字母字符 | / |
| 阿兹 | Alphabet (小写) | 字母字符 | / |
| 0 - 9 | 数字字符 | 数字字符 | / |
|
|||