字符

COBOL 语言的最基本且不可分割的单元是 字符。 基本字符集包括拉丁字母,数字和特殊字符的字母。

在 COBOL 语言中,将连接各个字符以形成 character-strings分隔符。 然后,使用字符串和分隔符来构成构成语言的单词,文字,短语,子句,语句和句子。

源代码中用于形成字符串和分隔符的基本字符如表1 所示。

对于某些语言元素,基本字符集使用 EBCDIC 双字节字符集 (DBCS) 进行扩展。

DBCS 字符可用于构成用户定义的字。

字母数字文字,注释行和注释项的内容可以包含计算机的编译时字符集中的任何字符,并且可以同时包含单字节和 DBCS 字符。

运行时数据可以包含计算机的运行时字符集中的任何字符。 计算机的运行时字符集可以包含字母数字字符, DBCS 字符, 本地字符和 UTF-8 字符。 本地字符以 UTF-16表示,这是 Unicode 的 16 位编码格式。 UTF-8 字符以 UTF-8表示,这是 Unicode (每个字符 1 到 4 字节) 的可变长度编码格式。

当 NSYMBOL (NATIONAL) 编译器选项生效时,由开头定界符 N "或 N" 标识的字面值是本地字面值,并且可以包含对 有效的编译时代码页 (缺省代码页或为 CODEPAGE 编译器选项指定的代码页)。 有效的任何单字节和/或 双字节 字符 在运行时,包含在本地文字中的字符表示为本地字符。

详情请参阅用户自定义的DBCS字符DBCS文字民族文字

由开始定界符 U"U' 标识的字面值为 UTF-8 字面值。 它们可以包含对有效的编译时代码页 (缺省代码页或为 CODEPAGE 编译器选项指定的代码页) 有效的任何单字节和/或双字节字符。 UTF-8 字面值中包含的字符在运行时表示为 UTF-8 字符。

表 1. 基本 COBOL 字符集此表列示基本 COBOL 字符集。
字符 含义 使用 示例
  空格 标点字符
01 WS-A PIC X(10).
+ 加号 算术运算符
COMPUTE WS-A = WS-B + WS-C.
编辑字符
01 WS-A PIC +9(3).
- 减号或连字符 算术运算符
COMPUTE WS-A = WS-B - WS-C.
编辑字符
01 WS-A PIC -9(3).
连续字符

  01 WS-VAR  PIC X(27) VALUE 
-      'THIS MULTI-LINE TEXT'. 
COBOL 字元素
01 WS-A PIC 9(3).
* 星号 算术运算符
COMPUTE WS-A = WS-B * WS-C.
编辑字符
01 WS-A PIC **9.
注释字符
* THIS IS COMMENT LINE. 
/ 正斜杠或 solidus 算术运算符
COMPUTE WS-A = WS-B / WS-C.
编辑字符
01 WS-DATE PIC 99/99/99.
连续字符

/01 WS-VAR  PIC X(27) VALUE 
/     'THIS MULTI-LINE TEXT'. 
= 等号 分配字符
COMPUTE WS-A = WS-B / WS-C.
关系字符
IF WS-A = 10
$ 货币符号1 编辑字符
01 WS-DATE PIC $$99.
, 逗号 编辑字符
01 WS-DATE PIC 99,999.
标点字符
MOVE 10 TO WS-A, WS-B.
; 分号 标点字符
MOVE 10 TO WS-A; WS-B.
. 小数点或句点 编辑字符
01 WS-DATE PIC 99.999.
标点字符
MOVE 10 TO WS-A, WS-B.
" 引号2 标点字符
01 WS-VAR PIC X(5) VALUE "HELLO".
' APOSTROPHE 标点字符
01 WS-VAR PIC X(5) VALUE 'HELLO'.
( 左括号 标点字符
IF (WS-A = 10) AND (WS-B = 5)
) 右括号 标点字符
IF (WS-A = 10) AND (WS-B = 5)
> 大于 关系字符
IF WS-A > 10
< 小于 关系字符
IF WS-A < 10
: 科隆 关系字符
MOVE WS-VAR(1:10) TO WS-VAR1.
_ 下划线 用户定义的词元素
01 WS_VAR PIC X(10).
A-Z Alphabet (大写) 字母字符 /
阿兹 Alphabet (小写) 字母字符 /
0 - 9 数字字符 数字字符 /
  1. 货币符号是值为 "X'5B',的字符,与有效的代码页无关。 分配的图形字符可以是美元符号或本地货币符号。
  2. 引号是值为X'7F' 的字符。