LC_CTYPE-Kategorie für das Quellendateiformat der Ländereinstellungsdefinition

Zweck

Definiert die Zeichenklassifikation, den Wechsel zwischen Groß- und Kleinschreibung und andere Zeichenattribute.

Beschreibung

Die Kategorie LC-CTYPE einer Quellendatei für die Ländereinstellungsdefinition definiert Zeichenklassifikation, Konvertierung der Groß-/Kleinschreibung und andere Zeichenattribute. Diese Kategorie beginnt mit einem LC-CTYPE -Kategorieheader und endet mit einem ENDE LC_CTYPE -Kategorietrailer.

Alle Operanden für LC-CTYPE -Kategorieanweisungen werden als Zeichenlisten definiert. Jede Liste besteht aus einem oder mehreren durch Semikolons getrennten Zeichen oder symbolischen Zeichennamen.

Die folgenden Schlüsselwörter werden in der Kategorie LC-CTYPE erkannt. In den Beschreibungen bedeutet der Begriff automatisch eingeschlossen , dass kein Fehler auftritt, wenn die referenzierten Zeichen eingeschlossen oder übergangen werden. Die Zeichen werden bereitgestellt, wenn sie fehlen, und akzeptiert, wenn sie vorhanden sind.

Element Beschreibung
Kopieren Gibt den Namen einer vorhandenen Ländereinstellung an, die als Definition dieser Kategorie verwendet werden soll Wenn eine Anweisung Kopie in der Datei enthalten ist, kann kein anderes Schlüsselwort angegeben werden.
Großbuchstaben Definiert Großbuchstaben. Es können keine Zeichen angegeben werden, die durch das Schlüsselwort Strg, Ziffer, Punctoder Leerzeichen definiert werden. Mindestens die Großbuchstaben A-Z müssen definiert werden.
Kleinbuchstaben Definiert Kleinbuchstaben. Es können keine Zeichen angegeben werden, die durch das Schlüsselwort Strg, Ziffer, Punctoder Leerzeichen definiert werden. Mindestens die Kleinbuchstaben a-z müssen definiert werden.
alpha Definiert alle Buchstaben. Es können keine Zeichen angegeben werden, die durch das Schlüsselwort Strg, Ziffer, Punctoder Leerzeichen definiert werden. Zeichen, die durch die Schlüsselwörter Oberer und Untergrenze definiert werden, werden automatisch in diese Zeichenklasse eingeschlossen.
Ziffer Definiert numerische Ziffern. Nur die Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8 und 9 können angegeben werden.
Alnum Definiert alphanumerische Zeichen. Es kann kein Zeichen angegeben werden, das durch das Schlüsselwort Strg, Punctoder Leerzeichen definiert wird. Zeichen, die durch die Schlüsselwörter Alpha und Ziffer definiert werden, werden automatisch in diese Zeichenklasse eingeschlossen.
Leerzeichen Definiert Leerzeichen. Es kann kein Zeichen angegeben werden, das durch das Schlüsselwort Oberer, Untergrenze, Alpha, Ziffer, Grafik, Strgoder X-Ziffer definiert ist. Mindestens die<space>,<form-feed>,<newline>,<carriage return>,<tab>und<vertical-tab>Zeichen und alle durch das Schlüsselwort Leer definierten Zeichen müssen angegeben werden.
Strg Definiert Steuerzeichen. Es können keine Zeichen angegeben werden, die durch das Schlüsselwort Oberer, Untergrenze, Alpha, Ziffer, Punct, Grafik, Drucken, X-Zifferoder Leerzeichen definiert werden.
Punct Definiert Interpunktionszeichen. Ein Zeichen, das als<space>Zeichen und Zeichen, die durch das Schlüsselwort Oberer, Untergrenze, Alpha, Ziffer, Strgoder X-Ziffer definiert werden, können nicht angegeben werden.
Diagramm Definiert druckbare Zeichen, mit Ausnahme der<space>Zeichen gefolgt werden. Wenn dieses Schlüsselwort nicht angegeben wird, werden Zeichen, die durch die Schlüsselwörter Oberer, Untergrenze, Alpha, Ziffer, X-Zifferund Punct definiert werden, automatisch in diese Zeichenklasse eingeschlossen. Es kann kein Zeichen angegeben werden, das durch das Schlüsselwort Strg definiert wird.
drucken Definiert druckbare Zeichen, einschließlich<space>Zeichen gefolgt werden. Wenn dieses Schlüsselwort nicht angegeben wird,<space>Zeichen und Zeichen, die durch die Schlüsselwörter Oberer, Untergrenze, Alpha, Ziffer, X-Zifferund Punct definiert werden, werden automatisch in diese Zeichenklasse eingeschlossen. Es kann kein Zeichen angegeben werden, das durch das Schlüsselwort Strg definiert wird.
X-Ziffer Definiert hexadezimale Ziffern. Die Ziffern 0-9 und die Buchstaben A-F und a-f können angegeben werden. Das Schlüsselwort X-Ziffer nimmt standardmäßig die normalen Klassengrenzwerte an.
Leer Definiert Leerzeichen. Wenn dieses Schlüsselwort nicht angegeben wird,<space>und<horizontal-tab>sind in dieser Zeichenklasse enthalten. Alle von dieser Anweisung definierten Zeichen werden automatisch in die Schlüsselwortklasse Leerzeichen eingeschlossen.
Zeichenklasse Definiert einen oder mehrere ländereinstellungsspezifische Zeichenklassennamen als durch Semikolons getrennte Zeichenfolgen. Jede benannte Zeichenklasse kann anschließend in der LC-CTYPE -Definition definiert werden. Ein Zeichenklassenname besteht aus mindestens einem und höchstens 32 Byte alphanumerischen Zeichen aus dem Symbole für portierbare Zeichensätze. Das erste Zeichen eines Zeichenklassennamens darf keine Ziffer sein. Der Name darf keinem der in diesem Abschnitt definierten LC-CTYPE -Schlüsselwörter entsprechen.
Zeichenklassen-Name Definiert Zeichen, die als zu der benannten ländereinstellungsspezifischen Zeichenklasse gehörig klassifiziert werden sollen. Ländereinstellungsspezifische benannte Zeichenklassen müssen nicht in der Ländereinstellung POSIX vorhanden sein.

Wenn ein Klassenname durch ein Schlüsselwort Zeichenklasse definiert wird, ihm jedoch später keine Zeichen zugeordnet werden, stellt er eine Klasse ohne zugehörige Zeichen dar.

Der Parameter charclass-name kann als Parameter Eigenschaft in der Subroutine WC-Typ , in regulären Ausdrücken und Shellmustererkennungsausdrücken und mit dem Befehl Tr verwendet werden.

toupper Definiert die Zuordnung von Kleinbuchstaben zu Großbuchstaben. Operanden für dieses Schlüsselwort bestehen aus durch Semikolons getrennten Zeichenpaaren. Jedes Zeichenpaar ist in () eingeschlossen. (runde Klammern) und vom nächsten Paar durch ein Komma (,) getrennt. Das erste Zeichen in jedem Paar wird als Kleinbuchstaben betrachtet; das zweite Zeichen wird als Großbuchstaben betrachtet. Es können nur Zeichen angegeben werden, die durch die Schlüsselwörter Untergrenze und Oberer definiert werden.
tolower Definiert die Zuordnung von Großbuchstaben zu Kleinbuchstaben. Operanden für dieses Schlüsselwort bestehen aus durch Semikolons getrennten Zeichenpaaren. Jedes Zeichenpaar ist in () eingeschlossen. (runde Klammern) und vom nächsten Paar durch ein Komma (,) getrennt. Das erste Zeichen in jedem Paar wird als Großschreibung betrachtet; das zweite Zeichen wird als Kleinschreibung betrachtet. Es können nur Zeichen angegeben werden, die durch die Schlüsselwörter Untergrenze und Oberer definiert werden.

Das Schlüsselwort Tolower ist optional. Wird dieses Schlüsselwort nicht angegeben, wird für die Zuordnung standardmäßig die umgekehrte Zuordnung des Schlüsselworts Toupper verwendet, sofern angegeben. Wenn die Schlüsselwörter Toupper und Tolower beide nicht angegeben sind, wird für jede Zuordnung standardmäßig die Zuordnung der C -Ländereinstellung verwendet.

Die Kategorie LC-CTYPE unterstützt keine Elemente mit mehreren Zeichen. Zum Beispiel wird das deutsche Zeichen scharf-s traditionell als Kleinbuchstabe klassifiziert. Es gibt keinen entsprechenden Großbuchstaben; bei richtiger Großschreibung des deutschen Textes wird das Zeichen scharf-s durch die beiden Zeichen ss ersetzt. Diese Art der Konvertierung liegt außerhalb des Geltungsbereichs der Schlüsselwörter Toupper und Tolower .

Beispiele

Das folgende Beispiel zeigt eine mögliche LC-CTYPE -Kategorie, die in einer Quellendatei für die Ländereinstellungsdefinition aufgelistet ist.

LC_CTYPE
#"alpha" is by default "upper" and "lower"
#"alnum" is by default "alpha" and "digit"
#"print" is by default "alnum", "punct" and the space character
#"graph" is by default "alnum" and "punct"
#"tolower" is by default the reverse mapping of "toupper"
#
upper           <A>;<B>;<C>;<D>;<E>;<F>;<G>;<H>;<I>;<J>;<K>;<L>;<M>;\
                <N>;<O>;<P>;<Q>;<R>;<S>;<T>;<U>;<V>;<W>;<X>;<Y>;<Z>
#
lower           <a>;<b>;<c>;<d>;<e>;<f>;<g>;<h>;<i>;<j>;<k>;<l>;<m>;\
                <n>;<o>;<p>;<q>;<r>;<s>;<t>;<u>;<v>;<w>;<x>;<y>;<z>
#
digit           <zero>;<one>;<two>;<three>;<four>;<five>;<six>;\
                <seven>;<eight>;<nine>
#
space           <tab>;<newline>;<vertical-tab>;<form-feed>;\
                <carriage-return>;<space>
#
cntrl           <alert>;<backspace>;<tab>;<newline>;<vertical-tab>;/
                <form-feed>;<carriage-return>;<NUL>;<SOH>;<STX>;/
                <ETX>;<EOT>;<ENQ>;<ACK>;<SO>;<SI>;<DLE>;<DC1>;<DC2>;/
                <DC3>;<DC4>;<NAK>;<SYN>;<ETB>;<CAN>;<EM>;<SUB>;/
                <ESC>;<IS4>;<IS3>;<IS2>;<IS1>;<DEL>
#
punct           <exclamation-mark>;<quotation-mark>;<number-sign>;\
                <dollar-sign>;<percent-sign>;<ampersand>;<asterisk>;\
                <apostrophe>;<left-parenthesis>;<right-parenthesis>; 
                <plus-sign>;<comma>;<hyphen>;<period>;<slash>;/
                <colon>;<semicolon>;<less-than-sign>;<equals-sign>;\
                <greater-than-sign>;<question-mark>;<commercial-at>;\
                <left-square-bracket>;<backslash>;<circumflex>;\
                <right-square-bracket>;<underline>;<grave-accent>;\
                <left-curly-bracket>;<vertical-line>;<tilde>;\
                <right-curly-bracket>
#
xdigit          <zero>;<one>;<two>;<three>;<four>;<five>;<six>;\
                <seven>;<eight>;<nine>;<A>;<B>;<C>;<D>;<E>;<F>;\
                <a>;<b>;<c>;<d>;<e>;<f>
#
blank           <space>;<tab>
#
toupper  (<a>,<A>);(<b>,<B>);(<c>,<C>);(<d>,<D>);(<e>,<E>);\
                (<f>,<F>);(<g>,<G>);(<h>,<H>);(<i>,<I>);(<j>,<J>);\
                (<k>,<K>);(<l>,<L>);(<m>,<M>);(<n>,<N>);(<o>,<O>);\
                (<p>,<P>);(<q>,<Q>);(<r>,<R>);(<s>,<S>);(<t>,<T>);\
                (<u>,<U>);(<v>,<V>);(<w>,<W>);(<x>,<X>);(<y>,<Y>);\
                (<z>,<Z>)
#
END LC_CTYPE

Dateien

Element Beschreibung
/usr/lib/nls/loc/* Gibt Quellendateien für Ländereinstellungsdefinitionen für unterstützte Ländereinstellungen an.
/ usr/lib/nls/Zeichensatz/* Gibt die Quellendateien für Zeichensatzbeschreibungen (Charmap) für unterstützte Ländereinstellungen an.