setmaps-Dateiformat

Zweck

Definiert den Text einer Zuordnungsdatei für codierte Zeichensatzes und einer Terminalzuordnungsdatei.

Beschreibung

Der Text einer Zuordnungsdatei für codierte Zeichensatzes besteht aus einer Beschreibung des codierten Zeichensatzes. Der Text einer Terminalzuordnungsdatei besteht aus einem Satz von Regeln.

Zuordnungsdatei für codierten Zeichensatz

Der Text einer Zuordnungsdatei für codierte Zeichensatzes ist eine Beschreibung des codierten Zeichensatzes. Sie gibt die optionale Convertermodule an, die im Datenstrom übertragen werden soll. Die Zuordnungsdatei für codierten Zeichensatz befindet sich im Verzeichnis /usr/lib/nls/csmap . Der Name ist der Name des codierten Zeichensatzes.

Die Zuordnungsdatei für den codierten Zeichensatz enthält die folgenden Zeilen:

Element Beschreibung
Name: Name
Typ : M | S
Mehrbytebehandlung: euc
ioctl EUC_WSET: w1 : d1, w2 : d2, w3 : d3
Unterer Konverter: /usr/lib/drivers/lwkonv
Oberer Konverter: /usr/lib/drivers/Upconv

Die Zeilen haben folgende Bedeutung:

Element Beschreibung
Name Gibt den Namen des codierten Zeichensatzes an. Dies ist auch der Name der Zuordnungsdatei für den codierten Zeichensatz.
Typ Gibt den Typ des codierten Zeichensatzes an. Folgende Werte sind möglich:
M
Bezeichnet einen codierten Mehrbytezeichensatz.
S
Bezeichnet einen codierten Einzelbytezeichensatz.
Mehrbytebehandlung Gibt den Typ der Mehrbytebehandlung des codierten Zeichensatzes an Diese Zeile ist nur erforderlich, wenn Typ auf Mgesetzt ist. Sie muss EUCsein und einen codierten EUC-Mehrbytezeichensatz angeben.
ioctl EUC_WSET Gibt die Parameter für die EUC_WSET -Operation ioctl an. Diese Zeile ist nur erforderlich, wenn Typ auf Mgesetzt ist. Die Parameter w1, w2und w3 geben die Speicherbreite des codierten Zeichensatzes an. Die Parameter d1, d2und d3 geben die Anzeigenbreite des codierten Zeichensatzes an.
Unterer Converter  
Oberer Converter Gibt die Untere und obere Umrichter an, die für den Stream verwendet werden soll Diese Zeile ist nur erforderlich, wenn der codierte Zeichensatz ein Nicht-EUC-Mehrbytezeichensatz ist.

Die Zuordnungsdatei für codierte Zeichensatzes für den codierten Zeichensatz ISO 8859-1 enthält beispielsweise die folgenden Zeilen:

Name:   ISO8859-1
Type:   S

Ein weiteres Beispiel: Die Zuordnungsdatei für codierte Zeichensatzes für den codierten Zeichensatz IBM-943 enthält die folgenden Zeilen:

Name :                  IBM-943
Type :                  M
Multibyte handling :    EUC
ioctl EUC_WSET :        2:2,1:1,2:2
lower converter :       /usr/lib/drivers/lc_sjis
upper converter :       /usr/lib/drivers/up_sjis

Terminalzuordnungsdatei

Der Text einer Terminalzuordnungsdatei ist eine Gruppe von Regeln. Jede Regel hat das folgende Format:

pattern:replacement

Die Länge der Eingabemusterzeichenfolge ist auf 10 Zeichen und die Länge der Ersatzmusterzeichenfolge auf 16 Zeichen begrenzt.

Die Musterzeichenfolge kann die folgenden Sonderzeichen enthalten:

Element Beschreibung
? Entspricht einem beliebigen Einzelbyte.
@x Entspricht dieser Regel nur, wenn sich der Musterprozessor im Status Xbefindet, wobei X ein beliebiges Einzelbyte ist. (Diese Sequenz entspricht keinem Zeichen im Eingabepuffer.)
\?, \@oder \\ Verhindert, dass der Musterprozessor interpretiert? (Fragezeichen), @ (kommerzielles A) oder \ (Backslash) als Sonderzeichen.
\ddd Stellt ein beliebiges Byte in Oktalschreibweise dar
\xtt Stellt ein beliebiges Byte in Hexadezimalschreibweise dar.

Die Ersetzungszeichenfolge kann die folgenden Sonderzeichen enthalten:

Element Beschreibung
$n Verwendet das N-te Zeichen in der Eingabezeichenfolge, die mit diesem Muster übereinstimmt, wobei N eine Dezimalziffer ist.
@x Versetzt den Musterprozessor in den Status X. (Diese Sequenz wird nicht Teil der Ersetzungszeichenfolge.)
\$, \@oder \\ Verhindert, dass der Musterprozessor $, @ oder \ als Sonderzeichen interpretiert.
\ddd Stellt ein beliebiges Byte in Oktalschreibweise dar
\xtt Stellt ein beliebiges Byte in Hexadezimalschreibweise dar.

Dateien

Element Beschreibung
/usr/lib/nls/csmap/sbcs Zuordnung des codierten Zeichensatzes für eine Einzelbyte-Codepage
/usr/lib/nls/csmap/IBM-943 Zuordnung des codierten Zeichensatzes für die IBM-943 -Codepage
/usr/lib/nls/csmap/IBM-eucJP Codekartensatz für die IBM-eucJP Codeseite
/usr/lib/nls/csmap/IBM-eucKR Codekartensatz für die IBM-eucKR Codeseite
/usr/lib/nls/csmap/IBM-eucTW Codekartenset für die IBM-eucTW Codeseite
/usr/lib/nls/termmap/*.in Eingabezuordnungsdateien
/usr/lib/nls/termmap/*.out Ausgabezuordnungsdateien