Zip-Aktionen

Bei der ZIP-Konvertierung werden die in Dateien des ZIP-Formats enthaltenen Dateien extrahiert und konvertiert.

Zip - Übersicht

Bei der ZIP-Konvertierung werden die in Dateien des ZIP-Formats enthaltenen Dateien extrahiert und konvertiert. Diese Dateien werden dann für ihre eigene Verarbeitung zur Verfügung gestellt.

Konvertierungsbegrenzungen

Wenn bei Konvertierungsaktionen das standardmäßige Dateinamensmuster AlphaDecimal verwendet wird, ist die Anzahl der anfänglichen Eingabedateien in einem einzelnen Stapel auf maximal 1296 begrenzt. Diese Dateien können dann innerhalb des Stapels in weitere Dateien dekomprimiert und so letztendlich ein Stapel mit weit mehr als 1296 Dokumenten erstellt werden.

Zum Beispiel ergibt ein Eingabestapel mit einem aus 6 Seiten bestehenden Word-Dokument einen Stapel mit 7 Dateien, nämlich der ursprünglichen DOC-Datei und den 6 TIFF-Dateien, die aus den Seiten generiert wurden. Für jede Datei, die innerhalb des Stapels konvertiert werden soll, gilt ein Maximum von 1296 Ausgabeseiten. So werden beispielsweise bei einem Word-Dokument aus 2000 Seiten nur die ersten 1296 Seiten nach TIFF konvertiert. Entsprechend gilt für eine einzelne ZIP-Datei ein Maximum von 1296 Dateien innerhalb der ZIP-Datei und für eine MSG-Datei ein Maximum von 1296 Anhängen. Der Grenzwert 1296 gilt für jede einzelne Eingabedatei, nicht für alle kombinierten Dateien zusammen.

Bei Verwendung der Konvertierungsaktionen gibt es eine 3-Ebenen-Begrenzung für eingebettete Dateien. Zum Beispiel kann eine MSG-Datei eine ZIP-Datei enthalten, die wiederum eine PDF-Datei enthalten kann. Am Ende der Konvertierung werden alle Dateien extrahiert und alle Seiten in der PDF in ein TIFF-Format konvertiert. Nicht zulässig ist beispielsweise eine MSG-Datei, die eine ZIP-Datei enthält, die eine weitere ZIP-Datei enthält, die eine PDF-Datei enthält. Denn dies ist eine 4-Ebenen-Hierarchie und deshalb unzulässig.

Um mehr als 1296 Dateien in einen einzelnen Stapel zu scannen, muss die Aktion SetNamePattern mit dem Parameter '2' verwendet werden, mit dem das alternative Dateinamensmuster TMxxxxxx ausgewählt wird. In diesem Anwendungsfall wird allen Dateien, die gescannt oder aus einer gescannten Ursprungsdatei dekomprimiert wurden, das nächste verfügbare TMxxxxxx-Muster zugeordnet, wobei xxxxxx für einen Bereich von 1 bis 999999 steht; so sind bis zu 999999 Dateien in einem einzelnen Stapel möglich, nachdem alle gescannten Dateien dekomprimiert wurden.

Die Regeln

Da Regeln flexibel sind, gibt es mehrere Möglichkeiten, die Konvertierungsaktionen für elektronische Dokumente in Anwendungen zu nutzen. Im Folgenden wird eine der empfohlenen Möglichkeiten zur Nutzung der Aktionen in einer Anwendung beschrieben.

Führen Sie das virtuelle Scannen elektronischer Dokumente in ihrem eigenen Taskprofil aus, um den Stapel der zu verarbeitenden Eingabedokumente zu erstellen. Verwenden Sie die Konvertierungsaktionen für elektronische Dokumente in ihrem eigenen Taskprofil.

Sie können in einem einzigen Regelsatz alle erforderlichen Aktionen ausführen, um Ihre elektronischen Dokumente vor der Erkennung in TIFF-Dateien zu konvertieren. Erstellen Sie eine Funktion für jeden Typ elektronischer Dokumente, der voraussichtlich mit den Konvertierungsaktionen für elektronische Dokumente konvertiert werden wird. Erstellen Sie beispielsweise eine Funktion für die Bearbeitung von ZIP-Dateien, eine andere für die Bearbeitung von Word-Dateien usw., also für so viele verschiedene Typen wie nötig. Wenn die Standardwerte nicht ausreichen, konfigurieren Sie mit den Aktionen ein eigenes Ausgabeformat und verwenden Sie dann die Aktion zum Konvertieren des Dokuments in eine TIFF-Datei für jede Seite innerhalb des Dokuments. Wenn die Seite nicht den erwarteten Typ hat, gibt die Aktion 'False' zurück und macht dann für einen erneuten Konvertierungsversuch mit dem nächsten Typ weiter. Dieser Vorgang wird so lange wiederholt, bis alle gewünschten Typen konvertiert wurden. Nicht erwartete Typen werden bei diesem Prozess ignoriert. Falls für Ihre spezifische Anwendung erforderlich, können Sie für solche Typen zusätzliche Regeln erstellen.

Beispielregelsatz

Im Folgenden werden ein Beispielregelsatz und Funktionen gezeigt, die für die Verarbeitung von PDF-, Word- und Excel-Dokumenten mithilfe der Convert-Aktionen konfiguriert sind. Sie können weitere Funktionen für die Verarbeitung anderer Dateiformate, die von Convert unterstützt werden, hinzufügen, z. B. zum Teilen von TIFF-Dateien, ZIP-Dateien usw.

Bei der Ausführung werden alle Funktionen durchlaufen, bis eine Funktion erfolgreich abgeschlossen wird. Zuerst wird der Seitenstatus überprüft und dann versucht, die Seite zu konvertieren. Wurde die Seite erfolgreich konvertiert, wird der Seitenstatus auf 75 gesetzt, d. h., sie wird als gelöscht markiert. Die Funktion wird abgeschlossen und es erfolgt keine weitere Verarbeitung für den Regelsatz. Wenn das Dokument nicht konvertiert werden kann, weil der Typ nicht übereinstimmt, wird die Steuerung an die nächste Funktion übergeben und erneut versucht, die Seite zu konvertieren.

Ruleset Convert Files
- Function Process PDF
- - ChkDCOStatus("49")
- - PDFDocumentToImage()
- - SetDCOStatus("75")
- Function Process Word
- - ChkDCOStatus("49")
- - WordDocumentToImage()
- - SetDCOStatus("75")
- Function Process Excel
- - ChkDCOStatus("49")
- - ExcelWorkbookToImage()
- - SetDCOStatus("75")

Indem einer Seite der Status "gelöscht" zugewiesen wird, kann sie bei der nachfolgenden Verarbeitung übersprungen werden. Wenn Sie beispielsweise mithilfe eines virtuellen Scans einen Stapel mit einem PDF-Dokument erstellen und das PDF-Dokument dann mithilfe der Convert-Aktionen in eine Folge von Bilddateien konvertieren, müssen Sie normalerweise keine weitere Verarbeitung für die PDF-Datei durchführen. Eine Anwendung kann die Verarbeitung dieser Seiten nach Bedarf überspringen, indem zunächst ChkDCOStatus ("49") aufgerufen wird und die folgenden Aktionen in der Funktion nur auf Seiten ausgeführt werden, die diesen Status haben.

Normalerweise werden die nachfolgende Verarbeitung und Erkennung für die TIFF-Dateien ausgeführt, die während der Laufzeit erstellt wurden, beispielsweise für die aus der DOC-Datei erstellte TIFF-Datei. Die Ausführung erfolgt also nicht für die übergeordnete DOC-Datei. Wird eine Seite als gelöscht markiert, bedeutet dies jedoch nicht, dass die Seitenreferenz aus dem DCO entfernt und die Datei aus dem Stapelverzeichnis gelöscht wird. Da die ursprüngliche Datei noch wie vor existiert, ist es zum Exportzeitpunkt möglich, das Originaldokument in den Export in ein externes Repository einzuschließen.

Bei Konvertierung erstellte Variablen

Die Konvertierungsaktionen speichern Daten in Variablen, die nützlich sein können. Folgende Variablen werden erstellt: "IMAGEFILE": Der Name der TIFF-Datei, die der konvertierten Seite zugeordnet ist. Der Wert sieht normalerweise etwa wie folgt aus: "01010000.tif". Dies ist eine Variable auf Seitenebene.

"ParentImage": Der Name des Dokuments, das zum Erstellen der Seite verwendet wurde. Wenn die TIFF-Datei durch die Konvertierung einer Word-Datei erstellt wurde, sieht der Wert normalerweise etwa wie folgt aus: "02000000.doc". Dies ist eine Variable auf Seitenebene. Wenn die Seite mehrere übergeordnete Elemente aufweist, also beispielsweise aus einer ZIP-Datei extrahiert wurde, die sich in einer ZIP-Datei befand, werden die übergeordneten Elemente durch einen Doppelpunkt getrennt. Beispiel: TM000001.zip:01020000.zip.