CIB merge technischer Leitfaden
4. Datenversorgung
4.1. CSV
Hinweise zur Verwendung von Trenn- und Sonderzeichen in der Daten-CSV
Hinweise zu UTF-8 kodierten Daten-CSVs
Einzel-CSV-Datei
Multi-CSV-Datei
Allgemein
Bei den CSV Dateien handelt es sich um eine oder mehrere Text-Dateien, die die Namen der Eingabefelder und die zugehörigen Werte enthalten. Die Abkürzung CSV steht für "Comma Separated Values".
Die erste Zeile der Steuerdatei beinhaltet den sog. Steuersatz, der aus durch ";" getrennten Feldnamen besteht. Der Steuersatz kann beliebig viele, nur durch den freien Arbeitsspeicher begrenzte Feldnamen enthalten.
Jede weitere Zeile beinhaltet genau einen Datensatz. Ein Datensatz enthält, ebenfalls durch ";" getrennt, in der Reihenfolge der Feldnamen die jeweils einzufügenden Textbausteine bzw. Daten. Die Anzahl der Einträge im Datensatz muss mit der Anzahl der Feldnamen im Steuersatz übereinstimmen.
CIB merge kann eine einzelne CSV-Datei oder Multi-CSV-Dateien verarbeiten.
Verwendung mit CIB merge:
Der Parameter -d<Datensatzquelle> setzt die CSV-Datei für CIB merge, siehe Kapitel Parameter –d.
Hinweise zur Verwendung von Trenn- und Sonderzeichen in der Daten-CSV
Enthält eine einzufügende Textpassage ein Semikolon, ein Tabulatorzeichen oder ein Anführungszeichen, so muss die gesamte Textpassage in Anführungszeichen gesetzt werden. Anführungszeichen in einer Textpassage müssen dann verdoppelt werden. Um beispielsweise den Firmennamen Wäscherei "Weißer Riese" in einem Rohtext einzufügen, muss der Eintrag in der Steuerdatei folgendes Aussehen haben: ;"Wäscherei ""Weißer Riese""";.
CIB merge kann mit dem Parameter -T auch ein anderes Trennzeichen als ";" auf die CSV-Dateien anwenden, siehe Kapitel 6.14 Parameter –T.
Der Steuersatz kann auch in einer getrennten Steuersatzdatei bereitgestellt werden, die CIB merge mit dem Parameter -h gesetzt wird, siehe Kapitel 6.32 Parameter –h.Hinweise zu UTF-8 kodierten Daten-CSVs
Damit UTF-8 kodierte Datendateien mit Hilfe des CIB merge korrekt eingemischt werden, sind folgende Schritte notwendig:
1. Die
CIB merge par-Datei muss um den folgenden Parameter erweitert werden:
-putf-8
Dieser Parameter sagt aus, dass die Datendateien im UTF-8-Format kodiert sind.
2. Entfernen
der "byte order mark" (BOM) aus den Datendateien.
Da für die Verarbeitung der UTF-8 kodierten Datendateien durch CIB merge der
unter 1.) beschriebene Parameter verwendet wird, werden alle in der Datendatei
enthaltenen Zeichen nach UTF-8-Zeichensatz interpretiert. Dies gilt auch für eine
BOM. Damit kommt es zu Fehlermeldungen bei der Verarbeitung. Aus diesem Grund
müssen alle BOMs aus den verwendeten Datendateien entfernt werden.
Einzel-CSV-Datei
Beschreibung
Bei der Einzel-CSV-Datei werden den Eingabefeldern direkt ihre Werte zugeordnet. Der Anwender benutzt im Dokumentbaustein direkt den Feldnamen um auf einen Wert zuzugreifen.
Syntax |
Beispiel |
Kopfzeile 1.Datenzeile ... n.Datenzeile |
Feldname1;Feldname2 Wert11; Wert12 ... WertN1; WertN2 |
Multi-CSV-Datei
Beschreibung:
Mit Hilfe einer Multi-CSV-Datei können mehrere CSV-Dateien verwaltet werden. Sie enthält die Namen aller CSV-Dateien, die im aktuellen Mischlauf geladen werden sollen. Über die Felder in der Kopfzeile der Multi CSV Datei, erhält jede CSV-Datei einen Aliasnamen zugeordnet, über den dann im Dokument auf diese CSV Dateien zugegriffen werden kann.
Verwendung mit CIB merge
Für eine Multi CSV-Datenversorgung muss neben dem Parameter –d mit der Multi CSV Datei auch der Parameter -c gesetzt werden, siehe Kapitel 6.50 Parameter -c.
Syntax |
Beispiel |
Kopfzeile mit Aliasnamen Alle beteiligten CSV-Dateinamen |
Tabelle1; Tabelle2 Tab1.csv; Tab2.csv |
|
Syntax |
|
|
Syntax |
|
|
|
Tab1.csv |
|
|
Tab2.csv |
|
|
CSVName1; CSVName2 Wert11; Wert12 WertN1; WertN2 |
|
|
CSVName1; CSVName2 Wert11; Wert12 WertN1; WertN2 |
Vorteile gegenüber XML:
- Einfaches Format
- Einfache 1-n Beziehung
- Kleinere Dateigröße