CIB merge technischer Leitfaden

4. Datenversorgung

4.1. CSV

Allgemein
Hinweise zur Verwendung von Trenn- und Sonderzeichen in der Daten-CSV
Hinweise zu UTF-8 kodierten Daten-CSVs
Einzel-CSV-Datei
Multi-CSV-Datei

Allgemein

Bei den CSV Dateien handelt es sich um eine oder mehrere Text-Dateien, die die Namen der Eingabefelder und die zugehörigen Werte enthalten. Die Abkürzung CSV steht für  "Comma Separated Values".

Die erste Zeile der Steuerdatei beinhaltet den sog. Steuersatz, der aus durch ";" getrennten Feldnamen besteht. Der Steuersatz kann beliebig viele, nur durch den freien Arbeitsspeicher begrenzte Feldnamen enthalten.

Jede weitere Zeile beinhaltet genau einen Datensatz. Ein Datensatz enthält, ebenfalls durch ";" getrennt, in der Reihenfolge der Feldnamen die jeweils einzufügenden Textbausteine bzw. Daten. Die Anzahl der Einträge im Datensatz muss mit der Anzahl der Feldnamen im Steuersatz übereinstimmen.

CIB merge kann eine einzelne CSV-Datei oder Multi-CSV-Dateien verarbeiten.

Verwendung mit CIB merge:

Der Parameter -d<Datensatzquelle> setzt die CSV-Datei für CIB merge, siehe Kapitel Parameter –d.


Hinweise zur Verwendung von Trenn- und Sonderzeichen in der Daten-CSV

Enthält eine einzufügende Textpassage ein Semikolon, ein Tabulatorzeichen oder ein Anführungszeichen, so muss die gesamte Textpassage in Anführungszeichen gesetzt werden. Anführungszeichen in einer Textpassage müssen dann verdoppelt werden. Um beispielsweise den Firmennamen Wäscherei "Weißer Riese" in einem Rohtext einzufügen, muss der Eintrag in der Steuerdatei folgendes Aussehen haben: ;"Wäscherei ""Weißer Riese""";.

CIB merge kann mit dem Parameter -T auch ein anderes Trennzeichen als ";" auf die CSV-Dateien anwenden, siehe Kapitel 6.14 Parameter –T.

Der Steuersatz kann auch in einer getrennten Steuersatzdatei bereitgestellt werden, die CIB merge mit dem Parameter -h gesetzt wird, siehe Kapitel 6.32 Parameter –h.


Hinweise zu UTF-8 kodierten Daten-CSVs

Damit UTF-8 kodierte Datendateien mit Hilfe des CIB merge korrekt eingemischt werden, sind folgende Schritte notwendig:

1. Die CIB merge par-Datei muss um den folgenden Parameter erweitert werden:
-putf-8
Dieser Parameter sagt aus, dass die Datendateien im UTF-8-Format kodiert sind.

2. Entfernen der "byte order mark" (BOM) aus den Datendateien.
Da für die Verarbeitung der UTF-8 kodierten Datendateien durch CIB merge der unter 1.) beschriebene Parameter verwendet wird, werden alle in der Datendatei enthaltenen Zeichen nach UTF-8-Zeichensatz interpretiert. Dies gilt auch für eine BOM. Damit kommt es zu Fehlermeldungen bei der Verarbeitung. Aus diesem Grund müssen alle BOMs aus den verwendeten Datendateien entfernt werden.


Einzel-CSV-Datei

Einzel CSV

Beschreibung

Bei der Einzel-CSV-Datei werden den Eingabefeldern direkt ihre Werte zugeordnet. Der Anwender benutzt im Dokumentbaustein direkt den Feldnamen um auf einen Wert zuzugreifen.

Syntax

Beispiel

Kopfzeile

1.Datenzeile

...

n.Datenzeile

Feldname1;Feldname2

Wert11; Wert12

...

WertN1; WertN2


Multi-CSV-Datei

Multi CSV

Beschreibung:

Mit Hilfe einer Multi-CSV-Datei können mehrere CSV-Dateien verwaltet werden. Sie enthält die Namen aller CSV-Dateien, die im aktuellen Mischlauf geladen werden sollen. Über die Felder in der Kopfzeile der Multi CSV Datei, erhält jede CSV-Datei einen Aliasnamen zugeordnet, über den dann im Dokument auf diese CSV Dateien zugegriffen werden kann.

Verwendung mit CIB merge

Für eine Multi CSV-Datenversorgung muss neben dem Parameter –d mit der Multi CSV Datei auch der Parameter -c gesetzt werden, siehe Kapitel 6.50 Parameter -c.

 

Syntax

Beispiel

Kopfzeile mit Aliasnamen

Alle beteiligten CSV-Dateinamen

Tabelle1; Tabelle2

Tab1.csv; Tab2.csv


                                                                                      

 

Syntax

 

 

Syntax

 

 

 

Tab1.csv

 

 

Tab2.csv

 

 

CSVName1; CSVName2

Wert11; Wert12

WertN1; WertN2

 

 

CSVName1; CSVName2

Wert11; Wert12

WertN1; WertN2

 

Vorteile gegenüber XML:

  • Einfaches Format
  • Einfache 1-n Beziehung
  • Kleinere Dateigröße