ZFDetect – ZUGFeRD PDF erkennen, filtern und in einen Ziel-Ordner verschieben

ZUGFeRD Dateien enthalten eine in die PDF Datei als Anhang eingebettete XML Datei mit genormten Informationen über den Rechnungsbeleg. Rechnungsinformationen können damit aus dem XML z.B. direkt in die Buchhaltung übernommen werden.

Üblicherweise werden elektronische Rechnungen per EMail verschickt. Dabei werden sowohl normale PDF Rechnungen ohne, als auch welche mit dieser ZUGFeRD XML empfangen.

ZFDetect dient dazu mittels Ordnerüberwachung die ZUGFeRD PDF Dateien aus beliebigen anderen (PDF)-Dateien herauszufiltern und in einen festgelegten Ziel-Ordner zu verschieben.

ZFDetect Funktionen:

  • Ausführbare Anwendung sowie MS-Windows Dienst mit Ordnerüberwachung.
  • Ein konfigurierbarer Eingangordner wird überwacht, neue PDF Dateien werden erkannt und sofort verarbeitet.
  • Unterordnerstrukturen können verarbeitet werden und sind im Zielordner abbildbar.
  • ZUGFeRD PDF Dateien werden identifiziert und in einen konfigurierbaren Ordner verschoben.
  • Alle anderen PDF Dateien werden in einen anderen Ordner verschoben.
  • Defekte bzw. mit Passwortschutz versehene PDF werden erkannt und landen im Fehler-Ordner.

Download – ZFDetect – ZUGFeRD PDF erkennen und filtern >>>

GenOCR – Anwendung um OCR Tests schnell und einfach durchführen zu können

In unseren Anwendungen ist die OCR Verarbeitung in einer eigenen Komponente gekapselt. Damit können wir neue OCR Engines oder zusätzliche Funktionen schnell und einheitlich zur Verfügung stellen.

Kürzlich haben wir mit OmniPage eine neue sehr leistungsfähige und besonders schnelle OCR Engine hinzugefügt.

Um  die Ergebnisse sowie die Verarbeitungsgeschwindigkeit einfach und schnell testen zu können stellen wir mit GenOCR eine Beispiel- und Test-Anwendung zur Verfügung um einzelne PDF-Scans und Image-Dateien per Drag&Drop in durchsuchbare PDF´s zu konvertieren.

Auf MS-Windows Client-Betriebssystemen z.B.: MS-Windows 7/10 wird die OmniPage OCR Engine mit installiert und kann sofort 30 Tage getestet werden. Auf Windows Server Betriebssystemen wird aus lizenzrechtlichen Gründen die Installation der OmniPage OCR Engine übersprungen. GenOCR kann auf MS-Windows Servern nur auf Basis der iOCR Engine getestet werden.

Download – GenOCR – OCR Testanwendung für OmniPage und iOCR (ca. 650MB) >>>

ZFMerge – ZUGFeRD PDF und weitere PDF´s zu einer ZUGFeRD Gesamtdatei zusammenfügen

ZUGFeRD ist ein anerkannter und immer öfter verwendeter Standard für elektronische Rechnungen.

Wird z.B. aus einem ERP System eine ZUGFeRD konforme Rechnung mit eingebettetem XML erzeugt so kann es je nach Kunde erforderlich sein weitere Belege (z.B: eine Leistungsaufstellung) die nicht über das ERP System erstellt wurden, mit anzuhängen. Es muss also ein neues ZUGFeRD konformes Gesamt-PDF erzeugt (zusammengefügt) werden das die XML der Ursprungs-Rechnung und alle anderen Dokumente enthält.

ZFMerge – Funktionen:

  • Erzeugt ZUGFeRD konforme PDF/A-3b Gesamtdateien.
  • Ausgangsdatei enthält bereits eine ZUGFeRD XML. Der ZUGFeRD Level und Profile werden übernommen.
  • Weitere PDF Dateien können ausgewählt und hinzugefügt werden, die Reihenfolge ist änderbar.
  • Pfad / Name der neuen ZUGFeRD Gesamtdatei wird ausgewählt.
  • ZUGFeRD bzw. PDF/A-3b konforme PDF wird erzeugt auch wenn die Ausgangsdateien nicht dem PDF/A Standard entsprechen.

Download – ZFMerge Testanwendung >>>

Neue OmniPage OCR Engine für AutoOCR & AutoOCRLight ab 2.0.7

Vorteile der OmniPage OCR:

  • Erkennungsgenauigkeit auf höchstem Niveau auch bei schwierigen Dokumenten
  • Schnellste OCR Verarbeitung – wesentlich schneller und performanter als alles was wir bisher getestet und implementiert haben. 1-2 Sekunden um ein durchsuchbares PDF pro Seite zu erzeugen sind möglich.
  • Kostengünstig – 25.000 Seiten Lizenz mit geringeren Lizenzkosten als die bisherige 10.000 Seiten Abbyy Lizenz
  • Einfacheres Freischalten der (Demo)Lizenz – Die OmniPage OCR Engine kann über unseren Lizenzserver inkl. 30 Tage Demoversion zusammen mit der Basisanwendung aktiviert werden.

Zu beachten ist dass die OmniPage OCR Engine aus lizenzrechtlichen Gründen nur auf Client Betriebssystemen – Windows 7 / 10  nicht jedoch auf Microsoft Server 2008, 2012, 2016 oder 2019 installiert werden kann. Das Setup lässt sich nur unter Windows 7 / 10  ausführen. Hinsichtlich Performance und Stabilität ist das kein Nachteil. OCR Prozesse sind rechenintensiv und sollten für einen optimalen Durchsatz auf einer eigenen Hardware (z.b. Intel NUC) mit möglichst vielen CPU Cores und SSD Disk ausgeführt werden.

Die OmniPage OCR Engine kann für AutoOCR bzw. AutoOCRLight ab der Version 2.0.7 als Option zusätzlich zur iOCR (Tesseract OCR) lizenziert werden und ist im AutoOCR Setup bereits enthalten. Für AutoOCRLight kann die OmniPage OCR separat heruntergeladen und installiert werden.

Download – OmniPage OCR Engine als Option für AutoOCRLight (ca. 235MB) >>>

Download – AutoOCRLight – Low Cost OCR Server (ca. 410MB) >>>

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>

eDocPrintPro PDF/A – Version 3.29.0 – unterstützt den E-Rechnungs Standard ZUGFeRD 2.0 / EN 16931 / Factur-X 1.0

Die eDocPrintPro Version 3.29.0 unterstützt jetzt auch die aktuellen E-Rechnungs Standards – ZUGFeRD 2.0 / EN 16931 und Factur-X 1.0. Diese basieren auf PDF/A-3 wobei die Rechnungsdatensätze als XML Datei in das PDF als Dateianhang eingebettet werden.

Funktionen:

  • Auswahl des E-Rechnungs Standards – ZUGFeRD 1.0 / 2.0 / EN 16931 / Factur-X 1.0
  • Auswahl eines durch den Standard unterstützen Profils (MINIMUM, BASIC WL, BASIC, EN 16931, EXTENDED)
  • Voreingestelltes (Pfad, Name) XML verwenden / XML per Dateidialog auswählen
  • XML nach dem Einbetten in das PDF automatisch löschen (Ja / Nein)

Voraussetzung:  Eine nach dem ausgewählten Standard und Profil valide XML Datei muss vor dem Druckvorgang bereits fertig vorhanden sein. Die XML Datei wird nicht aus den Druckdaten gewonnen.

Download – eDocPrintPro PDF/A & ZUGFeRD

GhostScript 9.27 Setup

PDF2PDFA und der E-Rechnungs Standard ZUGFeRD 2.0 / EN 16931 / Factur-X 1.0

ZUGFeRD 2.0 / EN 16931 / Factur-X:

Wichtige Voraussetzungen für eine Akzeptanz elektronischer Rechnungen sind vor allem die Verwendung eines standardisierten Datenformats und die rechtlichen Rahmenbedingungen, an denen sich sowohl Versender als auch Empfänger orientieren können.

Die EU hat im Juni 2017 mit der europäische Norm EN 16931 ein Standardformat für elektronische Rechnungen geschaffen. Das Ziel dieser EU-Norm: Der elektronische Rechnungsaustausch soll europaweit vereinheitlicht und rechtlich sichergestellt werden.

Der bisherige ZUGFeRD-Standard 1.0 musste auf die neue Norm angepasst werden. ZUGFeRD 2.0 (veröffentlicht am 11. März 2019), entstand im Rahmen einer deutsch-französischen Zusammenarbeit, in enger Abstimmung mit dem französischen Standard Factur-X 1.0 und ist mit diesem technisch identisch.  Mittels ZUGFeRD 2.0 lassen sich E-Rechnungen erstellen die den EU-Standard EN 16931 und die EU-Richtlinie 2014/55/EU erfüllen. Details rund um die elektronische Rechnung finden Sie auch auf den Seiten der EU-Kommission. ZUGFeRD 2.0 setzt zudem auf dem globalen Standard UN/CEFACT XML in der Ausprägung Cross Industry Invoice auf. Damit könnte sich mit ZUGFeRD 2.0 sogar eine weltweite Perspektive ergeben.

Die neue ZUGFeRD-Version 2.0 kombiniert genauso wie die Version 1.0 eine PDF/A-3-Datei der Rechnung (visuelle Darstellung der Rechnungsdaten als digitales Format anstelle der klassischen Papierrechnung) mit einer Rechnungsdatei im XML-Format, die in das PDF/A3-Dokument eingebettet ist.

ZUGFeRD 2.0 Profile:

Bei ZUGFeRD 2.0 sowie Factur-X sind mehrere Profile vorgesehen. Das Profil «EN 16931» löst das ZUGFeRD-1.0-Profil «Comfort» ab und entspricht vollständig der EU-Norm, die jedoch nur die Kernelemente einer Rechnung festlegt. Mit dem Profil «Extended» können in einer elektronischen Rechnung zusätzliche Angaben erfasst werden, etwa nach Branche oder nach gesetzlichen Vorgaben. Darüber hinaus wurden mit «Basic» und «Basic WL» zwei weitere Profile für kleinere Lieferanten festgelegt.

ZUGFeRD eignet sich für Organisationen aller Größen und erhält dank der EN-16931-Konformität eine erweiterte, internationale Bedeutung. Das Profil «EN 16931» wird von allen europäischen Verwaltungen anerkannt. Seit November 2018 sind E-Rechnungen im Business to Government (B2G) -Verkehr in der EU vorgeschrieben.

Mit der Version 1.2.0 der PDF2PDFA Konverter Komponente können aus einer PDF und der entsprechenden XML jetzt auch ZUGFeRD 2.0 und Factur-X Dokumente erzeugt werden.

Download – Demo & Testanwendung – PDF2PDFA Konverter >>>

PDFmdx – Positionsdaten über Gruppen- / Untergruppenfelder auslesen

PDFmdx kann neben Dokumentenfeldern auch Positionsdaten auslesen. Positionsdaten sind Listen oder Tabellen mit Zeilen und Spalten. Diese finden sich typischerweise auf Rechnungen um mehrere Positionen im Beleg anzuführen. Wir verwenden dafür den Begriff einer “gleitenden Gruppe/Untergruppe”. Dabei werden ein oder mehrere Spalten (=Felder) über eine oder mehrere Zeilen auf einer oder mehreren Seiten in einem vertikal festgelegten Bereich gesucht und ausgelesen.

Ab der PDFmdx Version 3.5.0 gibt es eine 2-stufige Struktur wo neben der Gruppen auch eine Untergruppen Ebene möglich ist. Es können also zu einem Gruppen-Datensatz ein oder mehrere Untergruppen-Datensätze erkannt und ausgelesen werden. Belege mit 2-stufige Positionsdaten gibt es z.B. bei Textilien oder bei Bekleidung wo es zu einem Artikel (Nummer, Beschreibung) auch eine “Unterebene” mit Größen bzw. Farbangaben geben kann. Der Artikel selbst wird nur einfach angeführt und in der Ebene darunter finden sich dann  die Mengen / Preise zu einzelnen Ausprägungen.

Zweistufiges Auslesen von Positionsdaten:

  • “Dokumenten/Gruppen/ Untergruppen” Felder definieren die Erkennungsebene.

  • Ein über 2 rote horizontale Begrenzungslinien festgelegter Bereich wird auf allen Seiten des Dokuments nach den Gruppen- (rote Felder) sowie Untergruppen-Datensätzen (grüne Felder) abgegescannt.

  • Über die festgelegten Bedingungen werden die Gruppen- (G) sowie die zugehörigen Untergruppen- (U) Datensätze identifiziert und ausgelesen.

  • Zusammen mit den Datensätzen der untersten Ebene stehen auch die Informationen der Gruppen- und der Dokumentenfelder zur Verfügung.

Für Tests und als Ausgangspunkt für eigene Versuche haben wir zwei Beispiel-Vorlagen mit PDF-Testdateien erstellt. Die *.pmdx Vorlagen müssen nur per Drag&Drop in den PDFmdx Editor importiert und der Ausgabepfad gegebenenfalls angepasst werde. Für die Verarbeitung ist es dann noch erforderlich im PDFmdx Prozessor ein Job mit Eingangs- und Error-Folder anzulegen und die beiden Test-Vorlagen für den Job auszuwählen.

Download – PDFmdx – Vorlagen und Beispiele für zweistufiges Auslesen von Positionsdaten >>>
Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.5.3 verfügbar

Neuerungen PDFmdx Version 3.5.3:

  • Feld / Bereichs OCR / Bereich invertieren / OCR immer ausführen:

Normalerweise werden für die PDFmdx Verarbeitung PDF Dateien als Input verwendet die bereits Text enthalten – entweder “normale” PDF oder gescannte PDF die über einen vorangegangenen OCR Prozess (z.b. über AutoOCR oder FileConverterPro) eine zusätzliche Textebenen erhalten haben.

PDFmdx verfügt auch über eine integrierte OCR Funktion um den Text in den Bereichen der positionierten Feldern aus der Bildinformation ermitteln zu können.

Bei den allgemeinen PDFmdx OCR Einstellungen gibt es die Möglichkeit festzulegen wie die Texte aus dem PDF gewonnen werden sollen – “Original”, “OCR” oder “SmartOCR”. Bei “Original” wird der Text immer aus dem PDF genommen, bei OCR – wird der Text immer über einen PDFmdx OCR Vorgang gewonnen, auch falls bereits ein Text im PDF vorhanden ist. Bei der “SmartOCR” Einstellung wird die PDFmdx OCR Funktion nur ausgeführt falls im PDF noch kein Text vorhanden ist, ansonsten wird der im PDF vorhandene Text genommen. Diese Einstellungen gelten generell für die ganze Vorlage und alle damit verbundenen Layouts.

In dem Zusammenhang gibt es jetzt 2 neue Funktionen die es ermöglichen weißen Text auf schwarzem Hintergrund zu erkennen.

Einzelne Bereiche mit Text in weißer Schrift auf schwarzen Hintergrund können über einen automatischen OCR Vorgang nicht erkannt werden, da vor dem OCR Vorgang der Bereich invertiert werden müsste um erkannt werden zu können. Das kann nur interaktiv erfolgen in dem der zu Bereiche manuell ausgewählt wird.

Im PDFmdx Editor gib es jetzt die Möglichkeit bei der Feldkonfiguration die Option “Bereich invertieren” zu aktivieren. Dabei wird für die OCR Verarbeitung der Feldbereich invertiert. Dadurch entsteht schwarze Schrift auf weißem Hintergrund welche durch die OCR erkannt werden kann.

In dem Zusammenhang gibt es eine weitere neue Feldfunktion “OCR immer ausführen” – Damit kann die generelle Einstellung „SmartOCR“ übersteuert werden. Die OCR Erkennung wird dann für dieses Feld immer ausgeführt, auch wenn bereits ein darunterliegender Text vorhanden ist.

  

  • PDFmdx Editor – Bedingung suchen, Layout aufrufen: Es gib jetzt eine Suchfunktion um in den Bedingungen nach einem (Teil)String zu Vorwärts und Rückwärts zu suchen. Damit kann eine Zeile in den Bedingungen direkt angesprungen werden. Aus der Bedingungszeile kann dann auch das verknüpfte Layout direkt aufgerufen werden. Diese Funktion erleichtert die Arbeit mit einer großen Zahl an Bedingungen.

  • Die Web-Service Funktionen wurden überarbeitet, im Web-Service Beispiel können die Metadaten jetzt auch als XML heruntergeladen werden.
  • Bei der Metadaten XML wurden die neu hinzugekommenen Variablen JobID, JobName, JobDescription und ProzessID ergänzt.

Download – PDFmdx Template Editor & Processor >>>

PDFPrint-FM Version 1.3.0 – Start der Druckverarbeitung über *.rd Datei triggern

Mit der PDFPrint-FM Version 1.3.0 gibt es jetzt auch die Möglichkeit den Start der Druckverarbeitung nicht nur über die zu druckenden PDF Dateien selbst, sondern über eine “*.rd” Datei zu triggern.

Wird eine Datei mit der Endung *.rd in einen überwachten Ordner kopiert bzw. ist eine solche zu einem bestimmten Zeitpunkt vorhanden so werden alle zu diesem Event im Ordner vorhandenen PDF Dateien gedruckt. Damit ist es möglich den Zeitpunkt zu dem der Ausdruck der PDF´s starten soll genau festzulegen und extern zu triggern.

Download – PDFPrint-FM –  Ordnerüberwachung – Druckt PDF´s >>>

FileConverterPro (FCpro) – DropConvert MultiOS Client für MS-Windows, MacOS, Linux verfügbar

Der FileConverterPro (FCpro) ist eine Web-Service Anwendung um die verschiedensten Dokumentenformate nach PDF, PDF/A-1, PDF/A-3 bzw. ZUGFeRD zu konvertieren. Es können auch ganze Dokumentenstapel, hierarchische Dokumentenstrukturen, EMail (MSG, EML) und ZIP Container in eine Gesamt-PDF konvertiert werden.

Mit dem DropConvert MultiOS Client gibt es jetzt neben MS-Windows auch eine kostenlose FCpro Client Anwendung für Linux und MacOS.

Damit können einfach und über eine graphische Benutzeroberfläche per Drag&Drop Dokumente und Scans mit oder ohne OCR in durchsuchbare PDF und PDF/A Dokumente konvertieren.

Der DropConvert MultiOS Client kommuniziert per REST Web-Service mit einem FCpro Server und wurde plattformunabhängig auf Basis des ELECTRON Frameworks komplett in JavaScript entwickelt.

Funktionen FCpro DropConvert MultiOS:

  • Konvertiert Office, CAD und Image Dateien nach PDF, PDF/A und ZUGFeRD.
  • Konvertierung von Containerformaten (z.b. ZIP, MSG, EML) in ein Gesamt-PDF.
  • Erzeugt über OCR aus Scans auch durchsuchbare PDF.
  • Kommunikation mit dem FCpro Server per REST/https – Web-Service.
  • Ziel-Ordner voreinstellbar.
  • Einfügen von Dateien per Drag&Drop.
  • Auswahl eines am FCpro Server hinterlegten Konvertierprofils.
  • Automatischer bzw. manueller Start der Verarbeitung.

Userinterface – MS-Windows:

Userinterface – Ubuntu Linux:

Userinterface – macOS Mojave:

Download – FCpro DropConvert MultiOS Setup für MS-Windows >>>
Download – FCpro DropConvert MultiOS Setup für LINUX (deb) >>>
Download – FCpro DropConvert MultiOS Setup für LINUX (AppImage) >>>
Download – FCpro DropConvert MultiOS Setup für MacOS (dmg) >>>