AutoOCR-CS-CL – Kommandozeilen Anwendung für AutoOCR über Web-Service

AutoOCR-CS-CL ist eine für den AutoOCR Server kostenlos verfügbare Kommandozeilen Zusatzanwendung. AutoOCR-CS-CL ermöglicht die Konvertierung von Image-PDF, TIF/TIFF, JPG/JPEG, PNG, BMP, GIF in durchsuchbare PDF bzw. PDF/A Dateien. Die Kommunikation mit dem AutoOCR Server erfolgt mittels http/https über die AutoOCR SOAP Web-Service Schnittstelle. Der AutoOCR Server kann lokal, im gleichen Netzwerk oder über eine Internet Verbindung angesprochen werden.

Funktionen AutoOCR-CS-CL:

  • Kostenlose Kommandozeilen Anwendung für AutoOCR um aus Image-PDF, TIF/TIFF, JPG/JPEG, PNG, BMP, GIF über OCR durchsuchbare PDF(/A)  zu erzeugen.
  • Verarbeitung erfolgt per SOAP Web-Service auf einem (Remote) AutoOCR Server über http/https.
  • Verarbeitet einzelne Dateien, ganze Ordner/Ordnerstrukturen sowie Listen von Dateien / Ordnern aus TXT Dateien.
  • Auswahl der Verarbeitungs-Parameter über Angabe eines am AutoOCR Server hinterlegten OCR Profils.
  • Paralleler mehrfach Up/Download zum AutoOCR Server für optimalen Durchsatz konfigurierbar.

   

Download – AutoOCR-CS-CL –  Kommandozeilen Anwendung für AutoOCR über Web-Service >>>
Download – Readme / Help – AutoOCR-CS-CL  >>>

DropPrint-CS – PDF´s per DropZone / Ordner Überwachung – über PDFPrint Service CS drucken

Mit DropPrint-CS steht neben PDFPrint-CS-CL und PDFPrint-CS-FM ein weiterer kostenloser Client für die PDFPrint Service CS Anwendung zur Verfügung. DropPrint-CS verfügt über gleichen Funktionen wie DropPrint, jedoch erfolgt der Ausdruck Remote über Web-Service auf einem Rechner auf dem die PDFPrint Service CS Anwendung läuft.

   

Download – DropPrint-CS – PDF Druck per Drag&Drop über PDFPrint-CS >>>

eDocPrintPro free / PDF/A & ZUGFeRD Version 4.0.0 verfügbar

Bisher wurde für jeden eDocPrintPro Druckertreiber beim Start des Rechners eine Monitor Anwendung (xxxMonitor.exe) automatisch gestartet. Eingetragen wurde der Start der Monitor Anwendung unter HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run (64bit OS).

Ab der Version 4.0.0 wird die eDocPrintProMonitor.exe nicht mehr automatisch gestartet und ist auch nicht mehr unter “Run” eingetragen. Der Druckertreiber ruft die Monitor Anwendung nur auf wenn diese benötigt wird und wird somit nicht mehr permanent im Speicher gehalten.

Download – eDocPrintPro free Version

Download – eDocPrintPro PDF/A & ZUGFeRD

GhostScript 9.27 Setup

ZFDetect – ZUGFeRD PDF erkennen, filtern und in einen Ziel-Ordner verschieben

ZUGFeRD Dateien enthalten eine in die PDF Datei als Anhang eingebettete XML Datei mit genormten Informationen über den Rechnungsbeleg. Rechnungsinformationen können damit aus dem XML z.B. direkt in die Buchhaltung übernommen werden.

Üblicherweise werden elektronische Rechnungen per EMail verschickt. Dabei werden sowohl normale PDF Rechnungen ohne, als auch welche mit dieser ZUGFeRD XML empfangen.

ZFDetect dient dazu mittels Ordnerüberwachung die ZUGFeRD PDF Dateien aus beliebigen anderen (PDF)-Dateien herauszufiltern und in einen festgelegten Ziel-Ordner zu verschieben.

ZFDetect Funktionen:

  • Ausführbare Anwendung sowie MS-Windows Dienst mit Ordnerüberwachung.
  • Ein konfigurierbarer Eingangordner wird überwacht, neue PDF Dateien werden erkannt und sofort verarbeitet.
  • Unterordnerstrukturen können verarbeitet werden und sind im Zielordner abbildbar.
  • ZUGFeRD PDF Dateien werden identifiziert und in einen konfigurierbaren Ordner verschoben.
  • Alle anderen PDF Dateien werden in einen anderen Ordner verschoben.
  • Defekte bzw. mit Passwortschutz versehene PDF werden erkannt und landen im Fehler-Ordner.

Download – ZFDetect – ZUGFeRD PDF erkennen und filtern >>>

GenOCR – Anwendung um OCR Tests schnell und einfach durchführen zu können

In unseren Anwendungen ist die OCR Verarbeitung in einer eigenen Komponente gekapselt. Damit können wir neue OCR Engines oder zusätzliche Funktionen schnell und einheitlich zur Verfügung stellen.

Kürzlich haben wir mit OmniPage eine neue sehr leistungsfähige und besonders schnelle OCR Engine hinzugefügt.

Um  die Ergebnisse sowie die Verarbeitungsgeschwindigkeit einfach und schnell testen zu können stellen wir mit GenOCR eine Beispiel- und Test-Anwendung zur Verfügung um einzelne PDF-Scans und Image-Dateien per Drag&Drop in durchsuchbare PDF´s zu konvertieren.

Auf MS-Windows Client-Betriebssystemen z.B.: MS-Windows 7/10 wird die OmniPage OCR Engine mit installiert und kann sofort 30 Tage getestet werden. Auf Windows Server Betriebssystemen wird aus lizenzrechtlichen Gründen die Installation der OmniPage OCR Engine übersprungen. GenOCR kann auf MS-Windows Servern nur auf Basis der iOCR Engine getestet werden.

Download – GenOCR – OCR Testanwendung für OmniPage und iOCR (ca. 650MB) >>>

ZFMerge – ZUGFeRD PDF und weitere PDF´s zu einer ZUGFeRD Gesamtdatei zusammenfügen

ZUGFeRD ist ein anerkannter und immer öfter verwendeter Standard für elektronische Rechnungen.

Wird z.B. aus einem ERP System eine ZUGFeRD konforme Rechnung mit eingebettetem XML erzeugt so kann es je nach Kunde erforderlich sein weitere Belege (z.B: eine Leistungsaufstellung) die nicht über das ERP System erstellt wurden, mit anzuhängen. Es muss also ein neues ZUGFeRD konformes Gesamt-PDF erzeugt (zusammengefügt) werden das die XML der Ursprungs-Rechnung und alle anderen Dokumente enthält.

ZFMerge – Funktionen:

  • Erzeugt ZUGFeRD konforme PDF/A-3b Gesamtdateien.
  • Ausgangsdatei enthält bereits eine ZUGFeRD XML. Der ZUGFeRD Level und Profile werden übernommen.
  • Weitere PDF Dateien können ausgewählt und hinzugefügt werden, die Reihenfolge ist änderbar.
  • Pfad / Name der neuen ZUGFeRD Gesamtdatei wird ausgewählt.
  • ZUGFeRD bzw. PDF/A-3b konforme PDF wird erzeugt auch wenn die Ausgangsdateien nicht dem PDF/A Standard entsprechen.

Download – ZFMerge Testanwendung >>>

Neue OmniPage OCR Engine für AutoOCR & AutoOCRLight ab 2.0.7

Vorteile der OmniPage OCR:

  • Erkennungsgenauigkeit auf höchstem Niveau auch bei schwierigen Dokumenten
  • Schnellste OCR Verarbeitung – wesentlich schneller und performanter als alles was wir bisher getestet und implementiert haben. 1-2 Sekunden um ein durchsuchbares PDF pro Seite zu erzeugen sind möglich.
  • Kostengünstig – 25.000 Seiten Lizenz mit geringeren Lizenzkosten als die bisherige 10.000 Seiten Abbyy Lizenz
  • Einfacheres Freischalten der (Demo)Lizenz – Die OmniPage OCR Engine kann über unseren Lizenzserver inkl. 30 Tage Demoversion zusammen mit der Basisanwendung aktiviert werden.

Zu beachten ist dass die OmniPage OCR Engine aus lizenzrechtlichen Gründen nur auf Client Betriebssystemen – Windows 7 / 10  nicht jedoch auf Microsoft Server 2008, 2012, 2016 oder 2019 installiert werden kann. Das Setup lässt sich nur unter Windows 7 / 10  ausführen. Hinsichtlich Performance und Stabilität ist das kein Nachteil. OCR Prozesse sind rechenintensiv und sollten für einen optimalen Durchsatz auf einer eigenen Hardware (z.b. Intel NUC) mit möglichst vielen CPU Cores und SSD Disk ausgeführt werden.

Die OmniPage OCR Engine kann für AutoOCR bzw. AutoOCRLight ab der Version 2.0.7 als Option zusätzlich zur iOCR (Tesseract OCR) lizenziert werden und ist im AutoOCR Setup bereits enthalten. Für AutoOCRLight kann die OmniPage OCR separat heruntergeladen und installiert werden.

Download – OmniPage OCR Engine als Option für AutoOCRLight (ca. 235MB) >>>

Download – AutoOCRLight – Low Cost OCR Server (ca. 410MB) >>>

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>

eDocPrintPro PDF/A – Version 3.29.0 – unterstützt den E-Rechnungs Standard ZUGFeRD 2.0 / EN 16931 / Factur-X 1.0

Die eDocPrintPro Version 3.29.0 unterstützt jetzt auch die aktuellen E-Rechnungs Standards – ZUGFeRD 2.0 / EN 16931 und Factur-X 1.0. Diese basieren auf PDF/A-3 wobei die Rechnungsdatensätze als XML Datei in das PDF als Dateianhang eingebettet werden.

Funktionen:

  • Auswahl des E-Rechnungs Standards – ZUGFeRD 1.0 / 2.0 / EN 16931 / Factur-X 1.0
  • Auswahl eines durch den Standard unterstützen Profils (MINIMUM, BASIC WL, BASIC, EN 16931, EXTENDED)
  • Voreingestelltes (Pfad, Name) XML verwenden / XML per Dateidialog auswählen
  • XML nach dem Einbetten in das PDF automatisch löschen (Ja / Nein)

Voraussetzung:  Eine nach dem ausgewählten Standard und Profil valide XML Datei muss vor dem Druckvorgang bereits fertig vorhanden sein. Die XML Datei wird nicht aus den Druckdaten gewonnen.

Download – eDocPrintPro PDF/A & ZUGFeRD

GhostScript 9.27 Setup

PDF2PDFA und der E-Rechnungs Standard ZUGFeRD 2.0 / EN 16931 / Factur-X 1.0

ZUGFeRD 2.0 / EN 16931 / Factur-X:

Wichtige Voraussetzungen für eine Akzeptanz elektronischer Rechnungen sind vor allem die Verwendung eines standardisierten Datenformats und die rechtlichen Rahmenbedingungen, an denen sich sowohl Versender als auch Empfänger orientieren können.

Die EU hat im Juni 2017 mit der europäische Norm EN 16931 ein Standardformat für elektronische Rechnungen geschaffen. Das Ziel dieser EU-Norm: Der elektronische Rechnungsaustausch soll europaweit vereinheitlicht und rechtlich sichergestellt werden.

Der bisherige ZUGFeRD-Standard 1.0 musste auf die neue Norm angepasst werden. ZUGFeRD 2.0 (veröffentlicht am 11. März 2019), entstand im Rahmen einer deutsch-französischen Zusammenarbeit, in enger Abstimmung mit dem französischen Standard Factur-X 1.0 und ist mit diesem technisch identisch.  Mittels ZUGFeRD 2.0 lassen sich E-Rechnungen erstellen die den EU-Standard EN 16931 und die EU-Richtlinie 2014/55/EU erfüllen. Details rund um die elektronische Rechnung finden Sie auch auf den Seiten der EU-Kommission. ZUGFeRD 2.0 setzt zudem auf dem globalen Standard UN/CEFACT XML in der Ausprägung Cross Industry Invoice auf. Damit könnte sich mit ZUGFeRD 2.0 sogar eine weltweite Perspektive ergeben.

Die neue ZUGFeRD-Version 2.0 kombiniert genauso wie die Version 1.0 eine PDF/A-3-Datei der Rechnung (visuelle Darstellung der Rechnungsdaten als digitales Format anstelle der klassischen Papierrechnung) mit einer Rechnungsdatei im XML-Format, die in das PDF/A3-Dokument eingebettet ist.

ZUGFeRD 2.0 Profile:

Bei ZUGFeRD 2.0 sowie Factur-X sind mehrere Profile vorgesehen. Das Profil «EN 16931» löst das ZUGFeRD-1.0-Profil «Comfort» ab und entspricht vollständig der EU-Norm, die jedoch nur die Kernelemente einer Rechnung festlegt. Mit dem Profil «Extended» können in einer elektronischen Rechnung zusätzliche Angaben erfasst werden, etwa nach Branche oder nach gesetzlichen Vorgaben. Darüber hinaus wurden mit «Basic» und «Basic WL» zwei weitere Profile für kleinere Lieferanten festgelegt.

ZUGFeRD eignet sich für Organisationen aller Größen und erhält dank der EN-16931-Konformität eine erweiterte, internationale Bedeutung. Das Profil «EN 16931» wird von allen europäischen Verwaltungen anerkannt. Seit November 2018 sind E-Rechnungen im Business to Government (B2G) -Verkehr in der EU vorgeschrieben.

Mit der Version 1.2.0 der PDF2PDFA Konverter Komponente können aus einer PDF und der entsprechenden XML jetzt auch ZUGFeRD 2.0 und Factur-X Dokumente erzeugt werden.

Download – Demo & Testanwendung – PDF2PDFA Konverter >>>

PDFmdx – Positionsdaten über Gruppen- / Untergruppenfelder auslesen

PDFmdx kann neben Dokumentenfeldern auch Positionsdaten auslesen. Positionsdaten sind Listen oder Tabellen mit Zeilen und Spalten. Diese finden sich typischerweise auf Rechnungen um mehrere Positionen im Beleg anzuführen. Wir verwenden dafür den Begriff einer “gleitenden Gruppe/Untergruppe”. Dabei werden ein oder mehrere Spalten (=Felder) über eine oder mehrere Zeilen auf einer oder mehreren Seiten in einem vertikal festgelegten Bereich gesucht und ausgelesen.

Ab der PDFmdx Version 3.5.0 gibt es eine 2-stufige Struktur wo neben der Gruppen auch eine Untergruppen Ebene möglich ist. Es können also zu einem Gruppen-Datensatz ein oder mehrere Untergruppen-Datensätze erkannt und ausgelesen werden. Belege mit 2-stufige Positionsdaten gibt es z.B. bei Textilien oder bei Bekleidung wo es zu einem Artikel (Nummer, Beschreibung) auch eine “Unterebene” mit Größen bzw. Farbangaben geben kann. Der Artikel selbst wird nur einfach angeführt und in der Ebene darunter finden sich dann  die Mengen / Preise zu einzelnen Ausprägungen.

Zweistufiges Auslesen von Positionsdaten:

  • “Dokumenten/Gruppen/ Untergruppen” Felder definieren die Erkennungsebene.

  • Ein über 2 rote horizontale Begrenzungslinien festgelegter Bereich wird auf allen Seiten des Dokuments nach den Gruppen- (rote Felder) sowie Untergruppen-Datensätzen (grüne Felder) abgegescannt.

  • Über die festgelegten Bedingungen werden die Gruppen- (G) sowie die zugehörigen Untergruppen- (U) Datensätze identifiziert und ausgelesen.

  • Zusammen mit den Datensätzen der untersten Ebene stehen auch die Informationen der Gruppen- und der Dokumentenfelder zur Verfügung.

Für Tests und als Ausgangspunkt für eigene Versuche haben wir zwei Beispiel-Vorlagen mit PDF-Testdateien erstellt. Die *.pmdx Vorlagen müssen nur per Drag&Drop in den PDFmdx Editor importiert und der Ausgabepfad gegebenenfalls angepasst werde. Für die Verarbeitung ist es dann noch erforderlich im PDFmdx Prozessor ein Job mit Eingangs- und Error-Folder anzulegen und die beiden Test-Vorlagen für den Job auszuwählen.

Download – PDFmdx – Vorlagen und Beispiele für zweistufiges Auslesen von Positionsdaten >>>
Download – PDFmdx Template Editor & Processor >>>