Scanner Software wie OCR Scanner werden oftmals als PDF-Editoren verkauft. Es kommt sogar vor, dass der OCR Scanner lediglich eine Applikation einer PDF-Scanning-Software ist. Um zu verstehen, warum gerade das Datei-Format PDF im Zusammenhang mit Texterkennung genannt wird, muss zunächst die Problematik der Formatierung im Zusammenhang mit der Textverarbeitung erläutert werden.
2.1. Überblick über Datei-Formate
Wenn Sie sich die Dateien auf Ihrem PC oder Laptop genauer ansehen, werden Sie verschiedene Formate bemerken:
Archiv-Dateien | Film-Dateien | Musik-Dateien | Text-Dateien |
| | | |
z. B. mit WinRAR | z. B. mit VLC Player | z. B. mit Winamp | z. B. mit MS Office |
Programme: Je nach Format der Dokumente und Dateien benötigen Sie auch unterschiedliche Programme. Beispiel-Software können Sie der Tabelle entnehmen. |
Die Vielzahl von Formaten kann auf den ersten Blick unübersichtlich erscheinen. Wer sich schon einmal mit Bildbearbeitung auseinandergesetzt hat und z.B. mit Adobe Photoshop ein Bild abspeichern möchte, der kann aus folgenden Formaten wählen:
- PSD
- PSB
- BMP
- GIF
- DCM
- EPS
- DCS
- IFF
- JPG
- MPO
- PCX
- PDF
- RAW
- PXR
- PNG
- PBM
- SCT
- TGA
- TIF
Wenn Sie nicht gerade als Grafiker oder Designer arbeiten, werden Sie sich über diese Menge an kryptischen Abkürzungen wundern. Tatsächlich hat die Häufung von Formaten Vor- und Nachteile, die wir Ihnen kurz darlegen möchten:
Vorteile- Datei-Größe kann angepasst werden (z. B. Komprimierung)
- Datei-Qualität kann erhöht werden (PNG: Verlustfreiheit)
- Datei-Kompatibilität kann hergestellt werden, damit die Datei von bestimmten Programmen geöffnet werden kann
Nachteile- Datei-Kompatibilität muss erst hergestellt werden
- oftmals werden falsche Formate genutzt

Auch die Stiftung Warentest hat bisher noch keinen OCR-Software-Test durchgeführt.
2.2. Das Abspeichern von Texten
Wenn es um Textverarbeitung am Computer geht, wird Ihnen sicherlich Word von Microsoft in den Sinn kommen. Auch mit diesem Programm können Sie aus einer Vielzahl von Textformaten wählen, wenn Sie Ihre Dokumente abspeichern möchten:
- Word-Dokument
- XPS-Dokument
- Rich-Text-Format
- OpenDocument-Text*
- PDF
*OpenDocument-Text: Wer gerne auf kostenlose Textverarbeitungs-Software wie z. B. OpenOffice setzt, der erstellt (ohne spezielle Einstellung) OpenDocument-Dateien. Wenn Sie die Datei jedoch an jemanden schicken, der Word benutzt, sollten Sie das Dokument als .doc abspeichern.
Wenn Sie einen Text abspeichern und ihn in Zukunft weiter bearbeiten möchten, sollten Sie immer das Word-Dokument wählen. Mit diesem Format abgespeicherte Dateien lassen sich jederzeit öffnen und ohne Schwierigkeiten weiter bearbeiten.

PDF Dateien werden mit dem Adobe Acrobat Reader geöffnet.
Möchten Sie ein fertiges Dokument abspeichern und es z.B. ausdrucken oder verschicken, sollten Sie jedoch das Format PDF wählen. PDF bedeutet Portable Document Format. Es handelt sich um ein Dokument-Format das von Adobe entwickelt worden ist und Plattform-unabhängig verwendet werden kann – also unter Linux, Apple, Windows oder sogar Solaris. Der Empfänger braucht zudem nicht einmal ein Programm für Textverarbeitung oder Texterkennung: Adobe stellt mit dem Adobe Acrobat Reader das Programm zur Verfügung, mit dem Sie die Datei öffnen und lesen können.
Der einzige Nachteil von PDF-Dateien ist, dass sie nicht für die weiterführende Bearbeitung geschaffen sind. Zwar können Sie den Text farblich markieren oder einen Kommentar hinzufügen, doch am Inhalt der PDF lässt sich so leicht nichts ändern. Dafür braucht es eine spezielle PDF-Editor-Software.
Adobe Systems
Ein Nachteil dabei ist die Abhängigkeit von Adobe. Adobe Systems steigert seinen Umsatz seit Jahren unaufhörlich. Inzwischen sind es etwa 1,4 Milliarden US-Dollar in einem einzigen Geschäftsquartal. Für Sie als Nutzer ist zwar die Verwendung von PDF-Dateien ohne Gebühren möglich, doch Adobe stellt noch viele andere Programme her, die oft genutzt werden:
- Photoshop
- Lightroom
- Illustrator
- InDesign
- Acrobat Pro DC
- Experience Design
- Premiere Pro
- After Effects
- Animate
- Dreamweaver
- Muse
- Fuse
- Audition
- Bridge
- Flash Builder
- InCopy
- Prelude
- Media Encoder
- Spark
- Scout
- SpeedGrade
- Story Plus
- PhoneGap Build
- Prelude Live Logger
- Creative Cloud
- Gaming SDK
- Extension Manager
- ExtemdScript Toolkit
Mit dem steigenden Erfolg von Adobe System wächst jedoch die Gefahr der Monopolisierung. Adobe Photoshop konnte man bisher einfach für einen festen Preis kaufen und nach Belieben verwenden. Adobe Photoshop CC ist jedoch nur über ein Abonnement über die Creative Cloud erhältlich. Das bedeutet, dass Kunden nunmehr etwa 25 Euro im Monat für die Benutzung von Photoshop bezahlen müssen. Auch die beliebten Schüler- und Studentenversionen sucht man vergebens.
Die Empörung ist natürlich groß, doch am Erfolg von Adobe Systems ändert sich deshalb nichts. Zu wichtig sind Programme wie Photoshop und InDesign geworden, als dass man sie einfach ersetzen könnte. Mehr zu diesem Thema erfahren Sie, wenn Sie diesem Link folgen.
2.3. Die PDF und OCR
Wenn Sie die beste OCR-Software kaufen, werden Sie um ein PDF-OCR-Programm nicht herumkommen. Das liegt daran, dass ein mithilfe einer OCR Software gescannter Text idealerweise in eine PDF umgewandelt wird. Das Format ist prädestiniert, weil Sie den gescannten Text nur selten selbst bearbeiten wollen. Wenn Sie ein Buch via Scanning Software in ein Textformat umwandeln, können Sie dank des PDF-Formats in kurzer Zeit ein E-Book erstellen – als Word-Dokument wäre der Text eher ungeeignet.
Darum wird (selbst wenn die OCR-Software günstig zu erwerben ist) oft ein PDF-Editor mitgeliefert, damit Sie die erstellten PDFs in gewissem Umfang konvertieren und bearbeiten können. Wenn Sie auf eine Freeware OCR zurückgreifen oder OCR Online verwenden, sollten Sie sich einen kostenlosen PDF-Editor zusätzlich downloaden.
Im folgenden Video sehen Sie, wie Sie den kostenlosen PDF-Creator verwenden können, um eine PDF-Datei zu erstellen:
interessant, besonders das mit adobe fand ich spannend. gibt es denn da eigentlich sinnvolle alternativen?
wie in dem Artikel bereits kurz erwähnt gibt es auch viele kostenlose online ocr tools. Meine klare Empfehlung ist: http://ocr.team
Leider recht unbekannt. Aber für ein Online Tool hat es extrem viele Funktionen und eine exzellente Texterkennung (basierend auf neuronalen Netzen).
Lieber Leser,
vielen Dank für Ihren Kommentar zu unserem OCR-Software Vergleich.
Ja, es gibt Alternativen zu Adobe Systems. Sowohl der Foxit Reader als auch der PDF-XChange Viewer werden bei Verbrauchern immer beliebter.
Doch auch hier gibt es Nachteile, insbesondere, was den Datenschutz anbelangt. Mehr Erfahren Sie in diesem Artikel von Spiegel Online.
Weiterhin viel Vergnügen bei der Texterkennung!
Ihr Vergleich.org Team