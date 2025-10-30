Rechnungen, Bescheinigungen, offizielle Briefe – immer noch werden Dokumente ausgedruckt und in Papierform weitergereicht. Wer so etwas elektronisch weiterverarbeiten möchte, kann mittlerweile zum Smartphone greifen und das Papier mit Scanner-Apps wie Adobe Scan, Microsoft Lens, der Scan-Funktion von Google Drive oder der Dateien-App auf dem iPhone schnell und bequem erledigen. Aber was dann?

Anzeige Anzeige

Die Apps erkennen zwar Seiten, korrigieren perspektivische Verzerrungen und schlechte Beleuchtungen und lösen meist sogar automatisch aus. Das funktioniert so gut, dass man mit wenig Mühe sogar einzelne Kapitel aus alten Büchern schnell mal aus der Hand mit dem Smartphone scannen kann. Als Output spucken die Apps aber in der Regel PDF‑Dateien aus. Wer so ein PDF öffnet – auf dem Mac zum Beispiel mit der Vorschau-App – und dann mit Cut and Paste den Text herausziehen will, erlebt eine böse Überraschung: Da lässt sich nichts markieren. Denn PDF‑Dateien mit gescannten Seiten enthalten nur Bilder – keinen Text.

Warum reicht das PDF nicht aus?

Das liegt daran, dass PDF eigentlich ein Dateiformat ist, das layoutete Seiten unabhängig von der Auflösung des Ausgabegeräts beschreibt. So ähnlich wie bei Vektorgrafiken. Das heißt, ein PDF kann Text enthalten, muss aber nicht. Es kann auch nur aus einem oder mehreren grafischen Elementen bestehen. Um das Ganze noch ein bisschen schwieriger zu machen, gibt es in PDF‑Dateien weder semantische Auszeichnungen noch eine logische Strukturierung der Inhalte.

Anzeige Anzeige

Wie kann man aus dem PDF Text herausholen?

Die Lösung, die einschlägige Software-Tools in der Regel verwenden, ist ein Umweg: Sie lassen eine Mustererkennung über das eingebettete Bild laufen, die den Pixeln Buchstaben zuordnet. Das Verfahren ist unter der Bezeichnung OCR (Optical Character Recognition) bekannt – und war früher ein wichtiger Bestandteil der Software, die mit Flachbett-Scannern ausgeliefert wurde.

Kann man OCR auf dem Smartphone laufen lassen?

Im Prinzip ja. Die Ergebnisse meiner – natürlich nicht repräsentativen – Tests waren aber sehr gemischt. Google bietet über die Lens-Funktion bereits seit einiger Zeit die Möglichkeit, in Kamerabildern Text automatisch zu erkennen – und beispielsweise zu übersetzen. Bei iPhones ist die Funktion mittlerweile in die Fotos-App integriert.

Empfohlene redaktionelle Inhalte Hier findest du externe Inhalte von TargetVideo GmbH, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte von TargetVideo GmbH auf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden.

Inhalte anzeigen Hier findest du externe Inhalte von, die unser redaktionelles Angebot auf t3n.de ergänzen. Mit dem Klick auf "Inhalte anzeigen" erklärst du dich einverstanden, dass wir dir jetzt und in Zukunft Inhalte vonauf unseren Seiten anzeigen dürfen. Dabei können personenbezogene Daten an Plattformen von Drittanbietern übermittelt werden. Hinweis zum Datenschutz Leider ist etwas schief gelaufen... An dieser Stelle findest du normalerweise externe Inhalte von TargetVideo GmbH, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.

Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Datenschutzeinstellungen verwalten An dieser Stelle findest du normalerweise externe Inhalte von, jedoch konnten wir deine Consent-Einstellungen nicht abrufen.Lade die Seite neu oder passe deine Consent-Einstellungen manuell an.

Das funktioniert aber nur für relativ kurze Texte. Auch ein Mehrspalten-Layout – zum Beispiel ein abfotografiertes wissenschaftliches Paper – bringt die Texterkennung aus dem Tritt. Mehrseitige Dokumente kann man so auch nicht bearbeiten.

Theoretisch kann Microsoft Lens auch mehrseitige, mit dem Smartphone gescannte Dokumente in Word importieren, aber auch dieser Versuch scheitert bei mir im ersten Anlauf.

Anzeige Anzeige

Google Drive wird damit beworben, es würde hochgeladene Dokumente automatisch mit einer OCR analysieren, wenn man das gescannte PDF mit Google Docs öffnet. Aber ein eingescanntes Kapitel aus einem alten Kochbuch – gigantische 19 Megabyte – überfordert die Software komplett. Docs hängt sich auf und quittiert den Job nach rund fünf Minuten mit: „Da ist was schiefgegangen.“

Was kann man sonst noch tun?

Software bezahlen. Adobe, Erfinder des PDF-Formats, berechnet rund 15 Euro für den Service des PDF-Umwandelns. Solche kostenpflichtigen Abos sind in dem Bereich weitverbreitet.

Vorsicht übrigens bei mehr oder weniger dubiosen Online-Tools oder gar angeblichen Gratis-Apps. Cyberkriminelle haben längst erkannt, dass man mit solchen Tools User dazu verleiten kann, ihre PDF-Dateien mit Schadsoftware anzureichern.

Anzeige Anzeige

Open-Source-Lösungen: Tesseract und PDFsandwich

Bliebe noch Open Source. Das Tool „Tesseract“ ist eine Open-Source-OCR-Engine, die sich mit Homebrew (brew install tesseract) tatsächlich recht einfach auf meinem Macbook installieren lässt.

Allerdings kann Tesseract nur mit Bildern umgehen. Also muss man das PDF zuerst mit einem anderen Tool wieder in ein Bild wandeln, um dann … Wer sich die ganzen Klimmzüge sparen will, kann das Tool PDFsandwich installieren. Das spuckt ein PDF mit eingebettetem Text aus, der von der integrierten OCR erkannt worden ist.

Scanner-Software

Das ein wenig in Vergessenheit geratene Freeware-Projekt NAPS2 ist eigentlich eine Software zur Bedienung alter Flachbett-Scanner, die aber auch PDF‑Dateien importieren und mit der eingebauten OCR analysieren kann. Leider läuft die Mac-Version allerdings nur bis macOS 15. Auch diese Software speichert das PDF dann mit dem erkannten Text in eingebetteter Form.

Anzeige Anzeige

Wer irgendwo noch alte Scanner-Software herumliegen hat, kann probieren, ob die noch läuft. Oft kann man auch mit den kommerziellen Produkten PDF‑Dateien importieren und eine OCR darüber laufen lassen.

Durchsuchbares pdf

Ein PDF mit eingebettetem Text ist nicht nur durchsuchbar. Man kann es auch in Office-Software öffnen und dann in anderen Formaten abspeichern beziehungsweise den Text mit Cut and Paste übernehmen.

Konvertieren mit KI-Hilfe

Theoretisch müssten auch KI-Modelle, die Bilder erkennen können (Vision Language Models), aus Bildern Text ziehen können. Kleinere Modelle, die zwar im Prinzip lokal auf meinem Macbook laufen, scheitern aber komplett oder produzieren zu viele Fehler.

Anzeige Anzeige

ChatGPT 5 hingegen läuft zwar nicht lokal, war aber als einziges Modell in meinem kleinen Test problemlos in der Lage, das genannte Kochbuch-Kapitel (25 Seiten, Querformat, gelbe Buchseiten, zum Teil handschriftliche Kommentare und Notizen) einzulesen und den Text fehlerfrei zu extrahieren. Natürlich kann die KI dann auch Fragen zu dem PDF beantworten, auf Wunsch aber auch alle Rezepte in einer Markdown-Datei extrahieren.