Du hast deinen AdBlocker an?

Es wäre ein Traum, wenn du ihn für t3n.de deaktivierst. Wir zeigen dir gerne, wie das geht. Und natürlich erklären wir dir auch, warum uns das so wichtig ist. Digitales High-five, deine t3n-Redaktion

Gadgets & Lifestyle

Abtippen war gestern: Project Naptha erweitert Browser um Texterkennung

Project Naptha. (Foto: Savio Sebastian / Flickr Lizenz: CC BY 2.0)

Project Naptha bietet Texterkennung per Browser-Plugin. Damit kannst du jetzt endlich auch Texte direkt aus Bildern kopieren.

Project Naptha: Das Plugin erkennt auch Texte wie auf dem Foto eines Buchcovers. (Screenshot: Project Naptha)
Project Naptha: Das Plugin erkennt auch Texte wie auf dem Foto eines Buchcovers. (Screenshot: Project Naptha)

Project Naptha: Texte in Bildern einfach kopieren

Wir sind es gewohnt, Texte im Web markieren zu können und einzelne Begriffe oder Sätze per Rechtsklick zu kopieren oder direkt als Ausgangspunkt für eine Google-Suche zu verwenden. Nur bei Bildern, die Texte enthalten, fehlt diese Möglichkeit. Egal ob Screenshots, Scans, Memes oder Fotos: Hier bleibt uns bisher nur das Abtippen der Texte. Zukünftig könnte das dank Project Naptha jedoch nicht mehr nötig sein.

Project Naptha ist ein Browser-Plugin des MIT-Studenten Kevin Kwok. Die Software erlaubt es Texte, die sich in Bildern befinden, zu markieren und zu kopieren. So lassen sich die Informationen schnell und einfach aus Bildern extrahieren. Das Tool entstand ursprünglich im Rahmen des HackMIT 2013 Hackathons der amerikanischen Universität und gewann dort unter dem Namen „Images as Text“ den zweiten Preis.

Project Naptha: Texterkennung muss noch verbessert werden

Derzeit existiert Project Naptha nur in Form einer Demo, die gibt aber bereits einen guten Einblick in die Zukunft des Tools. Damit der Nutzer nicht zu lange warten muss, bis Project Naptha den Text in einem Bild erkennt, überwacht das Plugin kontinuierlich die Bewegungen des Cursors und versucht vorauszusehen, wann der Nutzer mit der Maus über ein Bild fährt. Die Texterkennung an sich ist ein reiner JavaScript-Port der Open-Source-OCR-Software Ocrad.

Die ist allerdings bei weitem nicht perfekt, außerdem kann es eine Weile dauern, bis der Text tatsächlich erkannt wurde. Als Alternative kann Project Naptha auch auf Googles Cloud-basierte Texterkennung Tesseract zugreifen. Das hat neben der besseren Texterkennung den Vorteil, dass einmal erkannte Texte in Bildern für spätere Besucher gesichert werden. Später soll Project Naptha nicht nur Texte erkennen, sondern sie auch direkt im Bild übersetzen oder sogar löschen können. Bis das alles einwandfrei funktioniert, wird der Entwickler noch etwas Zeit in sein Projekt stecken müssen. Der Ansatz ist aber schon jetzt mehr als vielversprechend.

via news.ycombinator.com

Bitte beachte unsere Community-Richtlinien

Schreib den ersten Kommentar!

Du musst angemeldet sein, um einen Kommentar schreiben zu können.

Jetzt anmelden

Finde einen Job, den du liebst