Bild zu Text (OCR)
Ziehen Sie ein oder mehrere Bilder hinein (PNG, JPG, WebP, BMP) und holen Sie den Text heraus. Wählen Sie eine Sprache - oder bis zu drei für gemischtsprachige Seiten - und kopieren oder laden Sie den extrahierten Text als .txt-Datei herunter. Die Texterkennung läuft vollständig in Ihrem Browser über Tesseract.js mit Unterstützung für mehr als 100 Sprachen.
Die gesamte Texterkennung läuft im Browser über Tesseract.js. Bilder und Text werden nie hochgeladen.
So verwenden Sie diesen bild zu text (ocr)
- Ziehen Sie Bilder in das Feld oder klicken Sie zum Auswählen (PNG, JPG, WebP, BMP). Mehrere Bilder auf einmal sind möglich.
- Wählen Sie die Dokumentsprache - oder fügen Sie eine zweite oder dritte Sprache für gemischtsprachige Seiten hinzu.
- Klicken Sie auf Erkennen. Beim ersten Durchlauf werden die Sprachdaten heruntergeladen (~5-10 MB pro Sprache, danach im Cache).
- Lesen Sie den erkannten Text pro Bild mit Konfidenz-Anzeige oder kopieren bzw. laden Sie das Gesamtergebnis als .txt-Datei herunter.
Häufig gestellte Fragen
Welche Sprachen werden unterstützt?
Über 100 Sprachen über Tesseract.js, darunter Deutsch, Englisch, Französisch, Spanisch, Italienisch, Portugiesisch, Niederländisch, Polnisch, Tschechisch, Russisch, Arabisch, Hindi, Japanisch, Chinesisch (vereinfacht und traditionell), Koreanisch, Türkisch, Vietnamesisch, Indonesisch, Thai, Ukrainisch, Griechisch, Hebräisch, Bengalisch und Urdu. Sie können bis zu drei Sprachen für gemischtsprachige Dokumente kombinieren.
Wie genau ist die Texterkennung?
Tesseract.js erreicht bei sauberen, kontrastreichen Scans von gedrucktem Text typischerweise 85-95 % Genauigkeit. Bei verzerrten Fotos, Reflexionen, Handschrift oder niedriger Auflösung sinkt die Konfidenz. Jedes Bild erhält einen Konfidenzwert, damit Sie schwache Ergebnisse sofort sehen.
Warum kommt meine handschriftliche Notiz als Kauderwelsch raus?
Tesseract.js ist auf gedruckten Text trainiert — Schriftsatz-Zeichen, gleichmäßige Strichbreite, regelmäßige Abstände. Handschrift verletzt alle drei. Kursive Schrift ist im Grunde unlesbar für die Engine. Für handschriftliche Notizen nimm ein spezialisiertes Handschrift-OCR (Apple Notes, Google Lens, OneNote), kein Tesseract-Tool.
Gibt es eine Dateigrößenbegrenzung?
Es gibt keine harte Grenze, aber sehr große Bilder (>10 MB oder breiter als ~4000 px) benötigen viel Speicher und laufen auf Mobilgeräten langsam. Für beste Geschwindigkeit und Genauigkeit scannen Sie Dokumente mit 1500-3000 px auf der langen Seite.