من الصورة إلى النص (OCR)
أفلت صورة أو أكثر (PNG, JPG, WebP, BMP) واستخرج النص منها. اختر لغة، أو حتى ثلاث لغات للصفحات متعددة اللغات، ثم انسخ النص المستخرج أو نزّله كملف .txt. يجري التعرف بالكامل في متصفحك عبر Tesseract.js مع دعم أكثر من 100 لغة.
يجري كامل التعرف داخل متصفحك عبر Tesseract.js. لا تُرفع الصور ولا النصوص أبداً.
كيفية استخدام من الصورة إلى النص (ocr)
- أفلت الصور على الصندوق أو انقر لاختيار الملفات (PNG, JPG, WebP, BMP). يمكن رفع عدة صور دفعةً.
- اختر لغة المستند، أو أضف لغة ثانية أو ثالثة للصفحات متعددة اللغات.
- اضغط على «تعرّف». عند أول استخدام يتم تنزيل بيانات اللغة (~5-10 ميغابايت لكل لغة، ثم تُخزَّن مؤقتاً).
- اقرأ النص المستخرج لكل صورة مع شارة ثقة، أو انسخ/نزّل النتيجة المجمّعة كملف .txt.
الأسئلة الشائعة
ما اللغات المدعومة؟
أكثر من 100 لغة عبر Tesseract.js، منها الإنجليزية والألمانية والفرنسية والإسبانية والإيطالية والبرتغالية والهولندية والبولندية والتشيكية والروسية والعربية والهندية واليابانية والصينية (المبسطة والتقليدية) والكورية والتركية والفيتنامية والإندونيسية والتايلاندية والأوكرانية واليونانية والعبرية والبنغالية والأردية. يمكنك دمج حتى ثلاث لغات للمستندات المختلطة.
ما مدى دقة التعرف؟
تصل دقة Tesseract.js عادةً إلى 85-95% على المسحات النظيفة عالية التباين لنص مطبوع. تنخفض الثقة على الصور المائلة أو ذات الانعكاسات أو الخط اليدوي أو الدقة المنخفضة. تحصل كل صورة على نسبة ثقة لرصد النتائج الضعيفة بنظرة سريعة.
لماذا تخرج ملاحظتي المكتوبة بخط اليد كأنها لغو؟
Tesseract.js مدرَّب على النصوص المطبوعة — أحرف منضّدة، عرض ضربة منتظم، تباعد منتظم. الخط اليدوي يخرق الثلاثة. الكتابة المتّصلة غير قابلة للقراءة فعلياً بالنسبة له. للملاحظات اليدوية استخدم OCR مخصص للخط اليدوي (Apple Notes أو Google Lens أو OneNote)، لا أداة مبنية على Tesseract.
هل هناك حد لحجم الملف؟
لا يوجد حد صارم، لكن الصور الكبيرة جداً (>10 ميغابايت أو أعرض من ~4000 بكسل) تستهلك ذاكرة كبيرة وتعمل ببطء على الهواتف. للسرعة والدقة، امسح المستندات بحجم 1500-3000 بكسل على الطول.