أدوات لالتقاط وتحويل الويب

استخراج النص من الصور

في كثير من الأحيان يمكن تخزين المعلومات النصية المهمة في الصور. ومع ذلك مكشطة الويب GrabzIt يوفر القدرة على استخراج هذه المعلومات تلقائيًا باستخدام التعرف الضوئي على الأحرف. على الرغم من أن هذا هو شكل من أشكال الاصطناعي intelligence النتائج ليست دائما مثالية.

لاستخراج النص من الصور يجب عليك استخدام Utility.Image.extractText طريقة كما هو مبين أدناه.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

تحصل هذه الأمثلة على كل عناوين URL للصور من صفحة الويب ، ثم تقوم بتمرير عناوين URL إلى طريقة extractText التي تحاول استخراج البيانات النصية من كل صورة وتعيد أي مطابقات كمجموعة من strings.

إذا كان النص الموجود في الصورة بلغة مختلفة ، فأنت بحاجة إلى تحديد رمز اللغة الصحيح باستخدام تنسيق الأحرف (ISO 639-1) كما هو موضح أدناه.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');