تتمثل المهمة الشائعة في استخراج الارتباطات من موقع ويب ، وخاصة روابط HTML. لحسن الحظ هذا سهل عند الاستخدام مكشطة الويب GrabzIt. بادئ ذي بدء ، قم بإنشاء كشط جديد مع التفاصيل العادية مثل صفحة البداية للكشط وأي خيارات أخرى.
ثم اذهب الى كشط تعليمات ثم انقر فوق زر. هذا سوف يدخل
Page
الكلمة intس تعليمات كشط وسوف تفتح المنسدلة. تحديد getTagAttributes
من القائمة. إضافة المقبل 'href'
كمعلمة أولى ، يخبر هذا مكشطة الويب باستخراج سمة href ، ثم اكتب فاصلة.
انقر فوق التالي هذا يسمح لك بإخبار مكشطة الويب عن العناصر التي يجب عليك استخراج سمة href منها. في نافذة التصفية ، تأكد من ضبط النوع على "صفحة الويب" وأن القيد هو "اسم العلامة" و "يساوي". ثم أدخل
a
في مربع النص ثم انقر فوق الزر "إضافة" ثم الزر "إدراج عامل التصفية". إنهاء التعليمات عن طريق إضافة فاصلة منقوطة إلى نهاية السطر.
يجب أن تترك مع شيء مثل ما هو موضح أدناه.
Page.getTagAttributes('href', {"tag":{"equals":"a"}});
سوف تستخرج الشفرة أعلاه جميع عناوين URL للرابط من صفحة الويب ، لكننا نحتاج إلى ذلك الآن save رابط URL تلك. للقيام بذلك ، سوف نلف هذا الأمر مطروحاً منه شبه القولون في Data.save
أمر. للقيام بذلك ، انتقل إلى بداية السطر وحدد زر. ثم في القائمة المنسدلة حدد
save
، ثم انتقل إلى نهاية السطر وقم بإضافة فاصلة. ثم أضف ما تريد استدعاء مجموعة البيانات مثل "موقع الويب الخاص بي" ، ثم أضف فاصلة أخرى ثم أضف معلمة أخرى لوصف العمود مثل "الروابط" ثم أغلق الأمر باستخدام )
قبل شبه القولون.
يجب أن يكون لديك الآن تعليمات الكشط التالية.
Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');
الآن إذا قمت بتشغيل الكشط ، فستستخرج جميع الروابط من الموقع. سيؤدي هذا إلى إنشاء جدول باسم "مواقع الويب الخاصة بي" ، مع اسم عمود الارتباطات التي يمكن تصديرها بعد ذلك into العديد من التنسيقات المختلفة مثل XML أو CSV أو جدول بيانات. يمكن تحقيق هذا البرنامج التعليمي أيضًا باستخدام زر المعالج في شريط أدوات Scrape Instructions.