أدوات لالتقاط وتحويل الويب

تحويل صفحات الويب و HTML إلى PDF

بيثون API

عند تحويل صفحات الويب و HTML إلى PDF GrabzIt's Python API يوفر الميزات التالية التي تساعد integrate GrabzIt intس النظام الخاص بك بسهولة قدر الإمكان. ولكن قبل أن تبدأ تذكر أنه بعد استدعاء URLToPDF, HTMLToPDF or FileToPDF طرق Save or SaveTo يجب استدعاء الطريقة لالتقاط لقطة شاشة PDF.

الخيارات الأساسية

في كثير من الأحيان عند تحويل صفحة ويب intoa سيتم إنتاج العديد من صفحات مستند PDF لتمثيل صفحة الويب بأكملها. مطلوب معلمة واحدة فقط من أجل تحويل صفحة ويب intيا وثيقة PDF أو ل تحويل HTML إلى PDF كما هو مبين في الأمثلة أدناه.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

معرف مخصص

يمكنك تمرير معرف مخصص إلى PDF الأساليب كما هو موضح أدناه ، ثم يتم إرجاع هذه القيمة إلى معالج GrabzIt Python. على سبيل المثال ، يمكن أن يكون هذا المعرّف المخصص معرف قاعدة بيانات ، مما يسمح بربط لقطة شاشة بسجل قاعدة بيانات معين.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

الرؤوس والتذييلات

عند إنشاء لقطة شاشة PDF ، يمكنك طلب أن ترغب في تطبيق معين قالب إلى قوات الدفاع الشعبي ولدت. يجب أن يكون هذا القالب saveد مقدما وسيحدد محتويات رأس وتذييل جنبا إلى جنب مع أي متغيرات خاصة. في مثال التعليمة البرمجية أدناه ، يستخدم المستخدم قالبه المسمى "القالب".

إذا لم يكن هناك هامش كبير أو سفلي كبير بما يكفي للرأس أو التذييل على التوالي ، فلن يظهر في PDF. في المثال أدناه ، قمنا بتعيين الهوامش العلوية والسفلية على 20 لتوفير مساحة كبيرة.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

تحويل عنصر HTML إلى PDF

إذا كنت تريد فقط تحويل عنصر HTML مثل div أو span مباشرة intيا وثيقة PDF يمكنك مع مكتبة بايثون GrabzIt. يجب أن تمر محدد CSS عنصر HTML الذي ترغب في تحويله إلى targetElement المعلمة.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

في هذا المثال ، نود أن نلتقط كل المحتوى الموجود في النطاق الذي يحمل معرف Article، لذلك ننقل هذا إلى GrabzIt كما هو موضح أدناه.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

كيف يمكن اقتصاص ملف PDF عند استهداف عنصر HTML تسيطر عليها باستخدام هذه التقنيات.