أدوات لالتقاط وتحويل الويب

تحديد حجم صفحات PDF عند استهداف عناصر HTML

الأربعاء فبراير 20، 2019

في الأصل قبل إجراء الترقيات الحديثة لاستهداف عناصر HTML في PDF ، كان حجم صفحة PDF الناتج هو نفس عنصر HTML المستهدف. هذا لأنه لم نتمكن من إيجاد طريقة موثوقة لاستخراج الهدف من ملف PDF بخلاف اقتصاص كل شيء آخر يحظر عنصر HTML.

ومع ذلك ، بعد الكثير من العمل ، تمكنا من توفير عنصر HTML المستهدف ، مع هوامش من حوله ، مع كونه متوافقًا أيضًا مع نظام templating لدينا. السماح للمستخدمين بتحديد الرؤوس والتذييلات لأول مرة عند استخدام هذه الميزة.

لسوء الحظ ، سرعان ما أصبح من الواضح أنه كان هناك تناقض آخر عند استخدام الميزة المستهدفة. تم تجاهل هذا الاتجاه والمعلمات المرتبطة بحجم الصفحة. وذلك لأنه يتم استخدام حجم صفحة خاصة جديد لملف PDF ، في حين تعمل الميزة المستهدفة بنفس الطريقة في واجهة برمجة التطبيقات لالتقاط الصور ، حيث إنها تستند إلى المستند ، فمن المحتمل أن تكون متسقة مع واجهة برمجة تطبيقات DOCX الخاصة بنا إذا كانت HTML المستهدفة يظهر العنصر في الجزء العلوي من المستند الناتج.

لذلك قمنا بتغيير طريقة عمل هذه الميزة لإنشاء صفحة PDF بالحجم والاتجاه المطلوب ، مع ظهور المحتوى المستهدف في الزاوية العلوية اليسرى ، بما يتوافق مع واجهة برمجة تطبيقات DOCX.

عرض أحدث المشاركات بلوق