أدوات لالتقاط وتحويل الويب

تحديد حجم صفحات PDF عند استهداف عناصر HTML

20 فبراير 2019

في الأصل، قبل إجراء الترقيات الأخيرة لاستهداف عناصر HTML في PDF، كان حجم صفحة PDF الناتج هو نفس عنصر HTML المستهدف. وذلك لأننا لم نتمكن من العثور على طريقة موثوقة لاستخراج الهدف فقط من ملف PDF بخلاف اقتصاص كل شيء آخر باستثناء عنصر HTML.

ولكن بعد الكثير من العمل، تمكنا من توفير عنصر HTML المستهدف، مع هوامش حوله، مع التوافق أيضًا مع نظام القوالب الخاص بنا. السماح للمستخدمين بتحديد الرؤوس والتذييلات لأول مرة عند استخدام هذه الميزة.

لسوء الحظ، سرعان ما أصبح واضحًا أن هناك تناقضًا آخر عند استخدام الميزة المستهدفة. تم تجاهل المعلمات ذات الصلة بالاتجاه وحجم الصفحة. ويرجع ذلك إلى أنه يتم استخدام حجم صفحة خاص جديد لملف PDF، بينما تعمل الميزة المستهدفة بنفس الطريقة في واجهة برمجة تطبيقات التقاط الصور لدينا، نظرًا لأنها تعتمد على المستند، فمن المحتمل أن تكون متوافقة مع واجهة برمجة التطبيقات DOCX الخاصة بنا إذا كانت HTML المستهدفة يظهر العنصر في أعلى المستند الناتج.

لذلك قمنا بتغيير كيفية عمل هذه الميزة لإنشاء صفحة PDF بالحجم والاتجاه المطلوب، مع ظهور المحتوى المستهدف في الزاوية اليسرى العليا، بما يتوافق مع DOCX API.

عرض أحدث المشاركات بلوق