أدوات لالتقاط وتحويل الويب

كيف GrabzIt تحويل HTML إلى DOCX

يمكن أن يمثل HTML العديد من الهياكل المعقدة مثل DIVs المضمنة أو SPAN جنبًا إلى جنب. تداخل عناصر HTML والحدود المطبقة على عناصر HTML المختلفة. بالنسبة للجزء الأكبر، لن يكون هذا أسلوبًا معقولًا في DOCX بينما سيكون من الممكن إنشاؤه floatسيؤدي استخدام عناصر HTML مع مربعات النص إلى احتواء كل المحتوى تقريبًا داخل مربعات النص مما يؤدي إلى مستند Word قبيح للغاية وفوضوي.

وبسبب هذه المشكلة نتجاهل floatتحديد عناصر HTML وحدود معظم عناصر HTML. ومع ذلك، فإننا نحترم الحدود في بعض عناصر HTML مثل خلايا الجدول ومحاذاة عناصر الصورة على سبيل المثال.

هل هذا يعني أنه لا يمكنك وضع المحتوى جنبًا إلى جنب؟ لا، لا يزال هذا ممكنًا باستخدام سمات العمود CSSوجداول HTML وعلامات الجدولة كما هو موضح أدناه.

إذا كنت تريد أن يتم التقاط مستند HTML تمامًا كما هو موضح على الشاشة، فمن الأفضل أن تفعل ذلك تحويل HTML إلى PDF حيث أن تنسيق ملف PDF يستخدم تحديد المواقع المطلق.

علامات التبويب توقف

علامات التبويب توقف هي ميزة DOCX خاصة يتم تنشيطها إذا floatيتم تضمين عناصر HTML، مع محاذاة النص، ضمن عنصر HTML بعرض 100% لا يحتوي على محاذاة نص محددة في حد ذاته. وهذا أمر مهم لأنه يعني أنه لا ينبغي تطبيق المحاذاة العادية على العناصر الفرعية. ويتم ذلك باستخدام text-align:start. لاحظ أن علامات الجدولة لن تعمل ضمن جدول أو قائمة.

ويرد أدناه مثال على ذلك.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>

لغة النص

لجعل النص في مستند DOCX له لغة معينة. ال HTML يجب أن يحتوي عنصر العلامة في مستند HTML على lang يصف. أو عنصر HTML آخر داخل مستند HTML مثل P يجب أن تحتوي العلامة على لغة محددة.

إذا لم يكن لعنصر HTML الفرعي علامة لغة محددة، فستعود اللغة إلى اللغة الافتراضية للمستند. إذا لم يتم تحديد أي شيء، يتم استخدام اللغة الإنجليزية.