Tools zum Erfassen und Konvertieren des Webs

Wie konvertiert GrabzIt HTML in DOCX?

HTML kann viele komplizierte Strukturen wie Inline-DIVs oder SPANs nebeneinander darstellen. Überlappende HTML-Elemente und auf verschiedene HTML-Elemente angewendete Ränder. In den meisten Fällen wäre dies in DOCX kein sinnvoller Ansatz, obwohl es möglich wäre, etwas zu erstellen floatWenn man HTML-Elemente mit Textfeldern verbindet, würde dies dazu führen, dass fast der gesamte Inhalt in Textfeldern enthalten wäre, was zu einem sehr hässlichen und unordentlichen Word-Dokument führen würde.

Aus diesem Grund ignorieren wir das floating von HTML-Elementen und Rahmen der meisten HTML-Elemente. Allerdings respektieren wir die Ränder einiger HTML-Elemente wie Tabellenzellen und die Ausrichtung beispielsweise von Bildelementen.

Bedeutet das, dass Sie Inhalte nicht nebeneinander platzieren können? Nein. Dies ist weiterhin möglich, indem Sie verwenden Spalten-CSS-Attribute, HTML-Tabellen und Tabstopps wie unten beschrieben.

Wenn Sie möchten, dass ein HTML-Dokument genau so erfasst wird, wie es auf dem Bildschirm angezeigt wird, ist es besser, dies zu tun Konvertieren Sie das HTML in PDF da das PDF-Dateiformat eine absolute Positionierung verwendet.

Tabstopps

Tabstopps sind eine spezielle DOCX-Funktion, die aktiviert wird, wenn floating-HTML-Elemente mit Textausrichtung sind in einem 100 % breiten HTML-Element enthalten, das selbst keine bestimmte Textausrichtung hat. Dies ist wichtig, da es bedeutet, dass die normale Ausrichtung nicht auf die untergeordneten Elemente angewendet werden sollte. Dies geschieht durch die Verwendung text-align:start. Beachten Sie, dass Tabstopps nicht innerhalb einer Tabelle oder Liste funktionieren.

Ein Beispiel hierfür ist unten dargestellt.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>

Textsprache

Damit Text im DOCX-Dokument eine bestimmte Sprache hat. Der HTML Das Tag-Element des HTML-Dokuments muss ein haben lang Attribut. Oder ein anderes HTML-Element innerhalb des HTML-Dokuments, z. B. a P Für das Tag muss eine Sprache angegeben werden.

Wenn für das untergeordnete HTML-Element kein lang-Tag angegeben ist, wird die Sprache auf die Standardsprache des Dokuments zurückgesetzt. Wenn keine angegeben sind, wird Englisch verwendet.