Tools zum Erfassen und Konvertieren des Webs

Konvertieren Sie URLs und HTML in DOCX

Python-API

Hinzufügen der Fähigkeit, HTML oder Webseiten zu konvertieren into Word-Dokumente für Ihre Anwendung waren noch nie so einfach GrabzIt's Python API. Bevor Sie jedoch anfangen, denken Sie daran, dass nach dem Aufruf der URLToDOCX, HTMLToDOCX or FileToDOCX Methoden der Save or SaveTo Methode muss aufgerufen werden, um das DOCX tatsächlich zu erstellen.

Grundlegende Optionen

Das Erfassen von Webseiten als DOCX konvertiert die gesamte Webseite intEin Word-Dokument, das aus vielen Seiten bestehen kann. Es ist nur ein Parameter erforderlich, um eine Webseite zu konvertieren into ein Word Dokument oder nach HTML in DOCX konvertieren wie in den folgenden Beispielen gezeigt.

grabzIt.URLToDOCX("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToDOCX("example.html")
# Then call the Save or SaveTo method

Benutzerdefinierte Kennung

Sie können der einen benutzerdefinierten Bezeichner übergeben DOCX Bei den folgenden Methoden wird dieser Wert an Ihren GrabzIt Python-Handler zurückgegeben. Diese benutzerdefinierte Kennung kann beispielsweise eine Datenbankkennung sein, mit der ein DOCX-Dokument einem bestimmten Datenbankeintrag zugeordnet werden kann.

from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.customId = "123456"

grabzIt.URLToDOCX("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.customId = "123456"

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.customId = "123456"

grabzIt.FileToDOCX("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

Kopf- und Fußzeilen

Um einem Word-Dokument eine Kopf- oder Fußzeile hinzuzufügen, können Sie anfordern, dass Sie eine bestimmte anwenden möchten Vorlage auf die DOCX generiert. Diese Vorlage muss sein saved im Voraus und gibt den Inhalt der Kopf- und Fußzeile zusammen mit speziellen Variablen an. Im folgenden Beispielcode verwendet der Benutzer eine von ihm erstellte Vorlage mit dem Namen "Meine Vorlage".

from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.templateId = "my template"

grabzIt.URLToDOCX("https://www.tesla.com", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.templateId = "my template"

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")
from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.templateId = "my template"

grabzIt.FileToDOCX("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")

HTML-Element in DOCX konvertieren

Wenn Sie nur ein HTML-Element wie div oder span direkt konvertieren möchten intEin Word-Dokument können Sie mit der Python-Bibliothek von GrabzIt erstellen. Sie müssen die CSS-Selektor des HTML-Elements, das Sie in das konvertieren möchten targetElement Methode von GrabzItDOCXOptions Klasse.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In diesem Beispiel möchten wir den gesamten Inhalt in dem Bereich erfassen, der die ID von hat ArticleDaher übergeben wir dies wie unten gezeigt an die GrabzIt-API.

from GrabzIt import GrabzItDOCXOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItDOCXOptions.GrabzItDOCXOptions()
options.targetElement = "#Article"

grabzIt.URLToDOCX("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx")