Tools zum Erfassen und Konvertieren des Webs

Konvertieren Sie Webseiten und HTML in PDF

Python-API

Beim Konvertieren von Webseiten und HTML in PDF GrabzIt's Python API bietet die folgenden hilfreichen Funktionen integrate GrabzIt into Ihr System so einfach wie möglich. Bevor Sie jedoch anfangen, denken Sie daran, dass nach dem Aufruf der URLToPDF, HTMLToPDF or FileToPDF Methoden der Save or SaveTo Die Methode muss aufgerufen werden, um den PDF-Screenshot zu erstellen.

Grundlegende Optionen

Oft beim Konvertieren einer Webseite intIn einem PDF-Dokument werden viele Seiten erstellt, um die gesamte Webseite darzustellen. Es ist nur ein Parameter erforderlich, um eine Webseite zu konvertieren into ein PDF-Dokument oder nach HTML in PDF konvertieren wie in den folgenden Beispielen gezeigt.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

Benutzerdefinierte Kennung

Sie können der einen benutzerdefinierten Bezeichner übergeben PDF Bei den folgenden Methoden wird dieser Wert an Ihren GrabzIt Python-Handler zurückgegeben. Diese benutzerdefinierte Kennung kann beispielsweise eine Datenbankkennung sein, mit der ein Screenshot einem bestimmten Datenbankeintrag zugeordnet werden kann.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

Kopf- und Fußzeilen

Wenn Sie einen PDF-Screenshot erstellen, können Sie anfordern, dass Sie einen bestimmten anwenden möchten Vorlage zum generierten PDF. Diese Vorlage muss sein saved im Voraus und gibt den Inhalt der Kopf- und Fußzeile zusammen mit speziellen Variablen an. Im folgenden Beispielcode verwendet der Benutzer die Vorlage "Meine Vorlage".

Wenn der obere oder untere Rand für die Kopf- bzw. Fußzeile nicht groß genug ist, wird er nicht in der PDF-Datei angezeigt. Im folgenden Beispiel haben wir den oberen und unteren Rand auf 20 gesetzt, um ausreichend Platz zu schaffen.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

HTML-Element in PDF konvertieren

Wenn Sie nur ein HTML-Element wie div oder span direkt konvertieren möchten intEin PDF-Dokument können Sie mit der Python-Bibliothek von GrabzIt erstellen. Sie müssen die CSS-Selektor des HTML-Elements, das Sie in das konvertieren möchten targetElement Parameters.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In diesem Beispiel möchten wir den gesamten Inhalt in dem Bereich erfassen, der die ID von hat Article, daher übergeben wir dies wie unten gezeigt an GrabzIt.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Wie ein PDF beim Targeting eines HTML-Elements beschnitten wird, kann sein gesteuert mit diesen Techniken.