Tools zum Erfassen und Konvertieren des Webs

Konvertieren Sie URLs und HTML in DOCX

Ruby API

Hinzufügen der Fähigkeit, HTML oder Webseiten zu konvertieren into Word-Dokumente für Ihre Anwendung waren noch nie so einfach GrabzIt's Ruby API. Bevor Sie jedoch anfangen, denken Sie daran, dass nach dem Aufruf der url_to_docx, html_to_docx or file_to_docx Methoden der save or save_to Methode muss aufgerufen werden, um das DOCX tatsächlich zu erstellen.

Grundlegende Optionen

Das Erfassen von Webseiten als DOCX konvertiert die gesamte Webseite intEin Word-Dokument, das aus vielen Seiten bestehen kann. Es ist nur ein Parameter erforderlich, um eine Webseite zu konvertieren into ein Word Dokument oder nach HTML in DOCX konvertieren wie in den folgenden Beispielen gezeigt.

grabzItClient.url_to_docx("https://www.tesla.com")
# Then call the save or save_to method
grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>")
# Then call the save or save_to method
grabzItClient.file_to_docx("example.html")
# Then call the save or save_to method

Benutzerdefinierte Kennung

Sie können der einen benutzerdefinierten Bezeichner übergeben DOCX Bei den folgenden Methoden wird dieser Wert an Ihren GrabzIt Ruby-Handler zurückgegeben. Diese benutzerdefinierte Kennung kann beispielsweise eine Datenbankkennung sein, mit der ein DOCX-Dokument einem bestimmten Datenbankeintrag zugeordnet werden kann.

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.url_to_docx("https://www.tesla.com", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.customId = "123456"

grabzItClient.file_to_docx("example.html", options)
# Then call the save method
grabzItClient.save("http://www.example.com/handler/index")

Kopf- und Fußzeilen

Um einem Word-Dokument eine Kopf- oder Fußzeile hinzuzufügen, können Sie anfordern, dass Sie eine bestimmte anwenden möchten Vorlage auf die DOCX generiert. Diese Vorlage muss sein saved im Voraus und gibt den Inhalt der Kopf- und Fußzeile zusammen mit speziellen Variablen an. Im folgenden Beispielcode verwendet der Benutzer eine von ihm erstellte Vorlage mit dem Namen "Meine Vorlage".

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.url_to_docx("https://www.tesla.com", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.html_to_docx("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")
grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.templateId = "my template"

grabzItClient.file_to_docx("example.html", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")

HTML-Element in DOCX konvertieren

Wenn Sie nur ein HTML-Element wie div oder span direkt konvertieren möchten intEin Word-Dokument können Sie mit GrabzIt's Ruby Gem. Sie müssen die CSS-Selektor des HTML-Elements, das Sie in das konvertieren möchten targetElement Methode von DOCXOptions Klasse.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In diesem Beispiel möchten wir den gesamten Inhalt in dem Bereich erfassen, der die ID von hat ArticleDaher übergeben wir dies wie unten gezeigt an die GrabzIt-API.

grabzItClient = GrabzIt::Client.new("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzIt::DOCXOptions.new()
options.targetElement = "#Article"

grabzItClient.url_to_docx("http://www.bbc.co.uk/news", options)
# Then call the save or save_to method
grabzItClient.save_to("result.docx")