Tools zum Erfassen und Konvertieren des Webs

Konvertieren Sie URLs und HTML in DOCX

Java API

Hinzufügen der Fähigkeit, HTML oder Webseiten zu konvertieren into Word-Dokumente für Ihre Anwendung waren noch nie so einfach GrabzIt's Java API. Bevor Sie jedoch anfangen, denken Sie daran, dass nach dem Aufruf der URLToDOCX, HTMLToDOCX or FileToDOCX Methoden der Save or SaveTo Methode muss aufgerufen werden, um das DOCX tatsächlich zu erstellen.

Grundlegende Optionen

Das Erfassen von Webseiten als DOCX konvertiert die gesamte Webseite intEin Word-Dokument, das aus vielen Seiten bestehen kann. Es ist nur ein Parameter erforderlich, um eine Webseite zu konvertieren into ein Word Dokument oder nach HTML in DOCX konvertieren wie in den folgenden Beispielen gezeigt.

grabzIt.URLToDOCX("https://www.tesla.com");
//Then call the Save or SaveTo method
grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>");
//Then call the Save or SaveTo method
grabzIt.FileToDOCX("example.html");
//Then call the Save or SaveTo method

Benutzerdefinierte Kennung

Sie können der einen benutzerdefinierten Bezeichner übergeben DOCX Bei den folgenden Methoden wird dieser Wert an Ihren GrabzIt Java-Handler zurückgegeben. Diese benutzerdefinierte Kennung kann beispielsweise eine Datenbankkennung sein, mit der ein DOCX-Dokument einem bestimmten Datenbankeintrag zugeordnet werden kann.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setCustomId("123456");

grabzIt.URLToDOCX("https://www.tesla.com", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setCustomId("123456");

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setCustomId("123456");

grabzIt.FileToDOCX("example.html", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");

Kopf- und Fußzeilen

Um einem Word-Dokument eine Kopf- oder Fußzeile hinzuzufügen, können Sie anfordern, dass Sie eine bestimmte anwenden möchten Vorlage auf die DOCX generiert. Diese Vorlage muss sein saved im Voraus und gibt den Inhalt der Kopf- und Fußzeile zusammen mit speziellen Variablen an. Im folgenden Beispielcode verwendet der Benutzer eine von ihm erstellte Vorlage mit dem Namen "Meine Vorlage".

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTemplateId("my template");

grabzIt.URLToDOCX("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTemplateId("my template");

grabzIt.HTMLToDOCX("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTemplateId("my template");

grabzIt.FileToDOCX("example.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");

HTML-Element in DOCX konvertieren

Wenn Sie nur ein HTML-Element wie div oder span direkt konvertieren möchten intEin Word-Dokument können Sie mit der ASP.NET-Bibliothek von GrabzIt erstellen. Sie müssen die CSS-Selektor des HTML-Elements, das Sie in das konvertieren möchten setTargetElement Methode von DOCXOptions Klasse.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In diesem Beispiel möchten wir den gesamten Inhalt in dem Bereich erfassen, der die ID von hat ArticleDaher übergeben wir dies wie unten gezeigt an die GrabzIt-API.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

DOCXOptions options = new DOCXOptions();
options.setTargetElement("#Article");

grabzIt.URLToDOCX("http://www.bbc.co.uk/news", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.docx");