Tools zum Erfassen und Konvertieren des Webs
GrabzIt's Online-Community

Anfänger braucht Hilfe (ursprünglich im falschen Bereich gepostet)

Stellen Sie Fragen zur Verwendung des Screenshot-Tools von GrabzIt.

Hallo Gemeinde,

Bitte verzeihen Sie meine Unwissenheit. Ich bin ein Geschäftsmann, kein Techniker. Ich bin mir sicher, dass es in meinen Fragen durchscheinen wird.

Ist es möglich, die robusteren Auswahl- und Steuerungsparameter im Web Scrape-Tool zu verwenden, wie z. B. das URL-Muster (am kritischsten) und die Steuerungseinstellungen „Linien verfolgen“ mit dem Screenshot-Tool? Ich möchte lediglich eine Basis-URL und erweiterte Domänen von dieser URL crawlen, wobei die Tiefe des Crawls begrenzt ist. Mein Ziel besteht lediglich darin, Nachrichtenartikel aus einem bestimmten Domänensatz abzurufen. Ich würde es vorziehen, nur den Text als Ausgabe zu verwenden, aber ich kann damit leben, dass die Bilder im DOCX geliefert werden. Die Ausgabe des Screenshot-Tools ist für mich mit meinen Grundanforderungen großartig, aber die Auswahl- und Steuerungsfunktionen sind zu eingeschränkt. Ich müsste alle Subdomains und Artikelnamen kennen, um die Standardeingabe dieses Tools verwenden zu können, und das ist nicht realistisch.

Ich dachte, der Schaber wäre großartig und habe angefangen, ihn zu verwenden, aber dann habe ich schnell herausgefunden, dass die Preise und Einschränkungen für dieses Werkzeug beträchtlich sind! Aufgrund dieser Kostenstruktur ist es für mich nicht machbar, das zu nutzen.

Beachten Sie, dass ich eine Programmiererin habe, die Python schreibt und mit der API herumspielt, aber sie kennt sich mit diesem Tool nicht aus und wir haben Schwierigkeiten, klar miteinander über meine Erwartungen zu kommunizieren, daher mache ich mir Sorgen, dass ihre Arbeit in eine Richtung geht, die das tun wird für mich nicht optimal sein. Konkret habe ich ihr gesagt, dass ich die gleichen Eingabesteuerelemente wie beim Web Scraper haben möchte, außer für das Screeshot-Tool. aber ich glaube nicht, dass sie mein Problem versteht oder wertschätzt. Ist es möglich, die API zu nutzen, um die robusten Auswahlkriterien zu nutzen, ohne die wahnsinnig hohen Preise für Webcrapter zu zahlen?

Jede Anleitung würde sehr geschätzt werden.

Danke im Voraus!!!
Gefragt von Anonym am 1. Februar 2024

Gefragt von Anonym am 1. Februar 2024

Hallo,

Kein Problem, ich werde mein Bestes tun, um Ihre Fragen zu beantworten.

Im Allgemeinen ist ein Web-Scrape entweder auf eine Website oder ein URL-Muster beschränkt, andernfalls liegt es an der Natur der Website intDas Folgen von Links im Internet würde dazu führen, dass das Web-Scraping niemals endet.

Das Screenshot-Tool erstellt einmalig, nach einem Zeitplan oder bei Änderungen der Webseiten Screenshots von bestimmten URLs. Wenn Sie eine Liste von URLs haben, die Sie erfassen möchten, können Sie diese importieren into das Screenshot-Tool.

Mit der API können Sie Ihre eigene Logik verwenden, um einen Screenshot auszulösen. Für das, was Sie tun, benötigen Sie meiner Meinung nach eine Art benutzerdefinierten Web-Scraper, der die API auslöst. 

Hoffe das hilft.

Beantwortet vom GrabzIt-Support am 1. Februar 2024