Eine häufige Aufgabe ist das Herunterladen von Bildern von einer Website mit GrabzIt's Web Scraper Das ist einfach. Erstellen Sie zunächst einen neuen Scrape mit den normalen Details wie der Startseite des Scrapes und anderen Optionen.
Dann geh zum Kratzanleitung Registerkarte und klicken Sie auf die Taste. Dies wird die eingeben
Page
Stichwort into die Kratzanleitung und öffnet ein Dropdown. Wählen getTagAttributes
von der Liste. Nächstes hinzufügen 'src'
Als ersten Parameter weist dies den Web Scraper an, das src-Attribut zu extrahieren und dann ein Komma einzugeben.
Klicken Sie anschließend auf die Schaltfläche Auf diese Weise können Sie dem Web Scraper mitteilen, aus welchen Elementen das src-Attribut extrahiert werden soll. Stellen Sie im Filterfenster sicher, dass der Typ auf "Webseite" eingestellt ist und die Einschränkung "Tag-Name" und "Gleich" lautet. Dann treten Sie ein
img
Klicken Sie im Textfeld auf die Schaltfläche Hinzufügen und dann auf die Schaltfläche Filter einfügen. Beenden Sie die Anweisung, indem Sie am Ende der Zeile ein Semikolon einfügen.
Sie sollten mit so etwas wie dem, was unten gezeigt wird, belassen werden.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
Der obige Code extrahiert alle Bild-URLs von der Webseite, aber wir müssen diese Bild-URLs jetzt verwenden, um save diese Bilder als Dateien. Dazu werden wir diesen Befehl abzüglich des Semikolons in ein Data.saveFile
Befehl. Gehen Sie dazu an den Zeilenanfang und wählen Sie die Taste. Dann in der Dropdown-Liste auswählen
saveFile
, dann gehe zum Ende der Zeile und füge a hinzu )
vor dem Semikolon.
Sie sollten jetzt die folgenden Anweisungen zum Schaben haben.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Wenn Sie nun den Scrape ausführen, werden alle Bilder von der Website extrahiert. Ein Großteil dieses Tutorials hätte auch mithilfe der Assistentenschaltfläche in der Symbolleiste mit den Kratzanweisungen durchgeführt werden können.