Tools zum Erfassen und Konvertieren des Webs

Extrahieren Sie Text aus Bildern

Oft können wichtige Textinformationen in Bildern gespeichert werden. jedoch GrabzIt's Web Scraper bietet die Möglichkeit, diese Informationen mithilfe der optischen Zeichenerkennung automatisch zu extrahieren. Obwohl dies eine Art künstlich ist intAus Sicherheitsgründen sind die Ergebnisse nicht immer perfekt.

Verwenden Sie zum Extrahieren von Text aus Bildern die Utility.Image.extractText Methode wie unten gezeigt.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

In diesen Beispielen werden alle Bild-URLs von der Webseite abgerufen und anschließend an die extractText-Methode übergeben, die versucht, Textdaten aus jedem Bild zu extrahieren, und alle Übereinstimmungen als Array von zurückgibt strings.

Wenn der Text im Bild in einer anderen Sprache angezeigt wird, müssen Sie den richtigen Sprachcode im Format mit zwei Buchstaben (ISO 639-1) wie unten gezeigt angeben.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');