Tools zum Erfassen und Konvertieren des Webs

So extrahieren Sie automatisch strukturierte Informationen aus unstrukturiertem Text

Normaler geschriebener Text kann viele Informationen enthalten, die nicht einfach zu extrahieren sind. Zum Beispiel ein Satz, vielleicht eine Rezension über ein Unternehmen, aber woher wissen Sie, ob es eine gute oder eine schlechte Rezension ist?

Ein normaler Web Scraper kann diese Informationen nicht extrahieren. GrabzIt kann jedoch mithilfe seiner Fähigkeiten zur Verarbeitung natürlicher Sprache erstellt werden. Wie im folgenden Beispiel gezeigt, wird der Seitentext analysiert und gibt einen der folgenden Werte zurück: Sehr negativ, Negativ, Neutral, Positiv und Sehr positiv.

Data.save(Utility.Text.extractSentiment(Page.getText()), 'Dataset', 'Sentiment');

Obwohl GrabzIt's Web Scraper kann viel mehr aus Text extrahieren, einschließlich Spracherkennung, Namen von Standorten, Namen von Personen und Namen von Organisationen. Beispiele dafür sind unten aufgeführt.

//Language Detection
Data.save(Utility.Text.extractLanguageName(Page.getText()), 'Dataset', 'Language');
//Identify Geographic Locations
Data.save(Utility.Text.extractLocations(Page.getText()), 'Dataset', 'Locations');
//Identify People's Names
Data.save(Utility.Text.extractNames(Page.getText()), 'Dataset', 'Names');
//Identify Organizations Names
Data.save(Utility.Text.extractOrganizations(Page.getText()), 'Dataset', 'Organizations');

Sie müssen keine dieser Scrap-Anweisungen selbst schreiben, da sie automatisch angezeigt werden, wenn Sie ein zutreffendes HTML-Element in unserem Scraper-Assistenten auswählen.