Tools zum Erfassen und Konvertieren des Webs

So extrahieren Sie automatisch strukturierte Informationen aus unstrukturiertem Text

Normaler geschriebener Text kann viele Informationen enthalten, die nicht einfach zu extrahieren sind. Zum Beispiel ein Satz, vielleicht eine Rezension ├╝ber ein Unternehmen, aber woher wissen Sie, ob es eine gute oder eine schlechte Rezension ist?

Ein normaler Web Scraper kann diese Informationen nicht extrahieren. GrabzIt kann jedoch mithilfe seiner F├Ąhigkeiten zur Verarbeitung nat├╝rlicher Sprache erstellt werden. Wie im folgenden Beispiel gezeigt, wird der Seitentext analysiert und gibt einen der folgenden Werte zur├╝ck: Sehr negativ, Negativ, Neutral, Positiv und Sehr positiv.

Data.save(Utility.Text.extractSentiment(Page.getText()), 'Dataset', 'Sentiment');

Obwohl GrabzIt's Web Scraper kann viel mehr aus Text extrahieren, einschlie├člich Spracherkennung, Namen von Standorten, Namen von Personen und Namen von Organisationen. Beispiele daf├╝r sind unten aufgef├╝hrt.

//Language Detection
Data.save(Utility.Text.extractLanguageName(Page.getText()), 'Dataset', 'Language');
//Identify Geographic Locations
Data.save(Utility.Text.extractLocations(Page.getText()), 'Dataset', 'Locations');
//Identify People's Names
Data.save(Utility.Text.extractNames(Page.getText()), 'Dataset', 'Names');
//Identify Organizations Names
Data.save(Utility.Text.extractOrganizations(Page.getText()), 'Dataset', 'Organizations');

Sie m├╝ssen keine dieser Scrap-Anweisungen selbst schreiben, da sie automatisch angezeigt werden, wenn Sie ein zutreffendes HTML-Element in unserem Scraper-Assistenten ausw├Ąhlen.