Wéi een e grousse Site krabbelt an Daten extrahéiert mat Screaming Frog's SEO Spider

Gejäiz Frog SEO Spider

Mir hëllefen e puer Clienten elo mat Marketo Migratiounen. Wéi grouss Firmen esou Enterprise-Léisunge benotzen, ass et wéi e Spannennetz, dat sech a Prozesser a Plattformen iwwer Joren ofweeft ... bis zum Punkt, datt d'Firmen net emol all Touchpoint wëssen.

Mat enger Enterprise Marketing Automatiséierungsplattform wéi Marketo, Forme sinn den Entréepunkt vun Daten u ganze Site a Landung Säiten. Firmen hunn dausende vu Säiten an Honnerte vu Formen op hire Site déi fir d'Aktualiséierung identifizéiert musse ginn.

E super Tool dofir ass Gejäiz Frog's SEO Spider... vläicht déi populärste Plattform um Maart fir ze krabbelen, ze iwwerpréiwen an Daten aus engem Site extrahéieren. D'Plattform ass Feature-Räich a bitt Honnerte vun Optiounen fir praktesch all Task déi Dir braucht.

Screaming Frog SEO Spider: Crawl And Extract

Eng Schlëssel Feature vu Screaming Frog SEO Spider ass datt Dir personaliséiert Extraktiounen ausféiere kënnt op Basis Regex, XPath, oder CSSPath Spezifizitéiten. Dëst kënnt extrem nëtzlech wéi mir de Site vun de Cliente wëllen duerchkucken an d'MunchkinID a FormId Wäerter vu Säiten iwwerpréiwen a fänken.

Mat dem Tool op Konfiguratioun> Benotzerdefinéiert> Extraktioun fir Elementer z'identifizéieren déi Dir extrahéiere wëllt.

schreiend Fro personaliséiert Extraktioun

Den Extraitbildschierm erlaabt praktesch onlimitéiert Datensammlung:

Screaming Frog SEO Spider Extraktioun Regelen

Regex, XPath, an CSSPath Extraktioun

Fir de MunchkinID ass den Identifizéierer am Formskript, deen an der Säit läit:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Mir passen dann a Regex Regel fir d'Id aus dem Skript Tag festzehalen, deen an d'Säit agefouert gëtt:

Regex: ["']id["']: *["'](.*?)["']

Fir d'Form ID sinn d'Donnéeën an engem Input Tag an der Marketo Form:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Mir uwenden eng XPath Regel fir d'Id ze erfaassen aus der Form déi an d'Säit agebaut ass. D'XPath Ufro sicht no enger Form mat engem Input mat engem Numm vun formidabel, da spuert d'Extraktioun den Wäert:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Javascript Rendering

Eng aner super Optioun vu Screaming Frog ass datt Dir net op den HTML op der Säit limitéiert sidd, Dir kënnt all JavaScript maachen, deen d'Formulairen op Ärem Site agefouert gëtt. Bannen Konfiguratioun> Spider, kënnt Dir op de Rendering Tab goen an dëst aktivéieren.

Screaming Frog SEO Spider Javascript Rendering

Dëst dauert e bësse méi laang fir de Site ze krauchen, natierlech, awer Dir kritt Formulairen déi Client-Säit vu JavaScript gemaach ginn, wéi och Formen déi agefouert ginn Server-Säit.

Och wann dëst eng ganz spezifesch Uwendung ass, ass et eng onheemlech nëtzlech wéi Dir mat grousse Site schafft. Dir wëllt onbedéngt Audit maachen, wou Är Formen am ganze Site agebett sinn.

Luet Screaming Frog SEO Spider erof

Wat denks du?

Dëse Site benotzt Akismet fir Spam ze reduzéieren. Léiert wéi Är Kommentarfaten veraarbecht ginn.