Screaming Frog je populární program, který dokáže projít celý web a přehledně vypsat klíčové atributy jednotlivých stránek. Jednoduše tak zjistíte, které meta tagy jsou na webu, přesměrování stránek, nadpisy a spoustu dalšího. Ne tak známá je možnost zjistit i specificky definované parametry, jako je například kód zboží. To si ukážeme níž.
Program si můžete stáhnout na webu Screaming frog. S omezenou funkcionalitou je zdarma, i tak vám ale pomůže se spoustou věcí.
Nejdřív si definujeme, jaký prvek chceme z webu dostat. Na příkladu níž chceme získat ID všech produktů – ať už z našeho webu, nebo z webu konkurence.
Procházet ručně celý web by bylo na hodně dlouhou dobu, pustíme proto Screaming Frog. Abychom byli schopní získat ID produktu, musíme ho definovat. V hlavní liště budeme postupovat přes záložky Configuration >> Custom >> Extraction.
V nově otevřeném okně si pojmenujeme extraktor, např. ID_produkt a vybere volbu XPath.
Leckoho to odradí, protože – přiznejme si to – pokud člověk není programátor, pojem XPath mu moc neříká. Naštěstí ale existuje jednoduchý způsob, jak získat XPath.
Použijeme prohlížeč Google Chrome – na webu klikneme pravým tlačítkem na prvek, který nás zajímá. V tomto případě ID produktu. A vybereme možnost „Prozkoumat“.
Otevře se nám konzole s konkrétním prvkem, který jsme si vybrali v minulém kroku. V horní části uvidíme označený prvek, ten se při najetí myší zvýrazní i na webu.
Pak v horní části znovu klikneme pravým tlačítkem na konkrétní prvek, vybereme „Copy“ a následně „XPath“.
Do schránky se nám zkopíruje přesná XPath. Tu pak vložíme do Screaming Frogu.
Nastavení extraktoru pak uložíme. Následně vložíme URL adresu home page webu, ze kterého chceme získat data do Screaming Frogu, a spustíme procházení webu.
Screaming Frog začne procházet stránku po stránce a jakmile najde informaci, kterou jsme si definovali v extraktoru, uloží ji do výsledků. Nejjednodušší způsob, jak se k těmto datům dostat, je přepnout na záložku „Custom“ a vybrat „Extraction“.
Jakmile Screaming Frog projde celý web, získáme seznam URL a ID produktů, které na nich jsou.
Pak už si soubor můžete exportovat do Excelu a dál s ním pracovat. Poměrně jednoduše tak získáte konkrétní informace z vašeho, případně i z cizího e-shopu.
Autor: Radim Kracík, Effectix
Napsat komentář