Screaming frog – vytáhněte z webů jakákoliv data

()

Screaming Frog je populární program, který dokáže projít celý web a přehledně vypsat klíčové atributy jednotlivých stránek. Jednoduše tak zjistíte, které meta tagy jsou na webu, přesměrování stránek, nadpisy a spoustu dalšího. Ne tak známá je možnost zjistit i specificky definované parametry, jako je například kód zboží. To si ukážeme níž.


Program si můžete stáhnout na webu Screaming frog. S omezenou funkcionalitou je zdarma, i tak vám ale pomůže se spoustou věcí.

Nastavení Screaming Frogu

Nejdřív si definujeme, jaký prvek chceme z webu dostat. Na příkladu níž chceme získat ID všech produktů – ať už z našeho webu, nebo z webu konkurence.

Screenshot_1

Procházet ručně celý web by bylo na hodně dlouhou dobu, pustíme proto Screaming Frog. Abychom byli schopní získat ID produktu, musíme ho definovat. V hlavní liště budeme postupovat přes záložky Configuration >> Custom >> Extraction.

Screenshot_2

V nově otevřeném okně si pojmenujeme extraktor, např. ID_produkt a vybere volbu XPath.

Screenshot_4

Leckoho to odradí, protože – přiznejme si to – pokud člověk není programátor, pojem XPath mu moc neříká. Naštěstí ale existuje jednoduchý způsob, jak získat XPath.

Získání XPath

Použijeme prohlížeč Google Chrome – na webu klikneme pravým tlačítkem na prvek, který nás zajímá. V tomto případě ID produktu. A vybereme možnost „Prozkoumat“.

Screenshot_5

Otevře se nám konzole s konkrétním prvkem, který jsme si vybrali v minulém kroku. V horní části uvidíme označený prvek, ten se při najetí myší zvýrazní i na webu.

Screenshot_6

Pak v horní části znovu klikneme pravým tlačítkem na konkrétní prvek, vybereme „Copy“ a následně „XPath“.

Screenshot_7

Do schránky se nám zkopíruje přesná XPath. Tu pak vložíme do Screaming Frogu.

Screenshot_8

Crawling webu

Nastavení extraktoru pak uložíme. Následně vložíme URL adresu home page webu, ze kterého chceme získat data do Screaming Frogu, a spustíme procházení webu.

Screenshot_9

Screaming Frog začne procházet stránku po stránce a jakmile najde informaci, kterou jsme si definovali v extraktoru, uloží ji do výsledků. Nejjednodušší způsob, jak se k těmto datům dostat, je přepnout na záložku „Custom“ a vybrat „Extraction“.

Screenshot_10

Jakmile Screaming Frog projde celý web, získáme seznam URL a ID produktů, které na nich jsou.

Screenshot_11

Pak už si soubor můžete exportovat do Excelu a dál s ním pracovat. Poměrně jednoduše tak získáte konkrétní informace z vašeho, případně i z cizího e-shopu.

Autor: Radim Kracík, Effectix

Jak se vám článek líbí?

Pro hodnocení klikněte na hvězdičku

Průměrné hodnocení / 5. Počet hodnocení:

Zatím žádné hodnocení. Buďte první!

Navigace pro příspěvek

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Odesláním zprávy souhlasíte s podmínkami ochrany osobních údajů