Crawler: Porovnání verzí

Aktuální verze z 2. 3. 2014, 02:11

Crawler je automaticky skript (robot), jehož úkolem je získávat data z webu, která jsou následně zpracovávána.

Robot vyhledávače se nazývají Web crawler, někdy také internet bot či web spider. Účelem je jejich indexace.

Každý crawler by měl dodržovat určité zásady a také se náležitě identifikovat pomocí User-agent v HTTP požadavku.

AhrefsBot - robot Seo nástroje Ahrefs.
Alexa Crawler - crawler Alexa.
archive.org_bot - crawler projektu Archive.org.
Baiduspider - tento robot je součástí projektů společnosti Baidu.
Bingbot - získává data pro vyhledávač Bing od společnosti Microsoft.
FacebookExternalHit - v momentě, kdy nějaký uživatel Facebook odkáže na internetovou stránku, je tato stránka navštívena tímto robotem a následně vytvořen náhled.
Googlebot - získává výsledky pro vyhledávač Google.
Google Feedfetcher - tento pod má za úkol procházet RSS a ATOM feedy, kdykoliv si je uživatel přidá na domovskou stránku Google anebo do Google Reader.
SeznamBot - získává data pro vyhledávač Seznam.
Yahoo! Slurp - crawler společnosti Yahoo! než jí přebral Microsoft. Jeho funkci pak nahradil Bingbot.
YandexBot - získává data pro ruský vyhledávač Yandex.

@@ Řádka 1: / Řádka 1: @@
 '''Crawler''' je automaticky skript (robot), jehož úkolem je získávat data z webu, která jsou následně zpracovávána.
-Robot vyhledávače se nazývají ''Web crawler'', někdy také ''internet bot' či ''web spider''. Účelem je jejich [[indexace]].
+Robot vyhledávače se nazývají ''Web crawler'', někdy také ''internet bot'' či ''web spider''. Účelem je jejich [[indexace]].
 == Seznam robotů vyhledávačů ==