GoogleBot: Porovnání verzí
(Založena nová stránka: '''GoogleBot''' je robot (crawler), jehož úkolem je procházet internet a sbírat dokumenty. Jakmile je získá, předá jej dále, kde po zpracování a nakonec i…) |
(→Omezení) |
||
(Nejsou zobrazeny 2 mezilehlé verze od stejného uživatele.) | |||
Řádka 5: | Řádka 5: | ||
Předpokládá se, že dokáže spouštět [[javascript]], tak aby měl přehled, co se na stránce nachází a v jakém rozložení. Google ovšem trvá na tom, že tato schopnost je značně limitována a neměli bychom na ní spoléhat. Proběhlo několik testů, které prokázali dokonce, že bere v potaz [[Ajax]]. | Předpokládá se, že dokáže spouštět [[javascript]], tak aby měl přehled, co se na stránce nachází a v jakém rozložení. Google ovšem trvá na tom, že tato schopnost je značně limitována a neměli bychom na ní spoléhat. Proběhlo několik testů, které prokázali dokonce, že bere v potaz [[Ajax]]. | ||
− | + | == Jak se na stránku může dostat GoogleBot == | |
Nejčastěji je to z [[odkaz|odkazu]], který se nachází na jiné stránce, kde je už indexována. | Nejčastěji je to z [[odkaz|odkazu]], který se nachází na jiné stránce, kde je už indexována. | ||
Řádka 19: | Řádka 19: | ||
* pokud někdo vaši stránku nasdílí přes [[Google plus]]. Zde je ovšem nutno podotknout, že v podstatě vznikne odkaz i když má atribut [[nofollow]]. | * pokud někdo vaši stránku nasdílí přes [[Google plus]]. Zde je ovšem nutno podotknout, že v podstatě vznikne odkaz i když má atribut [[nofollow]]. | ||
* když je registrována nová doména (testy tuto teorii neprokázali). | * když je registrována nová doména (testy tuto teorii neprokázali). | ||
+ | |||
+ | == Omezení == | ||
+ | Googlebot má určitá technická omezení. | ||
+ | * Maximální množství stažených dat na jedné stránce je 10 MB |
Aktuální verze z 6. 7. 2015, 10:53
GoogleBot je robot (crawler), jehož úkolem je procházet internet a sbírat dokumenty. Jakmile je získá, předá jej dále, kde po zpracování a nakonec i zařazeny do vyhledávání (do indexu).
GoogleBot se identifikuje pomocí user-agent jako googlebot. Google jednou za čas mění IP adresu z které na stránky přistupuje.
Předpokládá se, že dokáže spouštět javascript, tak aby měl přehled, co se na stránce nachází a v jakém rozložení. Google ovšem trvá na tom, že tato schopnost je značně limitována a neměli bychom na ní spoléhat. Proběhlo několik testů, které prokázali dokonce, že bere v potaz Ajax.
Jak se na stránku může dostat GoogleBot
Nejčastěji je to z odkazu, který se nachází na jiné stránce, kde je už indexována.
Stránky, na které nevede žádný odkaz by měl majitel přidat do fronty na procházení GoogleBotem manuálně a to:
- Přes formulář na adrese https://www.google.com/webmasters/tools/submit-url.
- Přidáním sitemap do Google Webmaster Tools.
Nepotvrzené metody
Mnoho majitelů stránek, nikdy stránky do Google nepřidali a přesto se na nich ukázal GoogleBot. Proto vzniklo hned několik spíše konspiračních teorii.
Google se o nových stránkách dozví:
- z Google Analytics a Google AdSense.
- pokud někdo vaši stránku nasdílí přes Google plus. Zde je ovšem nutno podotknout, že v podstatě vznikne odkaz i když má atribut nofollow.
- když je registrována nová doména (testy tuto teorii neprokázali).
Omezení
Googlebot má určitá technická omezení.
- Maximální množství stažených dat na jedné stránce je 10 MB