Googlebot (keresőrobot)
Kezdő

Googlebot (keresőrobot)

A Googlebot a Google keresőrobotja, amely bejárja (crawlolja) a weboldalakat, hogy felfedezze és feldolgozza a tartalmukat az indexeléshez. A SEO első lépése, hogy ő elérje az oldaladat.

2 perc olvasás·2026. június·Kezdő

Mi az a Googlebot?

A Googlebot a Google automatikus keresőrobotja (crawler), amely linkről linkre haladva bejárja a web oldalait, letölti a tartalmukat, és továbbítja feldolgozásra és indexelésre. Hasonló robotjai vannak az AI-keresőknek is (pl. GPTBot, PerplexityBot).

Miért számít?

Ha a Googlebot nem éri el vagy nem tudja értelmezni az oldaladat (pl. robots.txt blokk, vagy a tartalom csak JavaScript-futtatás után jelenik meg), akkor az nem kerül be a keresőbe. Épp ezért fontos a szerver által olvasható HTML, ezt biztosítja a Tudástár prerender-megoldása is.

A Googlebot rendszeres időközönként visszatér az oldalakra (recrawl), hogy észlelje a frissítéseket. A crawl-frekvencia függ az oldal népszerűségétől, az oldal sebességétől és a szerver teljesítményétől. 2026-ban a Google egyre inkább az indexelés minőségét helyezi előtérbe: ha sok hibás, lassú vagy blokolt oldalt talál, csökkenti a crawl-aktivitást. A robots.txt helyes beállításával jelzed, mely területeket szabad bejárni, míg a sitemapben felsorolod a legfontosabb URL-eket. A GPTBot (AI-crawler) és más AI-robotok hasonló elven működnek, de külön irányíthatók.

Gyakorlati példa magyar környezetben

Egy miskolci online bútorkereskedés 4 200 termékoldalát nem lehetett megtalálni a Google-ban. A Search Console „Felfedezve – jelenleg nincs indexelve" státuszt mutatott több száz termékre. Az audit kiderítette, hogy a webshop szűrőkombinációi ~18 000 paraméteres URL-t generáltak, és ezek szinte az összes Googlebot-látogatást felszívták. A fejlesztő bevezette a `rel=canonical` jelölést a szűrt oldalakon, a felesleges paramétereket pedig kizárta a robots.txt-ből. Három hónap alatt az indexelt termékoldalak száma 1 100-ról 3 900-ra nőtt, az organikus forgalom pedig 62%-kal emelkedett. A crawl budget helyes kezelése tehát közvetlen bevételnövekedéshez vezetett.

Hogyan kapcsolódik más fogalmakhoz?

A Googlebot működése szorosan összefügg a teljes indexelési láncal. Az indexelés (indexing) a crawling logikus folytatása: amit a Googlebot letölt, azt a Google feldolgozza és beemeli a keresési indexbe. A canonical URL (kanonikus cím) jelölés segít elkerülni, hogy a robot ugyanannak az oldalnak több verzióját bejárja és duplikátumként kezelje. Az entitás (entity) fogalma azért releváns, mert a Googlebot nemcsak HTML-szöveget gyűjt, hanem strukturált adatot is, amelyből a Knowledge Graph entitásai épülnek. A query fan-out mechanizmus is a jól indexelt oldalakra támaszkodik: az AI-kereső csak azt a tartalmat tudja felhasználni válaszgeneráláshoz, amit a Googlebot korábban sikeresen bejárt és indexelt.

Gyakori hibák, amiket érdemes elkerülni

  • robots.txt túlzott blokkolása: Véletlenül kizársz fontos aloldalakat (pl. /termekek/), ezért azok soha nem kerülnek indexbe. Ellenőrizd a Search Console Feltérképezési lefedettség riportját.
  • JavaScript-függő tartalom: Ha a főtartalom csak JS-render után jelenik meg, a Googlebot az üres HTML-t indexeli. Használj szerver oldali renderelést (SSR) vagy prerenderelést.
  • Felesleges paraméteres URL-ek: Szűrők, rendezési opciók, munkamenet-azonosítók pazarolják a crawl budgetet. Canonical jelöléssel vagy robots.txt-tel zárd ki őket.

Röviden

A Googlebot a Google keresőrobotja, amely linkről linkre haladva bejárja és letölti a weboldalak tartalmát az indexeléshez. Ha nem éri el az oldaladat – rossz robots.txt, lassú szerver vagy JS-függő tartalom miatt –, az nem jelenik meg a keresési eredményekben. Gondoskodj arról, hogy a fontos oldalak elérhetők legyenek a robot számára.

Gyakran ismételt kérdések

Milyen gyakran járja be a Googlebot az oldalamat?

A frekvencia az oldal népszerűségétől és frissítési ütemétől függ. Népszerű oldalakat naponta, kisebb oldalakat hetente-havonta látogat.

Meg tudom akadályozni, hogy a Googlebot bizonyos oldalakat bejárjon?

Igen, a robots.txt fájlban Disallow direktívával, vagy az adott oldal meta robots tagján a "noindex, nofollow" értékekkel.

Ha blokkolom a Googlebotot, az rontja a rangsort?

Ha blokkolt oldal korábban indexelt volt, idővel eltűnik a találatok közül. A nem indexelt oldalak nem szerepelhetnek a keresőben.

Kapcsolódó tananyagok

Hasznos volt ez a cikk?

Nem találod a választ?

Ezt automatikusan megcsináljuk helyetted

Publicator AI · SEO és GEO autopilot