Index-túlhízás (index bloat)
Szakértő

Index-túlhízás (index bloat)

Az index-túlhízás, amikor túl sok alacsony értékű oldalad kerül a Google indexébe (pl. szűrő-URL-ek, üres oldalak). Hígítja a webhely megítélését és pazarolja a crawl-keretet.

2 perc olvasás·2026. június·Szakértő

Mi az index-túlhízás?

Az index-túlhízás (index bloat) az, amikor túl sok, alacsony értékű oldalad kerül a Google indexébe: végtelen szűrő- és paraméteres URL-ek, belső keresési találatok, üres vagy közel duplikált oldalak, régi tag-archívumok.

Miért probléma és mi a megoldás?

Sok gyenge indexelt oldal hígítja a webhely összképét a Google szemében, és pazarolja a crawl-keretet. Megoldás: a nem értékes oldalak noindex-elése vagy kizárása, a duplikációk canonical-lal kezelése, és csak a valóban hasznos oldalak indexelése. A GSC „Oldalak" jelentése segít felderíteni a felesleget.

Az index-túlhízás 2026-ban különösen aktuális, mivel a Google AI Overviews bevezetésével az indexelt oldalak minőségére még erősebben figyel az algoritmus. Ha az oldalad indexébe sok gyenge oldal kerül be, az csökkenti az esélyét annak, hogy az értékes tartalmaid az AI-összefoglalókban megjelenjenek. A Screaming Frog, a Sitebulb vagy a Google Search Console „Oldalak" jelentése segít feltérképezni az indexelt oldalak számát és minőségét. Rendszeres audittal — legalább negyedévente — tartsd kézben az indexelési állapotot, különösen e-kereskedelmi webhelyeknél, ahol a szűrők és kombinációk könnyen többezer felesleges URL-t generálhatnak.

Gyakorlati példa magyar környezetben

Egy pécsi lakberendezési webshop SEO-auditja során kiderült, hogy a 4 200 termékoldal mellé a szűrők (szín, méret, anyag kombinációk) további 38 000 paraméteres URL-t generáltak, amelyek mindegyike indexelve volt. A Google Search Console-ban a „Nem indexelt oldalak" száma folyamatosan nőtt, a crawl-keret pedig nagyrészt ezekre a felesleges oldalakra forgott. A megoldás: a szűrő-URL-ekre robots.txt-ben Disallow, a maradék szűrőoldalakra noindex meta tag, a kanonikus URL-ek beállítása. Az intézkedések után 6 héttel a GSC-ben az indexelt oldalak száma 4 400-ra csökkent, a fő termékoldalak pozíciói átlagosan 4,2 hellyel javultak, és a Googlebot naponta kétszer akkora arányban crawlolta az értékes tartalmakat.

Hogyan kapcsolódik más fogalmakhoz?

Az index-túlhízás szorosan összefügg az Indexelés (indexing) folyamatával: minél több gyenge oldal kerül az indexbe, annál nehezebb a Google számára meghatározni az oldal fő témáját. A Noindex tag az elsődleges eszköz a nem kívánt oldalak indexből való kizárására — ezt érdemes kombinálni a Sitemap index gondos karbantartásával, hogy csak a valóban értékes URL-ek szerepeljenek a sitemapban. A Query fan-out szempontjából is kritikus: ha az AI-keresőrendszer felhígított tematikájú webhelyet talál, kisebb valószínűséggel szerepelteti az AI Overviews-ban. Az Entitás (entity) alapú SEO-stratégiában az index tisztasága segíti a webhely entitásautoritásának növelését.

Gyakori hibák, amiket érdemes elkerülni

  • Szűrő-URL-ek kizárásának elmulasztása: Az e-kereskedelmi webhelyeken a szín, méret és árszűrők kombinációi exponenciálisan növelik az indexelt oldalak számát. Ha ezeket nem zárják ki robots.txt-tel vagy noindex taggel, hamar tízezer felesleges URL jelenik meg az indexben.
  • Régi tag- és kategóriaarchívumok benn hagyása: Törölt termékek, megszűnt kampányoldalak és üres kategóriák indexben tartása pazarolja a crawl-keretet és hígítja a weboldal témafókuszát a Google szemében.
  • Canonical URL helytelen beállítása: Ha a paraméterezett URL-ek canonical tagje önmagukra mutat ahelyett, hogy a kanonikus oldalra mutatna, a Google mind a két verziót indexelhetőnek tekinti, ami duplikációt és index-túlhízást okoz.

Röviden

Az index-túlhízás az, amikor a Google indexébe túl sok alacsony értékű oldal kerül be, pazarolva a crawl-keretet és hígítva a webhely témafókuszát. Megoldás: noindex, canonical URL-ek és a sitemap gondos karbantartása. 2026-ban az AI-keresők értékeléséhez tiszta index szükséges.

Gyakran ismételt kérdések

Mi okozza az index-túlhízást?

Leggyakrabban az e-kereskedelmi webhelyeken a szűrő- és paraméteres URL-ek, a belső keresési találatoldalak, az üres kategóriák és a duplikált tartalmak. Ezek tömegesen generálnak alacsony értékű, de indexelt oldalakat.

Hogyan derül ki, hogy az oldalamon index-túlhízás van?

A Google Search Console „Oldalak" jelentésében ellenőrizd az indexelt oldalak számát, és hasonlítsd össze a valóban értékes oldalak számával. Ha az indexelt oldalak száma sokszorosát teszi ki az értékes oldalaknak, index-túlhízás gyanús.

Elegendő a noindex tag a probléma megoldásához?

A noindex tag az elsődleges eszköz, de önmagában nem elég. Kombinálni kell canonical URL-ekkel, a sitemap gondos karbantartásával és robots.txt-beli kizárásokkal. Az intézkedések után hetek-hónapok telhetnek el, amíg a Google eltávolítja az érintett oldalakat az indexből.

Kapcsolódó tananyagok

Hasznos volt ez a cikk?

Nem találod a választ?

Ezt automatikusan megcsináljuk helyetted

Publicator AI · SEO és GEO autopilot