Szűrők, faceted navigation és duplikált tartalom, a webshop SEO legsúlyosabb csapdái
Haladó

Szűrők, faceted navigation és duplikált tartalom, a webshop SEO legsúlyosabb csapdái

Megtanulod, mi a faceted navigation és miért okoz duplikált tartalmat, hogyan kezeld a szűrő URL-eket canonical tag és noindex segítségével, mikor érdemes szűrőoldalakat indexelni, és hogyan kerüld el a crawl budget elpazarlását.

7 perc olvasás·2026. március·Haladó

Mi a faceted navigation?

A faceted navigation az a rendszer, amellyel a látogatók szűkíthetik a terméklistát szín, méret, márka, ár, értékelés szerint.

A probléma: Minden egyes szűrőkombináció általában új URL-t hoz létre:

```
/cipok/futocipok/?szin=piros
/cipok/futocipok/?szin=piros&marka=nike
/cipok/futocipok/?szin=piros&marka=nike&ar=5000-10000
...
```

Egy 100 termékes, 5 szűrővel rendelkező kategória esetén akár 100 000+ URL keletkezhet, amelyek mindegyike nagyjából ugyanazt a tartalmat tartalmazza.

A duplikált tartalom hatása a SEO-ra:
- Elpazarolja a crawl budgetet, a Googlebot korlátozott időt tölt egy webhelyen
- Dilutálja a rangsorolási erőt, a Google nem tudja eldönteni, melyik URL-t rangsorolja
- Minőségi jelzés, sok gyenge oldal rontja az egész webhely megítélését

Megoldási stratégiák

1. Canonical tag, az alap megoldás

A canonical tag megmondja a Google-nek, hogy melyik az indexelendő verzió:

```html
<!-- A szűrt URL-en (pl. /cipok/?szin=piros) -->
<link rel="canonical" href="https://webshop.hu/cipok/futocipok/">
```

Mikor használd: Egyszerű szűrők (szín, ár), amelyekre nem keresnek önállóan.

2. Noindex meta tag

```html
<meta name="robots" content="noindex, follow">
```

Mikor használd: Kevésbé fontos szűrőkombinációknál (pl. ár szerint rendezve).

3. Robots.txt blokkolás

```
User-agent: *
Disallow: /cipok/?rendez=
Disallow: /cipok/?oldalonkent=
```

Figyelem: A robots.txt blokkolás NEM egyenértékű a noindex-szel! Fontos tartalomnál mindig noindex-et is alkalmazz.

4. JavaScript alapú szűrés (URL nélkül)

A modern webshopok JS alapú szűrőket alkalmaznak, ahol a szűrés az URL megváltoztatása nélkül történik. Ha nincs keresési igény a szűrt URL-ekre, ez az ideális megoldás.

Mikor érdemes szűrőoldalakat indexelni?

Nem minden szűrőoldal felesleges! Egyes szűrőkombinációkra saját keresési volumenük van:

  • /futocipok/nike/ → Nagy, "nike futócipő"
  • /futocipok/42-es-meret/ → Közepes, "futócipő 42-es méret"
  • /kavefozok/delonghi/ → Nagy, "delonghi kávéfőző"
  • /kavefozok/?szin=piros → Minimális, senki nem keres piros kávéfőzőre

Döntési keret:
1. Van-e önálló keresési volumen erre a szűrőre? (Google Keyword Planner, Ahrefs)
2. Ha igen → Indexeld, optimalizáld (egyedi H1, meta title, kis bevezető szöveg)
3. Ha nem → Canonical + noindex

Márka-alkategória oldalak

Ahelyett, hogy URL-paraméteres szűrőként kezeld (/cipok/?marka=nike), érdemes külön alkategória oldalakat létrehozni:
```
/cipok/nike-cipok/ ← Indexelt, optimalizált alkategória
/cipok/adidas-cipok/ ← Indexelt, optimalizált alkategória
```

Crawl budget menedzsment nagy webshopokban

A crawl budget azt jelenti, hogy a Google naponta/hetente csak korlátozott mennyiségű URL-t jár be. Nagy webshopokban (10 000+ URL) ez kritikus.

Crawl budget pazarlás jelei:
- Search Console → Lefedettség → Indexelt, de nem beküldött: rengeteg szűrő URL jelenik meg
- A fontos termékoldalak ritkán frissülnek a Google indexében
- Új termékek csak hetekkel megjelenésük után kerülnek be az indexbe

Megoldások:
- Robots.txt blokkolás a felesleges URL-típusokra
- Sitemap.xml csak az indexelendő URL-eket tartalmazza
- Belső linkek csak az értékes oldalakra mutassanak
- Canonical tag következetes alkalmazása

Gyakorlati példa magyar környezetben

Egy budapesti divatwebshop 2026 tavaszán szembesült a fazettás navigáció okozta problémával: a Search Console Lefedettség riportjában 18 000 URL-t láttak "indexelve, de nem beküldve" státuszban, amelyek szinte mind szűrőkombinációk voltak (/ruhak/?szin=piros&meret=38&marka=zara).

A megoldás lépései:
1. A fejlesztőcsapat robots.txt-ben blokkolta a ?szin=, ?meret= és ?rendez= URL-paramétereket.
2. Az összes fennmaradó szűrő URL-re canonical tag mutat a szűretlen kategóriaoldalra (pl. /ruhak/), ezzel kezelve a duplikált tartalmat.
3. A márkákhoz (Zara, H&M, Mango) egyedi alkategória oldalakat hoztak létre: /ruhak/zara/ – ezek indexelve, egyedi szöveggel, title taggel.
4. A Sitemap.xml-ből eltávolítottak 14 000 szűrő URL-t, és csak az 1800 értékes oldalt hagyták benne.

Eredmény 3 hónap után: a crawl budget felszabadult, a fontos termékoldalak 2-3 naponta frissülnek az indexben (korábban 2–3 hét volt), és a 4 márka-alkategória oldal bekerült az első 5 Google-találat közé a "zara ruha", "h&m ruhák online" kulcsszavakra.

Gyakori hibák, amiket érdemes elkerülni

  • Hiba: Robots.txt blokkolás canonical tag nélkül. A robots.txt megakadályozza a crawlolást, de ha a szűrt URL-ek belső linkeken keresztül is el vannak érve, a Google tudni fog az URL-ekről, csak nem tud bemenni. Együtt kell alkalmazni a robots.txt blokkolást és a canonical taget.
  • Hiba: Minden szűrőt noindex-szel kezelni. Egyes szűrőkombinációknak valódi keresési volumenük van (pl. "nike futócipő 42-es méret"). Ezeket érdemes indexelt, optimalizált alkategória oldalakká alakítani, nem noindex-szelni.
  • Hiba: Sitemap.xml-ben maradnak a szűrt URL-ek. Ha a Sitemap tartalmaz ezer szűrő URL-t, a Google azt feltételezi, hogy ezek fontosak, és ezekre pazarolja a crawl budgetet. A Sitemap-ból csak az indexelendő, értékes oldalak szerepeljenek.

Röviden

A fazettás navigáció (faceted navigation) szűrőkombinációkból keletkező URL-ek tömeges duplikált tartalmat hoznak létre, amelyek elpazarolják a crawl budgetet. A megoldás: canonical tag az egyszerű szűrőkre, noindex a kevésbé fontos kombinációkra, robots.txt blokkolás, és csak az értékes URL-ek a Sitemap.xml-ben. 2026-ban a Google a crawl budget menedzsmentet az e-commerce SEO egyik legfontosabb technikai tényezőjeként értékeli.

Következő lépések

  1. A Search Console Lefedettség riportjában ellenőrizd az "indexelve, de nem beküldve" és "kizárva" kategóriákat – ha sok szűrő URL-t látsz, azonnali beavatkozás szükséges.
  2. Azonosítsd, mely szűrőid rendelkeznek önálló keresési volumennel (pl. márka-szűrők), és alakítsd őket alkategória oldalakká.
  3. Tisztítsd meg a Sitemap.xml-t: csak az indexelendő, értékes URL-ek maradjanak benne.

👉 Publisher-csomag megismerése

Gyakran ismételt kérdések

Mi a különbség a canonical tag és a noindex között szűrőoldalaknál?

A canonical tag azt mondja a Google-nek, melyik URL az "eredeti" – az indexbe a kanonikus URL kerül, a szűrt verzió nem. A noindex azt mondja, hogy az adott URL egyáltalán ne kerüljön az indexbe. A canonical-t akkor érdemes, ha a szűrt oldal tartalma szinte ugyanaz, mint az alapoldal. A noindex-et ott, ahol az oldalt el kell érni a felhasználónak, de nem akarod az indexbe.

Hogyan tudom, hogy mennyi szűrő URL indexelődött?

A Search Console Lefedettség riportjában az "indexelt" URL-ek száma megmutatja, mi van az indexben. A Screaming Frog és az Ahrefs Site Audit segít azonosítani a szűrőkombinációkból keletkező URL-eket. A Google Search-ben a "site:webshop.hu/?szin=" lekérdezés közelítő képet ad.

JavaScript-alapú szűréssel megoldódik a probléma?

Igen, ha a szűrés URL-változtatás nélkül, csak JS-sel történik, nincs szűrt URL, amelyet a Google indexelhetne. Ez a legtisztább megoldás, de csak akkor alkalmazható, ha az adott szűrőkombinációkra nincs önálló keresési volumen.

Kapcsolódó tananyagok

Hasznos volt ez a cikk?

Nem találod a választ?

Ezt automatikusan megcsináljuk helyetted

Publicator AI · SEO és GEO autopilot