Szűrők, faceted navigation és duplikált tartalom, a webshop SEO legsúlyosabb csapdái

Haladó

Szűrők, faceted navigation és duplikált tartalom, a webshop SEO legsúlyosabb csapdái

Megtanulod, mi a faceted navigation és miért okoz duplikált tartalmat, hogyan kezeld a szűrő URL-eket canonical tag és noindex segítségével, mikor érdemes szűrőoldalakat indexelni, és hogyan kerüld el a crawl budget elpazarlását.

7 perc olvasás·2026. március·Haladó

A faceted navigation az a rendszer, amellyel a látogatók szűkíthetik a terméklistát szín, méret, márka, ár, értékelés szerint.

A probléma: Minden egyes szűrőkombináció általában új URL-t hoz létre:

```
/cipok/futocipok/?szin=piros
/cipok/futocipok/?szin=piros&marka=nike
/cipok/futocipok/?szin=piros&marka=nike&ar=5000-10000
...
```

Egy 100 termékes, 5 szűrővel rendelkező kategória esetén akár 100 000+ URL keletkezhet, amelyek mindegyike nagyjából ugyanazt a tartalmat tartalmazza.

A duplikált tartalom hatása a SEO-ra:
- Elpazarolja a crawl budgetet, a Googlebot korlátozott időt tölt egy webhelyen
- Dilutálja a rangsorolási erőt, a Google nem tudja eldönteni, melyik URL-t rangsorolja
- Minőségi jelzés, sok gyenge oldal rontja az egész webhely megítélését

Megoldási stratégiák

1. Canonical tag, az alap megoldás

A canonical tag megmondja a Google-nek, hogy melyik az indexelendő verzió:

```html

<link rel="canonical" href="https://webshop.hu/cipok/futocipok/">
```

Mikor használd: Egyszerű szűrők (szín, ár), amelyekre nem keresnek önállóan.

2. Noindex meta tag

```html
<meta name="robots" content="noindex, follow">
```

Mikor használd: Kevésbé fontos szűrőkombinációknál (pl. ár szerint rendezve).

3. Robots.txt blokkolás

```
User-agent: *
Disallow: /cipok/?rendez=
Disallow: /cipok/?oldalonkent=
```

Figyelem: A robots.txt blokkolás NEM egyenértékű a noindex-szel! Fontos tartalomnál mindig noindex-et is alkalmazz.

4. JavaScript alapú szűrés (URL nélkül)

A modern webshopok JS alapú szűrőket alkalmaznak, ahol a szűrés az URL megváltoztatása nélkül történik. Ha nincs keresési igény a szűrt URL-ekre, ez az ideális megoldás.

Mikor érdemes szűrőoldalakat indexelni?

Nem minden szűrőoldal felesleges! Egyes szűrőkombinációkra saját keresési volumenük van:

/futocipok/nike/ → Nagy, "nike futócipő"
/futocipok/42-es-meret/ → Közepes, "futócipő 42-es méret"
/kavefozok/delonghi/ → Nagy, "delonghi kávéfőző"
/kavefozok/?szin=piros → Minimális, senki nem keres piros kávéfőzőre

Döntési keret:
1. Van-e önálló keresési volumen erre a szűrőre? (Google Keyword Planner, Ahrefs)
2. Ha igen → Indexeld, optimalizáld (egyedi H1, meta title, kis bevezető szöveg)
3. Ha nem → Canonical + noindex

Márka-alkategória oldalak

Ahelyett, hogy URL-paraméteres szűrőként kezeld (/cipok/?marka=nike), érdemes külön alkategória oldalakat létrehozni:
```
/cipok/nike-cipok/ ← Indexelt, optimalizált alkategória
/cipok/adidas-cipok/ ← Indexelt, optimalizált alkategória
```

Crawl budget menedzsment nagy webshopokban

A crawl budget azt jelenti, hogy a Google naponta/hetente csak korlátozott mennyiségű URL-t jár be. Nagy webshopokban (10 000+ URL) ez kritikus.

Crawl budget pazarlás jelei:
- Search Console → Lefedettség → Indexelt, de nem beküldött: rengeteg szűrő URL jelenik meg
- A fontos termékoldalak ritkán frissülnek a Google indexében
- Új termékek csak hetekkel megjelenésük után kerülnek be az indexbe

Megoldások:
- Robots.txt blokkolás a felesleges URL-típusokra
- Sitemap.xml csak az indexelendő URL-eket tartalmazza
- Belső linkek csak az értékes oldalakra mutassanak
- Canonical tag következetes alkalmazása

Gyakorlati példa magyar környezetben

Egy budapesti divatwebshop 2026 tavaszán szembesült a fazettás navigáció okozta problémával: a Search Console Lefedettség riportjában 18 000 URL-t láttak "indexelve, de nem beküldve" státuszban, amelyek szinte mind szűrőkombinációk voltak (/ruhak/?szin=piros&meret=38&marka=zara).

A megoldás lépései:
1. A fejlesztőcsapat robots.txt-ben blokkolta a ?szin=, ?meret= és ?rendez= URL-paramétereket.
2. Az összes fennmaradó szűrő URL-re canonical tag mutat a szűretlen kategóriaoldalra (pl. /ruhak/), ezzel kezelve a duplikált tartalmat.
3. A márkákhoz (Zara, H&M, Mango) egyedi alkategória oldalakat hoztak létre: /ruhak/zara/ – ezek indexelve, egyedi szöveggel, title taggel.
4. A Sitemap.xml-ből eltávolítottak 14 000 szűrő URL-t, és csak az 1800 értékes oldalt hagyták benne.

Eredmény 3 hónap után: a crawl budget felszabadult, a fontos termékoldalak 2-3 naponta frissülnek az indexben (korábban 2–3 hét volt), és a 4 márka-alkategória oldal bekerült az első 5 Google-találat közé a "zara ruha", "h&m ruhák online" kulcsszavakra.

Gyakori hibák, amiket érdemes elkerülni

Hiba: Robots.txt blokkolás canonical tag nélkül. A robots.txt megakadályozza a crawlolást, de ha a szűrt URL-ek belső linkeken keresztül is el vannak érve, a Google tudni fog az URL-ekről, csak nem tud bemenni. Együtt kell alkalmazni a robots.txt blokkolást és a canonical taget.
Hiba: Minden szűrőt noindex-szel kezelni. Egyes szűrőkombinációknak valódi keresési volumenük van (pl. "nike futócipő 42-es méret"). Ezeket érdemes indexelt, optimalizált alkategória oldalakká alakítani, nem noindex-szelni.
Hiba: Sitemap.xml-ben maradnak a szűrt URL-ek. Ha a Sitemap tartalmaz ezer szűrő URL-t, a Google azt feltételezi, hogy ezek fontosak, és ezekre pazarolja a crawl budgetet. A Sitemap-ból csak az indexelendő, értékes oldalak szerepeljenek.

Röviden

A fazettás navigáció (faceted navigation) szűrőkombinációkból keletkező URL-ek tömeges duplikált tartalmat hoznak létre, amelyek elpazarolják a crawl budgetet. A megoldás: canonical tag az egyszerű szűrőkre, noindex a kevésbé fontos kombinációkra, robots.txt blokkolás, és csak az értékes URL-ek a Sitemap.xml-ben. 2026-ban a Google a crawl budget menedzsmentet az e-commerce SEO egyik legfontosabb technikai tényezőjeként értékeli.

Következő lépések

A Search Console Lefedettség riportjában ellenőrizd az "indexelve, de nem beküldve" és "kizárva" kategóriákat – ha sok szűrő URL-t látsz, azonnali beavatkozás szükséges.
Azonosítsd, mely szűrőid rendelkeznek önálló keresési volumennel (pl. márka-szűrők), és alakítsd őket alkategória oldalakká.
Tisztítsd meg a Sitemap.xml-t: csak az indexelendő, értékes URL-ek maradjanak benne.

👉 Publisher-csomag megismerése

Gyakran ismételt kérdések

Mi a különbség a canonical tag és a noindex között szűrőoldalaknál?

A canonical tag azt mondja a Google-nek, melyik URL az "eredeti" – az indexbe a kanonikus URL kerül, a szűrt verzió nem. A noindex azt mondja, hogy az adott URL egyáltalán ne kerüljön az indexbe. A canonical-t akkor érdemes, ha a szűrt oldal tartalma szinte ugyanaz, mint az alapoldal. A noindex-et ott, ahol az oldalt el kell érni a felhasználónak, de nem akarod az indexbe.

Hogyan tudom, hogy mennyi szűrő URL indexelődött?

A Search Console Lefedettség riportjában az "indexelt" URL-ek száma megmutatja, mi van az indexben. A Screaming Frog és az Ahrefs Site Audit segít azonosítani a szűrőkombinációkból keletkező URL-eket. A Google Search-ben a "site:webshop.hu/?szin=" lekérdezés közelítő képet ad.

JavaScript-alapú szűréssel megoldódik a probléma?

Igen, ha a szűrés URL-változtatás nélkül, csak JS-sel történik, nincs szűrt URL, amelyet a Google indexelhetne. Ez a legtisztább megoldás, de csak akkor alkalmazható, ha az adott szűrőkombinációkra nincs önálló keresési volumen.

Források

Kapcsolódó tananyagok

Hasznos volt ez a cikk?

Nem találod a választ?

Ezt automatikusan megcsináljuk helyetted

Publicator AI · SEO és GEO autopilot

Szűrők, faceted navigation és duplikált tartalom, a webshop SEO legsúlyosabb csapdái

Mi a faceted navigation?

Megoldási stratégiák

Mikor érdemes szűrőoldalakat indexelni?

Crawl budget menedzsment nagy webshopokban

Gyakorlati példa magyar környezetben

Gyakori hibák, amiket érdemes elkerülni

Röviden

Következő lépések

Gyakran ismételt kérdések

Források

Kapcsolódó tananyagok

Ezt automatikusan megcsináljuk helyetted