Soft 404
A soft 404 az, amikor egy üres vagy „nincs találat" oldal 200-as (sikeres) státuszt ad vissza 404 helyett. Megzavarja a Google-t, és pazarolja a crawl-keretet.
Mi a soft 404?
A soft 404 az, amikor egy lényegében üres vagy „nincs találat" oldal a szerverben mégis 200-as (sikeres) HTTP-státuszt ad vissza, ahelyett, hogy valódi 404-et (vagy 410-et) jelezne. A Google ezt „lágy 404"-ként azonosíthatja.
Miért probléma?
Mert összezavarja a Google-t (azt hiszi, ott valódi tartalom van), pazarolja a crawl-keretet üres oldalakra, és ronthatja a webhely megítélését. Megoldás: a tényleg nem létező/üres oldalak adjanak valódi 404/410 státuszt, az áthelyezettek pedig 301-et. A GSC „Oldalak" jelentése jelzi a soft 404-eket.
2026-ban a soft 404 különösen veszélyes az Indexelés (indexing) szempontjából, mert az AI-crawlerek (pl. GPTBot, PerplexityBot) szintén bejárják az ilyen oldalakat, de üres tartalmat találnak. Ennek eredménye: a crawl-keret egy része elveszik, és az AI-keresők sem kapnak idézhető tartalmat. A Crawl-budget optimalizálása szempontjából is kritikus a soft 404-ek kiküszöbölése: egy közepes méretű webshopban könnyen százas nagyságrendű ilyen oldal keletkezhet lejárt termékekből, üres kategóriákból vagy hibás szűrési URL-ekből. A leggyakoribb soft 404-forrás az e-kereskedelemben az „Ez a termék már nem elérhető" üzenetet 200-as státusszal visszaadó terméklap. A megoldás: vagy 410-es státusz (tartalom véglegesen eltávolítva), vagy 301-es átirányítás egy releváns helyettesítőre. A HTTP-státuszkódok helyes alkalmazása ezért alapvető technikai SEO-feladat.
Gyakorlati példa magyar környezetben
Egy 4 800 termékes szegedi webshop 2025 elején Search Console-auditot végzett, és 1 200 soft 404-es oldalt azonosított: ezek lejárt, de aktív URL-en maradó termékoldalak voltak, amelyek az „Ez a termék jelenleg nem kapható" üzenetet adták vissza 200-as státusszal. A crawl-budget elemzés megmutatta, hogy a Googlebot havi látogatásainak 38%-a ilyen üres oldalakra ment el. A technikai csapat három lépést tett: (1) a végleg kivont termékek 410-es státuszt kaptak, (2) az ideiglenes hiányok esetén 301-es átirányítást vezettek be a kategória-oldalra, (3) a Canonical URL (kanonikus cím) beállításokat felülvizsgálták. Hat hónappal később az indexelt termékoldalak száma 2 100-ról 3 600-ra nőtt, az organikus forgalom 41%-kal emelkedett, és a Belső linkek (internal linking) link-tőkéje is jobban oszlott el.
Hogyan kapcsolódik más fogalmakhoz?
A soft 404 a 404 hiba „testvérproblémája": míg a valódi 404 helyesen jelzi a hiányt, a soft 404 éppen azért veszélyes, mert látszólag minden rendben van. A HTTP-státuszkódok helyes alkalmazása mindkét esetben alapvető: a 200, 301, 404 és 410 kódok különböző üzeneteket küldenek a crawlereknek.
A Crawl-budget (a Google által egy oldalra fordított bejárási keret) közvetlenül érinti a soft 404-ek hatását: minél több felesleges URL-t jár be a bot, annál kevesebb jut a valódi tartalomra. A Query fan-out során az AI is több URL-t vizsgál, és az üres oldalak ugyanúgy rontják az AI-indexelés hatékonyságát. Az Indexelés (indexing) és az Entitás (entity) alapú feldolgozás is szenved, ha a soft 404-ek torzítják a webhely minőségi képét.
Gyakori hibák, amiket érdemes elkerülni
- Keresési találat nélküli oldalak 200-as státusszal: A legtöbb CMS és webshop platform alapbeállításban 200-ast ad vissza a „Nincs találat" oldalakra. Ez soft 404-et eredményez. Mindig konfiguráld, hogy az üres szűrési URL-ek és az üres keresési eredmények 404-et vagy 410-et adjanak vissza.
- Lejárt termékoldalak törlés helyett üresen maradnak: Webshopokban szokás az eladott vagy kivont termékek oldalát egyszerűen „elrejteni" (visibility:hidden), de az URL aktív marad. Ezeket érdemes 410-esen lezárni, vagy 301-essel átirányítani.
- Nem figyelik a GSC „Oldalak" jelentését: A Search Console Indexelés > Oldalak szakasza külön kategóriaként mutatja a soft 404-eket. Sok cég soha nem ellenőrzi ezt a riportot, így hónapokig vagy évekig fennmaradhat a probléma észrevétlenül.
Röviden
A soft 404 akkor keletkezik, amikor egy üres vagy nem létező oldal 200-as HTTP-státusszal válaszol 404 helyett. Ez összezavarja a Google-t és az AI-crawlereket, pazarolja a crawl-budgetet, és rontja az indexelés hatékonyságát. A megoldás: 410-es státusz vagy 301-es átirányítás a valóban nem létező oldalaknál, 2026-ban is kötelező alapfeladat.
Gyakran ismételt kérdések
Hogyan derítsd ki, hogy van-e soft 404 az oldaladon?
Nyisd meg a Google Search Console-t, lépj az Indexelés > Oldalak menübe, és nézd meg a „Soft 404" kategóriát. Ez listázza az összes olyan URL-t, amelyet a Google soft 404-ként azonosított. Az érintett oldalakat egyenként ellenőrizd: valóban üres-e a tartalom, és valóban 200-as státuszt adnak-e vissza.
Mi a különbség a 404 és a soft 404 között?
A valódi 404-es oldal helyesen 404-es HTTP-státuszt ad vissza, ezzel jelezve a crawlernek, hogy az oldal nem létezik. A soft 404 ezzel szemben 200-as státuszt ad vissza (azt üzeni: „minden rendben"), miközben a tartalom üres vagy értéktelen. A Google ilyenkor nem távolítja el automatikusan az indexből, hanem a crawl-budgetet pazarolja az oldal újabb és újabb bejárásával.
Mikor válasszak 404-et és mikor 410-est?
A 404 azt jelzi, hogy az oldal most nem található, de esetleg visszatérhet. A 410 végleges törlést jelez. Webshopban a tartósan kivont termékekhez használj 410-est: a Google gyorsabban eltávolítja az indexből, nem pazarolja a crawl-budgetet az ismételt bejárással. Ideiglenes hiányhoz (pl. raktárkészlet újratöltése várható) inkább 301-es átirányítás vagy 503-as státusz javasolt.
Források
Kapcsolódó tananyagok
Hasznos volt ez a cikk?
Nem találod a választ?
Ezt automatikusan megcsináljuk helyetted
Publicator AI · SEO és GEO autopilot