Logfájl-elemzés (log file analysis)
Szakértő

Logfájl-elemzés (log file analysis)

A logfájl-elemzés a szerver naplóinak vizsgálata, hogy lásd, a keresőrobotok pontosan mit és milyen gyakran járnak be. A legpontosabb kép arról, hogyan crawlolja a Google az oldaladat.

2 perc olvasás·2026. június·Szakértő

Mi a logfájl-elemzés?

A logfájl-elemzés a webszerver naplófájljainak vizsgálata, amelyekben minden kérés rögzül, köztük az is, hogy a keresőrobotok (Googlebot, GPTBot stb.) mely oldalakat, mikor és milyen gyakran járták be.

Mit árul el?

Ez a legpontosabb, valós kép arról, hogyan crawlolja a Google az oldaladat, szemben a becslésekkel. Megmutatja: mire pazarol crawl-keretet (felesleges oldalak), mit nem jár be (fontos, de elhanyagolt oldalak), és milyen hibákat (404, 5xx) talál a robot. Nagy webhelyeknél a technikai SEO erős eszköze.

A 2026-os keresési trendek közepette a logfájl-elemzés fontosabb, mint valaha: a GPTBot, a ClaudeBot és más AI-crawlerek is megjelennek a naplókban, így láthatod, hogy az AI-keresők hogyan térképezik fel az oldaladat. Az Apache és Nginx szerverek alapértelmezetten mentik a naplókat, de jellemzően csak 14-30 napig. Érdemes rendszeresen lementeni és eszközzel feldolgozni — erre alkalmas a Screaming Frog Log File Analyser, a Botify vagy akár egy egyszerű Python-szkript. A naplók megmutatják, mely oldalakat látogat a Googlebot naponta, melyeket hetente és melyeket sosem. Ez alapján priorizálhatod a tartalom frissítését és a belső linkelés irányát.

Gyakorlati példa magyar környezetben

Egy győri ipari alkatrész-forgalmazó webhelyén az ügyfél panaszát követte logfájl-elemzés 2026 elején: a 12 000 termékoldalból a Googlebot csak 1 800-at crawlolt rendszeresen. A logfájlok alapján kiderült, hogy a robot a napja nagy részét a belső kereső 8 000+ találatoldalán töltötte, miközben a fő termékkategóriákat hetente egyszer vagy ritkábban látogatta. Megoldás: a belső kereső URL-eket robots.txt-ben kizárták, a fő termékoldalak belső linkelését megerősítették, és a sitemapet megtisztították. Három hónappal később a Googlebot napi crawl-aránya a kulcstermékoldalakra 3,4-szorosára nőtt, és 22 korábban nem indexelt termékoldal jelent meg az organikus találatokban.

Hogyan kapcsolódik más fogalmakhoz?

A logfájl-elemzés szorosan összefügg a Canonical URL (kanonikus cím) kezelésével: a naplókból kiderül, hogy a Googlebot a kanonikus vagy a duplikált verziókat crawlolja-e intenzívebben. Az Indexelés (indexing) folyamatának megértéséhez a logfájlok nélkülözhetetlen alapadatot adnak: látod, mit crawlol a robot és mi kerül ténylegesen az indexbe. A Query fan-out szempontjából is kritikus: az AI-rendszerek több forrást kereszteznek, és ha az oldaladat ritkán crawlolják, kisebb eséllyel szerepelsz AI-összefoglalókban. A logfájlokban megjelenő Entitás (entity) szintű crawl-minták megmutatják, hogy a Google mennyire érti az oldal tematikus felépítését.

Gyakori hibák, amiket érdemes elkerülni

  • Naplófájlok törlése idő előtt: Az alapértelmezett szerver-beállítások sokszor 7-14 napnál régebben törlik a naplókat. Érdemes automatizált archiválást beállítani, hogy legalább 90 napos visszatekintési ablak álljon rendelkezésre az összehasonlításhoz.
  • Csak a Googlebot szűrése: A logfájlokban a GPTBot, Bingbot és Ahrefsbot is megjelenik. Ha ezeket figyelmen kívül hagyod, elveszted a képet arról, hogy az AI-keresők hogyan crawlolják az oldaladat, ami 2026-ban egyre fontosabb.
  • Nincs automatizált riasztás 5xx hibákra: A szerver 500-as hibákat a logfájlok azonnal mutatják, de ha senki nem figyeli őket, napokig elmehet az észrevétel. Állíts be monitoringot, hogy a Googlebot 5xx válaszkódot kapjon, azonnal értesítést kapj.

Röviden

A logfájl-elemzés a webszerver naplóinak vizsgálata, amely megmutatja, a Googlebot és más keresőrobotok pontosan mit, mikor és milyen gyakran crawlolnak az oldaladon. 2026-ban az AI-crawlerek megjelenésével különösen értékes eszköz a technikai SEO-hoz, mert valós adatot ad a crawl-keret felhasználásáról.

Gyakran ismételt kérdések

Hol találom a logfájlokat a webszerveremen?

Apache szerveren jellemzően a /var/log/apache2/access.log, Nginx esetén a /var/log/nginx/access.log helyen. Managed hosting esetén a vezérlőpanelen (cPanel, Plesk) érhető el, vagy a hosting ügyfélszolgálatán kell kérni.

Elég a Google Search Console a logfájl-elemzés helyett?

Nem teljesen. A GSC csak a Google saját adatait mutatja, és azokat is szűrve. A logfájlok pontos, valós idejű képet adnak az összes crawlerről (Googlebot, GPTBot, Bingbot), a szerver hibakódokról és a tényleges válaszidőkről, amelyeket a GSC nem tartalmaz.

Milyen eszközökkel elemezhető a logfájl?

Kezdőknek a Screaming Frog Log File Analyser ajánlott, amely grafikus felületen mutatja a crawl-adatokat. Haladóknak a Python pandas könyvtárával vagy a Botify platformmal részletesebb elemzés végezhető. Nagy webhelyek esetén ELK Stack (Elasticsearch, Logstash, Kibana) is megoldás.

Kapcsolódó tananyagok

Hasznos volt ez a cikk?

Nem találod a választ?

Ezt automatikusan megcsináljuk helyetted

Publicator AI · SEO és GEO autopilot