TF-IDF

A TF-IDF egy statisztikai mérőszám arról, mennyire jellemző egy szó egy dokumentumra a teljes korpuszhoz képest. SEO-ban a témába illő, releváns szóhasználat feltárására használják.

2 perc olvasás·2026. június·Szakértő

Mi a TF-IDF?

A TF-IDF (Term Frequency, Inverse Document Frequency) egy statisztikai mérőszám: megmutatja, mennyire jellemző egy szó egy adott dokumentumra a teljes szöveghalmazhoz képest. A gyakori, de mindenhol előforduló szavak (pl. „és") súlya alacsony, a témára jellemzőeké magas.

Mire jó a SEO-ban?

Nem rangsorolási tényező önmagában, de hasznos tartalmi segédeszköz: feltárja, milyen témába illő, kapcsolódó szavakat használnak a jól teljesítő cikkek egy témában. Ezeket természetesen beépítve a tartalmad teljesebbnek és relevánsabbnak tűnik, anélkül, hogy kulcsszót halmoznál.

A TF-IDF ereje abban rejlik, hogy nem csupán a szó gyakoriságát méri, hanem az egyediségét is: ha egy szó mindenhol előfordul, a súlya alacsony marad, ha viszont egy témára jellemző, a súlya magas. 2026-ban a TF-IDF alapú tartalomelemzés eszközei (pl. Surfer SEO, Clearscope) abban segítenek, hogy a cikked minden fontos altémát lefedjen, amelyet a versengő oldalak is tárgyalnak. Ez csökkenti a tematikus hiányosságokat és növeli a [keresési szándék (search intent)](/tudastar/lexikon/keresesi-szandek) kielégítésének valószínűségét. A jól beépített TF-IDF szavak a természetes szövegkörnyezetből következnek, nem erőltetett módon kerülnek be – ezért a Google minőségi tartalomként értékeli őket.

Gyakorlati példa magyar környezetben

Egy pécsi lakásfelújítással foglalkozó KKV 2026 elején TF-IDF elemzést végzett a „gipszkarton szerelés ár" kulcsszóra. Az elemzés kimutatta, hogy a TOP 10-es találatoknál visszatérő fogalmak: „álmennyezet", „villanyszerelés", „m² díj", „munkadíj áfa". Ezek a szavak a KKV cikkéből hiányoztak.

A szerkesztő beépítette a hiányzó fogalmakat 3 új bekezdésbe, 450 szóra bővítve a korábban 270 szavas cikket. Hat hét alatt az oldal a 18. pozícióból a 6. helyre került, az organikus kattintásszám megháromszorozódott (havi 38-ról 112-re). A TF-IDF elemzés megmutatta, hogy a [kulcsszó-kannibalizáció](/tudastar/lexikon/kulcsszo-kannibalizacio-fogalom) elkerülése érdekében más oldalon kell tárgyalni az „ár" és a „szerelési technika" témákat – ezzel a belső tartalomstruktúra is letisztult.

Hogyan kapcsolódik más fogalmakhoz?

A TF-IDF szorosan összefügg a [keresési szándék (search intent)](/tudastar/lexikon/keresesi-szandek) fogalmával: a TF-IDF elemzés pontosan azokat a szavakat tárja fel, amelyeket az adott szándékhoz kötötten a legjobb tartalmak használnak. Az [LSI kulcsszavak](/tudastar/lexikon/lsi-kulcsszavak) (latens szemantikai indexelés) hasonló logikán alapulnak: az LSI-szavak azok a kifejezések, amelyek szemantikailag kapcsolódnak a főtémához, és a TF-IDF elemzés rendszerint ezeket is felszínre hozza.

A [People Also Ask (PAA)](/tudastar/lexikon/people-also-ask) blokkokban megjelenő kérdések szintén jelzik, milyen altémák TF-IDF-súlya magas a Google szemében. A [kulcsszó-kannibalizáció](/tudastar/lexikon/kulcsszo-kannibalizacio-fogalom) megelőzésére is alkalmazható: ha két oldal azonos TF-IDF-profilt mutat, valószínűleg ugyanazért a keresési szándékért versenyeznek egymással. A [belső linkek (internal linking)](/tudastar/lexikon/belso-linkek) struktúrájának kialakításakor a TF-IDF-adatok megmutatják, melyik oldal a legerősebb forrás egy témában.

Gyakori hibák, amiket érdemes elkerülni

Hiba: TF-IDF szavak erőltetett beillesztése. A TF-IDF eszközök javaslatai nem kötelező szólisták. Ha egy szó nem illik természetesen a szövegbe, ne erőltesd – a Google a kontextus nélküli kulcsszóhalmozást bünteti.
Hiba: a TF-IDF összekeverése a kulcsszűrűséggel. Sokan azt gondolják, hogy a TF-IDF azt méri, hányszor szerepeljen egy kulcsszó. Valójában a korpuszhoz viszonyított egyediséget méri – nem az ismétlés a cél.
Hiba: egyetlen versenytárs elemzése. A TF-IDF csak akkor ad megbízható képet, ha legalább 5–10 jól rangsoroló oldalt vizsgálsz egyszerre. Egyetlen oldalból levont következtetés félrevezető lehet.

Röviden

A TF-IDF (Term Frequency, Inverse Document Frequency) egy statisztikai módszer, amellyel feltárhatod, milyen témába illő szavak jellemzőek az élmezőnyre egy adott kulcsszónál. 2026-ban a TF-IDF alapú tartalomelemzés a tematikus teljességet és a releváns szóhasználatot segíti – nem a kulcsszóhalmozást.

Gyakran ismételt kérdések

Mi a TF-IDF és mire használják SEO-ban?

A TF-IDF (Term Frequency, Inverse Document Frequency) statisztikai módszer, amely megmutatja, mennyire jellemző egy szó egy dokumentumra a teljes szövegkorpuszhoz képest. SEO-ban arra használják, hogy feltárják, milyen témába illő, kapcsolódó szavak szerepelnek a jól rangsoroló oldalakon, és ezeket természetesen beépítsék a saját tartalmukba.

A TF-IDF befolyásolja a Google rangsorolását?

A TF-IDF közvetlenül nem rangsorolási tényező, de közvetve segít: a TF-IDF alapú tartalombővítés tematikusan teljesebbé teszi a cikket, ami javítja a keresési szándék kielégítését és ezáltal a rangsorolást.

Milyen eszközökkel végezhető TF-IDF elemzés?

2026-ban a legnépszerűbb TF-IDF elemző eszközök közé tartozik a Surfer SEO, a Clearscope és a MarketMuse. Ingyenes alternatívaként a Google Search Console „Lekérdezések" jelentése is mutat kapcsolódó szavakat, amelyek TF-IDF-alapú összefüggésekre utalnak.

Források

Kapcsolódó tananyagok

Hasznos volt ez a cikk?

Nem találod a választ?

Ezt automatikusan megcsináljuk helyetted

Publicator AI · SEO és GEO autopilot