Keresőoldalak összehasonlítása (2005. augusztus)

január 28, 2006

Melyik a legjobb kereső?

Ez a cikk nem törekszik tudományos igényességre, viszont többfajta szemszögből is megvizsgálja a keresők működését, úgymint:

  • Keresőadatbázisok mérete
  • Az adatbázisok használhatósága
  • Keresők adatainak frissessége
  • Keresőrobot aktivitása
  • Keresőprogramok felhasználóinak száma

A vizsgálatok 2005 augusztus végén, szeptember első napjaiban készültek, tehát a 2005 augusztusi állapotokat tükrözik.

Változások az elmúlt fél évben

A magyar nyelven való keresés szempontjából két fontos esemény történt az elmúlt fél évben:

  • az MSN kereső keresővel már lehet magyar nyelvű kezelőfelülettel, magyar nyelvű weboldalakra leszűkítve is keresni.
  • új magyar gyártású, komoly keresőadatbázissal rendelkező keresőprogram jelent meg, a kurzor.hu kereső

A vizsgálatban részt vevő keresők

Csak olyan keresőket vizsgáltam meg, melyeknél mód van kizárólag magyar nyelvű weblapok közötti keresésre is. Összesen kilenc keresőt vizsgáltam, melyek használati értékük alapján három csoportba sorolhatóak be. A felsorolás sorrendje nagyjából a keresők használhatóságának sorrendjével egyezik meg, és egyben a vizsgálat konklúziójának is tekinthető.

Nagy nemzetközi keresők, melyekkel minden megtalálható

Hasznos magyar keresők, gyakorlatilag mindent megtalálnak

További magyar keresők, komoly adatbázissal

AlapműIndex

A zoohoo.hu, heureka.hu, goliat.hu keresők kivételével minden kereső segítségével meg lehetett találni mind az öt alapművet (bővebben lásd: AlapműIndex). Az indexek értéke a következőképpen alakult:

A fenti adatokból jól látszik, hogy bár a Yahoo! kereső! és az MSN Search némileg több releváns oldalt tart adatbázisában, mint a Google, ám ezt a Google híresen jó Rangsorolása kompenzálni tudta. A felsorolásban szereplő három magyar üzemeltetésű keresőoldal már jóval kevesebb, negyedannyi, ötödannyi oldalt talált meg, rangsorolásuk hatékonysága azonban meglepően jó.

Adatbázisok mérete gyakori magyar szavak alapján

A keresőadatbázisok méreteinek összehasonlítása a a SzóSzablya szerint az interneten található húsz leggyakoribb magyar szó (a, az, és, is, hogy, nem, egy, meg, el, vagy, csak, de, már, van, kell, ki, még, azt, mint, ha) segítségével történt. A keresett szavakra kiírt találatok száma az alábbi grafikonon tekinthető meg:
A leggyakoribb húsz magyar szóra adott találatok a fontosabb keresőkben.

A diagramon jól látszik, hogy két kereső, a Yahoo! kereső! és a goliat.hu kimagaslóan sok találati oldalt jelentett. A keresések tapasztalatai alapján (lásd AlapműIndex meghatározása) a goliat.hu által kijelzett értékek nem tekinthetőek valósnak (lásd például ezt az eredményt), a Yahoo! kereső! által jelzett értékeket szintén fenntartásokkal kell kezelni. Nem szabad szem elől téveszteni továbbá, hogy a Keresőadatbázisok mérete nem minden! Az alábbi diagramon csak a reálisabbnak tűnő eredményeket kijelző keresők szerepelnek:
A leggyakoribb húsz magyar szóra adott találatok a fontosabb keresőkben 2.

Megfigyelhető, hogy néhány kereső egyes kulcsszavakat ún. Stopszónak vett, ezért nem írt rá ki találatot. Továbbá a zoohoo.hu kereső ezzel a módszerrel nem vizsgálható, mert nem írja ki a találati oldalak számát.

Adatbázisok mérete az Alapműindex alapján

A Yahoo! kereső! és a goliat.hu által kijelzett találatok száma iránti kételyeimet némileg alátámasztja a vizsgált alapművekre rákeresés során kapott találatok száma: A Yahoo! kereső! itt is a legtöbb találatot nyújtotta, de számbeli fölénye nem olyan kiugró mértékű, mint a fenti diagramon. A goliat.hu pedig a mezőny közepén található úgy, hogy volt olyan kifejezés, amelyre egyáltalán nem adott találtatot, szemben a többi vizsgált keresővel.
A fontos keresők találatainak száma a vizsgált alapművekre.

Adatbázisok frissessége

A keresők adatbázisaiban szereplő adatok frissességét a weben újonnan megjelenő szavak, kifejezések segítségével tesztelhetjük. Az index.hu augusztus végi cikkei között böngészve öt új kifejezést választottam ki tesztelésre:

  • augusztus 14-én jelentette be az Apple, hogy feladja több évtizedes hagyományát és Mighty Mouse néven előáll az első többgombos egér modellel.
  • augusztus 22-én jelent meg az indexen az első cikk a nyári uborkaszezont lezáró „politikai” botrányról, amit röviden csak Szatmári-ügyként emlegettek: román és magyar lapok cikkeztek egy állítólagos román kémnőről, némi erotikus szállal is bonyolítva a történetet.
  • augusztus 24-én indította útjára blogját az MTV elnöke, mely a mi szempontunkból csak a rudizoli kifejezés első megjelenére miatt érdekes.
  • augusztus 26-án jelent meg a Katrina hurrikán pusztításairól az első cikk, mely aztán New Orleans elárasztásával fontos témává nőtte ki magát az interneten is.
  • augusztus 29-én cikkeztek először az életet állítólag meghosszabbító génről, melyet Klóthó génnek kereszteltek el.

A különböző keresőkben a pontos kifejezésre kerestem rá, a kifejezéseket idézőjelbe téve. Mivel a heureka.hu és a goliat.hu keresőkkel nem lehet pontos kifejezésre rákeresni, ezért ebben a versenyszámban nem indulhattak.

szeptember 6. Google Yahoo! kereső! MSN Search vizsla24 Zoohoo SZTAKI kereső kurzor.hu
mighty mouse 4550 2960 891 44 0 23 10 augusztus 14.
Szatmári ügy 9260 1840 323 39 0 0 0 augusztus 22.
rudizoli 137 9 275 5 14 7 0 augusztus 24.
Katrina hurrikán 64400 66800 10502 4316 16 0 0 augusztus 26.
Klóthó gén 953 4090 862 31 0 0 0 augusztus 29.
13947 4809 1489 88 14 30 10

A fenti táblázat jól muatatja, hogy naprakész (hétrekész) adatbázist még mindig csak a nagy nemzetközi keresők tudnak fenntartani.

A következő két vizsgálat 26 véletlenszerűen kiválatsztottk, különböző profilú látogatottságú webhely Látogatottsági statisztika‘i elemzésével készült. Az oldalak egy része saját praxisomból származik, más részüket viszont a [Google] és a Yahoo! kereső keresők segítségével találtam, a “Vizsgálati időszak: Augusztus 2005” Kereső-kifejezés segítségével. Mindegyik webhely Webalizer rendszert használt, és csak a 2005. augusztusi adatokat elemeztem.

Keresőrobotok aktivitása

A keresőadatbázisokban található adatok mennyiségére és frissességére következtethetünk abból is, hogy a számukra adatot gyűjtő Keresőrobot hány találatot okoztak a vizsgált oldalon. A vizsgált oldalakat messze a Google robotja, a Google Inc. keresőrobotjai indexelte részletesebben/gyakrabban, tőlük jóval lemaradva következik a másik két nagy kereső, a Yahoo! kereső ([[Yahoo! kereső]! Slurp] nevű robot) és az MSN kereső ([MSNBot] nevű keresőrobot). Érdekes, hogy a nagy keresők robotjaihoz hasonló mértékű tevékenységet csak a zoohoo.hu kereső számára gyűjtő [Jyxobot] mutatott fel. A [[kurzor.hu] robot]on kívül kimutatható mértékű aktivitás nem volt tapasztalható a vizsgált oldalakon, bár ez nem jelenti azt, hogy a SZTAKI Kereső, heureka.hu, goliat.hu egyáltalán ne látogatták volna az oldalakat.

Vizsgált kereső programok: keresőrobotok által okozott találatok száma. 2005. augusztus

Keresőoldalak felől érkező forgalom nagysága

A vizsgálatban részt vevő keresőoldalakon túl a magyarországi Tematikus katalógusok legnagyobbika, a startlap.hu felől érkező forgalom nagyságát is feltüntettem az alábbi grafikonon. Jól látszik, ha ezt nem tettem volna, akkor a Google szinte egyeduralkodónak számított volna a keresők mezőnyében. A különböző tematikus startlap oldalak felől érkező forgalom mértéke meglepő volt számomra, hasonlóan a kurzor.hu kereső felől érkező felhasználók számához. Ez utóbbi „teljesítménye” azonban a vizsla24.hu szabadszavas keresőjéhez képest eltörpül a [Google] mellett. A Yahoo! kereső és a MSN kereső felől érkező látogatók száma rendkívül kevés volt, a többi kereső felől pedig gyakorlatilag nem is érkeztek látogatók a vizsgált oldalakra.

Kereső programok felől érkező forgalom mértéke 2005. augusztus

Konklúzió

A fenti két vizsgálat alapján négy fő kategóriába sorolhatóak a vizsgált keresők:

  • érdemeinek megfelelően sokan használt kereső: [Google]
  • jó teljesítményt felmutató, weboldalak indexelésébe nagy energiát fektető keresők, melyek használatának mértéke messze elmarad szolgáltatásaik minőségétől: a Yahoo! kereső, az MSN kereső, és kicsit a zoohoo.hu keresők is arra várnak, hogy a felhasználók felfedezzék őket
  • valamilyen okból sokak által használt oldalak, de nem elsősorban szolgáltatásaik minősége miatt: kurzor.hu kereső és kicsit a vizsla24.hu. Előbbi sokat köszönhet annak, hogy a www.google.hu címről sok látogatója érkezik közvetlen átirányítással, az utóbbit pedig az origo portálon betöltött helye miatt használják relatíve sokan.
  • komoly adatbázissal rendelkező keresők, melyek használati értéke még vagy már nem felel meg a mai elvárásoknak, ezért aztán kevesen is használják őket: már: heureka.hu, goliat.hu; még: SZTAKI Kereső

Érdekes továbbá, hogy mennyien használják a *.lap.hu oldalakat: mindez jól mutatja, hogy egy megfelelően szervezett webkatalógus is igen hasznos lehet a mindennapi keresések során.

A „Keresőoldalak összehasonlítása (2005. augusztus)” című bejegyzést 2006. 01. 28. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 06. 05., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások