Klaszterezés

május 13, 2005

Találati listák weboldalainak csoportosítása

A klaszter (angolul: cluster) kifejezést gyakran és többfajta értelemben használják a matematikában és az informatikában. A Szabadszavas keresőkkel vagy a Meta keresőkkel kapcsolatban ez a kifejezés a Találati rangsor weboldalainak csoportosítását jelenti hasonló tartalom (Kulcsszavak), vagy elhelyezkedés, közelség alapján.

Mire jó a találatok csoportosítása?

Az olyan többértelmű kulcsszavak esetén, ahol az egyik jelentés jóval többször van jelen az interneten, a találatok csoportosítása segítségével egyszerűbben rátalálhatunk a ritkább jelentéshez kapcsolódó találatokra. Például az apple kulcsszóra rákeresve rengeteg Macintosh-sal kapcsolatos témacsoportot jelez ki a kereső, de mutat egy Fruit csoportot is azoknak, akik a gyümölcsre és nem a számítógépre kerestek volna rá. Általában a Kereső-kifejezés pontosításával is elérhető a kívánt eredmény, ezért nem biztos, hogy a klaszterezés a legjobb megoldás.

Alternatív keresők és a klaszterezés

A weblapok tartalmának elemzése szerinti csoportosítás legjobban működő formája a Clusty meta-keresőnél figyelhetõ meg: segítségével a többértelmű kulcsszavak és nagyszámú találatok esetén lehet hatékonyabbá tenni a keresést. Emellett a Tematikus katalógusokhoz hasonlóan lehet böngészni, keresgélni a hasonló oldalak témaköröként szervezett csoportjaiban. Ez utóbbi különösen hasznos akkor, ha nem tudjuk pontosan megnevezni, mit is keresünk. Hasonló csoportosítási mechanizmus figyelhető meg a PolyMeta találati listáiban is.

Nagy keresők és a csoportosítás

Ha nem is ilyen vegytiszta formában, de a Fontos keresőknél is megfigyelhető a klaszterezés jelensége. A közelség alapján történõ csoportosítást használja például a Google kereső az ugyanazon webhelyen található találati oldalak kezelésére. (pl. „További találatok a(z) webni.innen.hu tartományból”) A Microsoftnál is kísérleteznek klaszterezéssel: a következõ oldalon a klaszterezés hasznosságát megvilágító további példákat találhatunk: http://wsm.directtaps.net/usage.htm

További olvasnivaló

A „Klaszterezés” című bejegyzést 2005. 05. 13. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2006. 12. 08., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások