Indexelésre és keresésre nem érdemes szavak
Stopszónkak nevezzük azokat a szavakat, melyekre általában nincsen különösebb értelme rákeresni, ezért sok kereső (pl. a heureka.hu ) – elsősorban a hatékonyság növelésétől vezérelve – nem tárolja el őket, ezáltal nem is ad ezekre a szavakra találatot. Más keresők (mint például a Google kereső) adnak találatokat a stopszavakra is, viszont Kereső-kifejezések részeként beírva automatikusan kihagyják őket. (Az automatikus kihagyást a szó elé írt + jellel lehet megakadályozni.)
A Stopszavak általában rövid, kötőszavak, névelők, névutók, illetve az interneten gyakran előforduló sztringek, mint pl. a http vagy a .com .
- példa angol stopszavakra : http://www.dcs.gla.ac.uk/idom/ir_resources/linguistic_utils/stop_words
- példa német stopszavakra : http://www.hebis.de/bib/arbeitshilfen/hebis-handbuch/kapitel.php?we_objectID=1026
A „Stopszó” című bejegyzést 2005. 09. 05. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2009. 11. 10., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.
Archivált hozzászólások
Eddig próbálkoztam, nem értem, jöjjenek a tpasztaltabbak
2008. 08. 05. 11:24 ·
Azért a Google elég gyakran operál az egyes kifejezések előfordulásának gyakoriságával. Valószínűsítem, hogy ebben az esetben az történt, hogy azért mert az „egy kosár fa” kifejezés csak kilencszer fordul elő, ezért a Google nem tartja nyilván ezt a kifejezést külön adatbázisában, mint értelmes szókapcsolatot, míg az „asszony meg a lánya” négy és félezerszer fordul elő, ezért a Google ezt már értelmes szókapcsolatnak gondolja, és ekként kezeli.Nézd meg pl., mi történik, ha arra keresel rá, hogy „w kosár fa”: nem fogsz kapni javaslatot arra, hogy esetleg milyen helyes formára kellene rákeressél, mivel a Google nem talált hasonló kifejezést, ami nagy számban előfordult volna. Ha azonban az „asszony meg w lánya” kifejezésre keresel, akkor látni fogod, hogy felkínálja a helyes, nem elírt változatot a Google. Látható tehát, hogy a stopszavakat azért egy fokkal finomabban kezeli a rendszer már, mint régebben.
Eddig próbálkoztam, nem értem, jöjjenek a tpasztaltabbak
2008. 08. 05. 12:16 ·
Köszönöm a választ.Csak azt nem tudom hirtelen eldönteni, szegény halandóknak milyen példát hozzak. :(Ezek szerint – jól értem? – a Google szavakból is épít, és szókapcsolatokból is épít indexeket, hogy rövidebb ideig tartson a keresés. Vizsgálják bizonyos szavak együttes előfordulását, ill. azokra való keresési gyakoriságot (itt akár 3-4 szavas is lehet?), és azt felveszik indextételnek?
Bocs, ha szakszerűtlen a megfogalmazásom.
Üdv: HGyöngyi
Eddig próbálkoztam, nem értem, jöjjenek a tpasztaltabbak
2008. 08. 05. 16:56 ·
Szép estét!Közben sikerült 🙂 regisztálnom. Tudom, hogy ez az oldal alapvetően a keresőoptimalizálásról és az Adsense-ről szól. De egy „ismeretterjesztő” blogot írok kezdő internet/számítógépfelhasználóknak. Leginkább nőknek. De ez utóbbi mellékes. Készítettem az olvasóimnak egy ingyenes anyagot a különféle keresőkről, mert hallom, tudom, azt sem tudják sokan, mit hol érdemes keresni. Ennek folytatása egy anyag, amit most készítek a Google-ról. Azoknak íródik, akiknek még a logikai operátor is kínai. Ebben szépen leírtam, hogy amennyiben olyasmire szeretne keresni, amiben „tiltott” szó van, tegye szépen „…” közé. Mert ezek a dolgok elméletileg tényleg így kellene, hogy működjenek, de mégsem így működnek. Ha el tudnád magyarázni az okát, illetve, hogy jól értem-e az okát, amint írtam az előzőekben. Ugyanis csak akkor tudok egyszerűen megfogalmazni valamit mások számára, ha én magam értem, mégha bonyolult is.
Miért nehéz szabályt találni?
2008. 08. 06. 05:11 ·
„Azoknak íródik, akiknek még a logikai operátor is kínai.”
Itt van a kutya elásva, ugyanis a Google keresője is főleg rájuk van szabva. Arra a 95%-nyi többségre, aki egyáltalán nem ért a kereséshez túl azon, hogy 1. betöltöm a googlét 2. beírom a keresést.
Így hát a Google arra törekszik, hogy az átlag felhasználó fejével gondolkodjon, annak számára logikussá és hasznossá tegye a keresést. Mivel nyilvánvalóan nem láthat bele senkinek a fejébe, tökéletes eredményt soha nem fog produkálni. Ugyanakkor viszont már túllépett azon a szinten, hogy az algoritmusának logikáját két-három szabállyal egyszerűen meg lehessen fogalmazni. Ezért nem tudod te sem.
Re:Miért nehéz szabályt találni?
2008. 08. 06. 05:29 ·
Igen, az előttem szólóhoz hasonlóan én is azt mondanám, hogy ne nagyon bonyolítsd a leírást ezekkel a szakszavakkal, mint operátor. Sokkal fontosabb szerintem egyfajta iteratív hozzállás, ti. hogy kipróbálsz egy egyszerű keresést, aztán annak megfelelően, amit kapsz találatnak, ha nem tetszik tovább finomítod vagy a kulcsszó megváltoztatásával vagy további kulcsszavak hozzáadásával. Nem egy egyszerű dolog ezt elmagyarázni, hogy hogyan hatékony, mert szerintem nagyon intuitív. Ugyanakkor be kell valljam töredelmesen, hogy én aki rengeteget keresek a Google-vel, szinte kizárólag csak két „operátort” használok: az egyik az idézőjel, a másik a site: operátor. Bár ez utóbbit inkább SEO miatt használom, de a site:hu azt hiszem, egy átlag júzernek is jól jöhet. Ezzel a korlátozott eszközkészlettel meg szoktam találni azt, amit keresek. Bár a valósághoz hozzátartozik, hogy egyre növekvő számban először a Wikipédián keresek rá szavakra, úgy, hogy beírom az angol verzió általam feltételezett, a keresett kulcsszónak megfelelő aloldalát kézzel a böngésző címsorába, de ez sem kezdő szint. 🙂
„Azoknak íródik, akiknek még a logikai operátor is kínai.”
2008. 08. 19. 06:05 ·
Elkészítettem a segédleteket, és bárki számára elérhetővé tettem a http://ladyuser.eu oldalon. Olyanoknak írtam, akik mindenféle komolyabb előképzettség nélkül használják az Internetet, a számítógépet. Azt hiszem a fenti problémát is sikerült egyszerűen megfogalmazni az anyagban. OldalGazdának és a hozzászólónak köszönöm a segítséget.
ladyuser
2008. 08. 22. 02:28 ·
Miért pdf-ben csatoltad a leírásokat? Miért nem html-ben? Én legalábbis akkor töltök le egy pdf-et, ha azt tényleg használni akarom. A html-be meg gyorsan belenézek, ha érdekel végignézem, ha nem, akkor lépek is tovább. A kezdő internetezőknek csináltad a leírást, szerintem a bizonytalanokat máris elriasztod, mert rögtön le kell tölteniük valamit, amiről nem is tudják biztosra, hogy mi.
ladyuser
2008. 08. 22. 02:29 ·
Miért pdf-ben csatoltad a leírásokat? Miért nem html-ben? Én legalábbis akkor töltök le egy pdf-et, ha azt tényleg használni akarom. A html-be meg gyorsan belenézek, ha érdekel végignézem, ha nem, akkor lépek is tovább. A kezdő internetezőknek csináltad a leírást, szerintem a bizonytalanokat máris elriasztod, mert rögtön le kell tölteniük valamit, amiről nem is tudják biztosra, hogy mi.
Eddig próbálkoztam, nem értem, jöjjenek a tpasztaltabbak
2008. 08. 05. 10:48 · Névtelen hozzászóló →
Google: használ stopszavakat, magyar stopszavakat is, ha jól tudom.Keresés: [egy kosár fa] – találatokat nézve az >egy< nem kiemelt, a találati lista nem az >egy kosár fa< kifejezéssel kezdődik. (Tszám: 747e); [„egy kosár fa”]-ra keresve >egy< kiemelt, ahogy kell. (Tszám: 9)
De, és innentől kezdve nem értem:[asszony meg a lánya] – találatokban >meg a< kiemelt., a találati lista az >asszony meg a lánya< kifejezéssel kezdődik (Tszám: 848e); [„asszony meg a lánya”]-ra keresve természetesen az egész kiemelt. (Tszám: 4490)
[asszony lánya] – a találati lista nem az >asszony meg a lánya< kifejezéssel kezdődik, az csak először a 3. találat. (Tszám: 473e)
Egy segédletet írok, és szépen elmagyaráztam benne a stopszavak lényegét, az „” fontosságát ezekben az esetekben, aztán példát készítettem és most csak hümmögök. Egyszer így – másszor úgy viselkedik a Google keresője, vagy én nem értek valamit?
Köszönöm.