Magyar nyelvet figyelembe vevő keresés

május 4, 2005

Kulcsszavas internetes keresés magyarul

A Fontos keresők elsősorban az angol nyelvű piacokra öszpontosítanak, másodsorban az egyéb világnyelvekre. Az internetes kereső piac fejlődése olyan szakaszba érkezett, mely során egyre több és több kiegészítő szolgáltatást vezetnek be, mely a keresést végző nyelve és lakóhelye szerint szabja testre a találatokat, azonban a kis (=gazdaságilag kevés potenciállal rendelkező nemzeteknek) egyenlőre nem sok babér terem. Az alábbiakban néhány hiányzó szolgáltatást sorolok fel, melyek akár a magyar fejlesztésű Egyéb kereső programok számára is lehetőséget nyújthatnának egy-egy piaci rés betömésében:

Szótövezés

Jelenleg a SZTAKI Kereső, tango.hu, és a PolyMeta képes a magyar szavak Szótövezésére, emellett egyes esetekben a Google keresőnél is megfigyelhető a jelenség. Mivel a magyar agglutináló nyelv, ráadásul a tőváltozások is gyakoriak, nagyon bonyolult olyan algoritmust írni, ami felismeri a ragozott szavak szótöveit, és eszerint tudja rendezni a találatokat. Például a „keresők”, „keresőkkel”, „keresőknek” kulcsszavak ideális esetben mind a „kereső” kifejezéssel egyet jelentenének, és az oldalak súlyozása is e kulcsszó-variánsok előfordulásai szerint történne.

Magyar nyelvű tartalom felismerése

Bár a Fontos keresők elég jó arányban felismerik a magyar nyelvű oldalakat, azonban ebbéli teljesítményük messze áll a száz százaléktól. Keressünk rá például a „de” kucssszóra, csak a magyar lapokra leszűkítve…

Ékezetek kezelése

Manapság a Fontos keresők fontosságot tulajdonítanak a Domainnévben és az Elérési útvonalban található Kulcsszavaknak. Mivel kevesen használnak ékezeteket az oldalak címében, ezért az algoritmusok, melyek nem ékezettelenítenek, és csak egyfajta kódolással írt URL-eket tudnak „lefordítani” ékezetes címekre nem mindig a legjobb eredményt adják. Az ékezetes domainneveket a Google kereső helyesen, problémamentesen jeleníti meg

Magyar nyelvű felhasználói felület

A Google kereső magyar nyelvű felhasználói felülete sem a legjobb, azonban a Google Inc. egyéb szolgáltatásainál még elszomorítóbb a helyzet, tele van inkonzisztens dolgokkal és nyelvtani hibákkal. (OldalGazda személyes kedvence az AdSense nyitóoldalról: „Az interface nagy része magyar nyelven kerül megjelenítésre”) Ahogy a főoldalakról beljebb merészkedik az ember a kiegészítő, súgó, stb. oldalakra, a helyzet még súlyosabb. Ami le is van fordítva, abban nincs sok köszönet: hemzseg a nyelvtani és nyelvhelyességi hibáktól. A Yahoo! keresővel kapcsolatban szerencsések lehetünk, hiszen az ok.hu biztosít jó minőségű kezelőfelületet a Yahoo! kereső adatbázisában kereséshez. A Live keresőnél is történnek próbálkozások a magyarításra, de amíg a keresőmező felett a „Live Search” felirat virít a magyar verzióban, addig cseppet sem lehet okunk az elégedettségre.

Kiegészítő szolgáltatások

Számtalan olyan kiegészítő szolgáltatás van, mint pl. a [Google News], a [Google Maps], ami sem nyelvileg, sem területileg nincsen lokalizálva a magyar felhasználók igényeinek megfelelően. Hasonló igaz a Találati rangsorban megjelenő apró trükkökre, mint például az OneBox: amikor a találati listákban más forrásokból (Google-nál pl. [Google Képkereső], [Google News] hírek, definíciók) származó találatok jelennek meg.

Altémák:

A „Magyar nyelvet figyelembe vevő keresés” című bejegyzést 2005. 05. 04. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2009. 12. 20., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

keresés

2009. 12. 20. 12:48 · Névtelen hozzászóló →

keresek egy lányt aki 26 éves ázsiai és győrben lakik foglalkozása könyvelő.