Rangsorolás

május 10, 2005

Miért fontos a találati listák jó rangsorolása?

Minél kevesebb kulcsszóból áll egy Kereső-kifejezés, annál fontosabb a találati oldalak megfelelő rangsorolása: Egyetlen kulcsszó sokkal több oldalon található meg, mint egy több szóból álló kifejezés, ezért a találatok száma igen nagy lesz. A rengeteg találat között úgy találhatjuk meg leggyorsabban a nekünk megfelelő információt, ha a keresők a legjobb minőségű, Értékes tartalommal bíró oldalakat veszik a Találati rangsor elejére. A hasznos oldalak felismerését többféle módszer ötvözésével végzik a keresők: egyrészt az oldalak Általános fontosságát igyekszenek meghatározni, másrészt az adott Keresésfüggő fontosságot.

Keresésfüggő fontosság megállapítása

Ez a tényező semmi mástól nem függ, csak attól, hogy az éppen keresett kifejezés hol, milyen formában és hányszor fordul elő az oldalon, az oldalakra mutató Linkre rakott kulcsszavak között, de akár még a Külső hivatkozások szövegkörnyezetében is.

Általános fontosság megállapítása

A web növekedésével arányban egyre kevesebb kérdést tudunk feltenni úgy, hogy arra csak egy helyen adjanak választ. Mivel többféle válasz létezik, ezért azok között rangsorolni kell, a válasz minőségének megfelelően. Mivel egy információforrás értéke semmilyen egyszerű paraméter segítségével nem fejezhető ki, ezért számtalan közvetlen indikátor megfelelő súlyozásával próbálják a keresők kideríteni ezt.

Az általános és speciális fontosság súlya

Egy gyakran előforduló kifejezés esetén sokkal fontosabb az oldal általános fontossága, hiszen sok hasonló speciális fontosságú oldal között kell valahogyan rangsort felállítani. Ritka Kereső-kifejezések esetén viszont kevesebb oldal kerül be egyáltalán a Találati rangsorba, ezért egy kisebb általános fontosságú oldal is könnyebben verekedheti fel magát a Top 10 pozíciók valamelyikébe.

A kifejezés hossza a keresés szempontjából

Ha több kulcsszóból áll egy Kereső-kifejezés, akkor a találatok száma tehát kisebb lesz, ami könnyíthetné a megfelelő oldalak megtalálását akár rangsorolás nélkül, vagy rosszabb rangsorolással is, viszont annál valószínűbb, hogy az általunk keresett információt (vagy annak legautentikusabb forrását) tartalmazó oldalon nem szerepel a keresett kifejezés, vagy nem pontosan abban a formában, ahogy beírtuk; ezáltal nehezítve megfelelő oldalak megtalálását. Ezért rövid, több jelentésű kereső-kifejezés esetén nagyon hasznos lehet a hasonló találati oldalak csoportosítása, az úgynevezett Klaszterezés.

Rangsoroló

http://rangsorolo.hu/

Az ELTE TTK és a SZTAKI Adatbányászat és webes keresés kutatócsoport által létrehozott projekt, amely egy viszonylag nagy (ámde elavult) adatbázis felhasználásával segíti az magyar nyelvű weboldalak fontosságának vizsgálatát különféle rangsorolási eljárásokkal és Klaszterezéssel. A Touchgraphhoz hasonlóan egy nagyon látványos Java alkalmazás segítségével vizualizálható az egyes oldalak közötti kapcsolatok hálózata, emellett rövid leírásokat találhatunk a különböző rangsorolási metódusokról.

Rangsoroló algoritmusok tesztelése

eval.google.com – óradíjas tesztelés

A Google Inc. például óradíjas tesztelőkkel vizsgáltatja a Rangsoroló algoritmusaiban eszközölt változtatások, fejlesztések hatását. Először Henk van Ess szivárogtatott ki információkat újonnan induló oldalán ( http://www.searchbistro.com ) az addig szigorú titok övezte projektről a Google titkos laboratóriuma című bejegyzésében. Az ezt követő bejegyzésekben közzétett továbbá olyan, belső használatra szánt dokumentumokat, melyekben a találati rangsorok értékelésének különböző szempontjait írják le részletesen, példaként szolgáló weboldalak bemutatásával: mi számít a Google számára értékes oldalnak egy adott típusú keresés esetén, mit kell Web spamként értékelni?

A „Rangsorolás” című bejegyzést 2005. 05. 10. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2008. 03. 17., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Page rank

2005. 09. 03. 13:34 · Névtelen hozzászóló →

Az üzleti élet minden részt vevője azt szeretné tudni, hogyan lehetek bennea keresők találatainak első 10 linkjén!Talán a problémakört egy kicsit lehetszűkíteni. Nem keresőgépekben, hanemkeresőgépben kell gondolkodni. Túl sokremek, általános témájú keresőgépről nem igazán beszélhetünk. Az igazi áttörést, Google a Te barátod jelentette, ’98 -tól Amerikába, intenzívebben, ’99-től, s 2000 -es évtőlmár Magyarországon nagy sláger volt.Nos ez a tény mit vonzz maga után, smilyen helyzetet teremtett? A Google védjegy s annak kereső motorját a licence díj megfizetése után, kereső szolgáltatásokra, együtműködésekre fel lehet használni. Ha megfigyelitek a tényeket, történelmi adatokat, láthatjátok pontosan ez a jelenség zajlott le. A nagyobb keresőgépek, lásd Altavista, a portál szerű Yahoo mind megvásárolták a Google kereső motor használati jogát. A fentiekkel csak azt akartam bebizonyítani amit mondtam, hogy nem kell keresőgépekben, elég egy keresőgépben a piacvezető Google -ben gondolkodni. Ha a Google keresőgépen belül a rangsorolásod, azaz Google Page Rank értéket jó, akkor biztos lehet benne mindenki, hogy a többi keresőgépben is pont ugyanabban a pozícióban, helyezésben, fog megjelenni a kérdéses oldal. Ezek után már csak az a kérdés, hogy lehet jó Google PR értéket elérni? A Google az egyetlen keresőgép, ahol mesterséges úton, eredményeket nem tud senki sem elérni. A Google úgy növeli bárki weboldalának PR értékét, hogy ha észreveszi, hogy adatbázisában, elsősorban a releváns tartalmak között hány más személy Internetes weboldalán van kint a Te linked. Minél nagyobb PR értékű weboldalra kerül ki a linked, annál jobban növeli a Google a Te weboldalad PR értéket. Igen ám, de nem könnyű elérni, hogy mások kirakják a Te weboldalad. Ez ellen nem tudsz sokat tenni. Vagy tetszik a többségnek a szolgáltatás amit nyújtasz, és akkor híressé fog vállni és sok ember linkel feléd, s akkor jó helyezésed lesz a Google -ben is, vagy ez nem történik meg de akkor nem lesz jó helyezésed.A Google oda figyel a SPAM -erekre is.Tehát ha egy adott Internetes oldalPR értéke túlságosan nagy iramban nő,akkor annak nagy a valószínűsége, hogy SPAM -elés áll a háttérben. S azt az oldalt automatikusan kizárja. Ugyanis, még ha a Te weboldalad nagyon ízléses és hasznos stb. akkor sem fognak olyan gyorsan kirakni az emberek az oldalukra (hiszen ettől még a hír lassan terjed), azaz több évig tart egy weboldal PR értékének növelése. Ez egy hosszú webmesteri procedúra, s a Google a Te barátod ezt tudja. Éppen ezért az olyan domain neveket, amelyek már több éve, esetleg 10 éveléteznek, és szolgáltatást nyújtanak a felhasználóknak (ez lehet kereskedelmi, vagy ingyenes szolgáltatás), akkor az idősebb domain -eknek kecsegtetőbb lehetőségeket teremt. A lényeg, hogy aGoogle PR érték növelés nem egyszerű munka, hasznos ötletek kellenek hozzá.Két ember létezik, aki Internetes oldalát nézetté akarja tenni:1. Ez egy olyan réteg aki a weblapjában buseiness-t lát, s maga is már elég nagy business -el rendelkezik és van sok pénze reklámokra. Pl. utcákon való plakát kihelyezésekre, vagy közlekedési társaságok járművein való megjelenésre, stb. Ezek az emberek növelik weboldaluk látogatottságát, de nem a keresőgép segítségével, hanem saját tőkéjükből, amelyet a megfelelő üzleti terv szavatol, hogy meg fog térülni.2. Ez pedig egy olyan réteg, amely azInternetes marketing egy igen speciális rétegét adja. Itt olyan felhasználók vannak, akik Internetes oldalukból pénzt akarnak csinálni, értékesíteni reklám helyeiket (szponzorált linkek, bannerok, stb.), de ugyanakkor sajátweboldaluk reklámozárására nem akarnak költeni. Ők szívesen aknázzákki a Google lehetőségeit. Hiszen statisztikák is bizonyítják, hogy egy jól megszerkesztett InterNet -es oldal látogatottságát 70 % -ban a keresőgépről érkező látogatók teszik ki.Milyen egy jól megszerkesztett oldal? Először is a robot.txt fájlt tartalmaznia kell, amely megadja a keresőgépnek, hogy a BOT, spider, stb. milyen gyakran keresheti fel oldalunkat. Ha a Google -nél ezeket a szabályokat nem foglaljuk össze egy robot.txt fájlban, akkor alapértelmezetten (ha van változtatás oldaladon, naponta), akkor mindennap végig fogja analizálni lapodat. Hogy érheted el azt, hogy napiváltozások legyenek az oldaldon? Először is gondoskodnod kell arról, hogy InterNet -es oldalad, integrált megjelenésű legyen, azaz PHP, ne pedig sima HTML. PHP értelmezők manapság már minden webszerveren rajta vannak, elérhetőek, az egyes ingyenes helyeken is.

Ha a fentiek szerint jártok el, akkor meggyőződhettek arról, ezek a szabályok esélyegyenlőséget teremtenek, mindenki között. S valóban az a weboldal fog megjelenni, az elsők között amelyeket a legtöbb ember érdekesnek tart. Ez így igazságos.Amit a Google még szeret, s amiért kicsivel jobb PR értéket képes odaítélni egy adott weboldalnak, a domain név életkorán túl:Ha Google ADS reklámot helyezel el az oldaladon. Ez egy világsiker, szinte mindenki támogatja a kezdeményezést, hiszen ez képes a Te weboldalad Kedves Olvasóinak oldalad tartalmával,ún. releváns reklámot biztosítani. Azaz a Kedves Olvasóid nem reklámnak hanem, őket nagyon is érdeklő szolgáltatásnak fogják tartani. S ezért a Google ADS programért, még pénzt is kapsz (ez benne a lényeg), számlaképesség kell hozzá, de ha valakit ez érdekel a google.co.hu -val vegye fel a kapcsolatot, mert vannak ott szakemberek, akikkel magyar nyelven is lehet levelezni, ők minden információval elfognak látni.

Végezetül, a témával kapcsolatos saját véleményem ecsetelése útán szeretném felajánlani, az összes webmesternek (akik olyan weblappal rendelkeznek, amely 90%-ban szabad szoftver elv terjesztéssel foglalkozik), hogy regisztráljon be a LinuxBázis -team- keresőprogramjába. De mégegyszer mondom, csak azok a webmesterek akik szabad szoftver terjesztéssel foglalkoznak (pl. GNU/Linux, freeBSD, stb.)

LinuxBázis -link felvételi kérelem-http://www.linuxbazis.hu/uj.php

Örültem, hogy itt lehettem, elolvashattam az értékes kulturált hozzászólásokat, és hogy én is hozzászólhattam. Ha valakinek a hosszú írásommal, raboltam idejét, I’m so sorry!

Page rank

2005. 09. 03. 16:33 · kaixo →

Köszönöm a hozzászólásod! Nagyjából össze is foglalta az egész, 200+ oldalas webhely mondanivalóját. Persze van néhány dolog, amivel nem értek teljesen egyet (pl. a php-n kívül van más szerver oldali technika Tárhely kiválasztása létrehozására; a robots.txt inkább tiltásra jó; nem vagyok biztos, hogy az elhelyezett Google hirdetések közvetlenül befolyásolnák a PR értéket.), de ez mit sem von le hozzászólásod értékéből.

üdv: kaixo

Nagyjából egyet értek

2005. 09. 05. 19:16 · Névtelen hozzászóló →

Az előttem szóló látogatóval és az oldal készítőjével is egyet értek nagyrészt. Az én röviden összefoglalt meglátásom ezzel kapcsolatban igen egyszerű. Ha valaki igényes a weboldalára, akkor (ha ő a programozó, ha nem) figyel arra hogy a szabványokat minél jobban betartsa és hogy az oldal minél jobb és használhatóbb legyen. Ha csak erre odafigyel, akkor a keresőkben valószínűsíthetően előbb utóbb viszonylag jó helyen lesz megtalálható. Mégpedig azért, mivel a keresők algoritmusai mint ahogy ez az egész weboldal bemutatja, úgy vannak kitalálva. Hogy az igényes tartalmú jó szabványos forrsákódú minél régebbi weboldalakat hozzák elöl. Természetesen hasznosnak tartom ezt az oldalt, hiszen akit érdekel a téma és a részletekre is oda akar figyelni, itt sok mindent megtudhat. Azonban azt is nagy hibának tartom, ha ennek valaki túlzottan nagy jelentőséget szán. Én azt tudom tanácsolni minden weboldal tulajdonosnak, hogy tegye rendbe oldalának forráskódját és tartalmát. Ha ezt odafigyeléssel és alaposan elvégzi biztos lehet benne, hogy a keresőkben is előbb utóbb a megfelelő helyen megtalálható lesz. Nem mellékesen természetsen az itt leírtakat is nyugodtan vegye azért figyelembe. 🙂

Soraimat, csak azért írtam le, mert szomorúan látom, amikor jövök.megyek az Interneten azt a sok sajnos azt kell hogy mondjam, igénytelen rosszul felépített átláthatatlan hibákkal telezsúfolt oldalt.

Re: Nagyjából egyet értek

2005. 09. 06. 16:24 · kaixo →

Azért az általad elmondottakon túl én még különösen fontosnak tartanám a Kulcsszavak kiválasztása‘t, a Kulcsszavak megfelelő elhelyezését, és a Külső hivatkozások menedzselését is. Ezek olyan kérdéskörök, melyek már túlmutatnak a Weboldalak ergonómiája‘n. Pont ezért lehet szükség a kereső-optimalizálásra, mint olyanra.

kisbetű vagy NAGYBETŰ

2007. 06. 13. 19:42 · Névtelen hozzászóló →

Eddig úgy vettem észre s szerintem ez a helyes, hogy akár kis akár nagybetűvel írok be egy kulcsszót a google keresőbe, ugyan azt a találatot adja.Most ha beírom a „szokásos kedvenc” kulcsszavam kisbetűvel akkor a 22.helyen hoz a google.hu, ha beírom csupa nagybetűvel akkor 4. helyen hoz. Sajnos nem fordítva. KB 3 héttel ezelőttig lassan egy éve mindig a 4. helyen voltam akár kis akár nagy betűvel írtam. Ha a belső linkjeim változtatása miatt sorolt hátrébb a google logikus, bár el vagyok szomorodva, de a csupa nagybetű esetén miért ad újra 4. helyet a 22. helyett, holtott ezt a kulcsszót, soha nem írtam le a honlapomon csupa nagy betűvel, s a külső linkek sem mutatnak így rá.Szóval kérdésem, hogy lehet ez, esetleg más is észrevette, hogy kavar mostanában a google?Volt úgy, hogy kétszer egymás után (pár másodperc eltéréssel) lekértem ugyan azt a keresést, s a honlapom helye 3 helyezést ugrott, vagy előre, vagy épp hátra.Vagy az áprilisi index.html módosításomat, május 25-én kezdte értelmezni, s még mindíg rágódik rajta?

kisbetű vagy NAGYBETŰ

2007. 06. 15. 12:08 · OldalGazda →

Talán jó lenne, ha lehetne tudni, hogy melyik kulcsszóval kapcsolatban figyelted meg ezt a jelenséget, anélkül azonban vajmi keveset lehet hozzászólni a témához. Lehet, hogy áprilisban módosítottad az index.html-edet, azonban időközben valaki linkelt még az oldalra, vagy -amint említetted- megváltozott az oldalad belső struktúrája, és ezt „értékelte” a Google, nem is az adott oldal módosítását.

RE: kisbetv V. nagybetv

2007. 10. 18. 13:04 · Névtelen hozzászóló →

Őőőő…

HIHIHI LOL:

Itt a link: informatika.blogol.hu/

nem jutok előre

2008. 03. 17. 08:48 · Névtelen hozzászóló →

Üdv,

van egy oldalam amivel megtorpantam picit…

turizmuson belül a lap legerősebb keresőszóra 26-27. helyen áll már egy ideje, és nem akar előrébb menni (3.500.000 találatból) – kifogytam az ötletekből, hogy mit kezdjek vele.

nem tudom ennyi info elég-e, hogy segitségetek kérjem, de várom a reakciókat. üdv, Zsolti

nem jutok előre

2008. 03. 17. 09:13 · OldalGazda →

Nem, ennyi infó csak arra elég, hogy azt mondjam, hogy kezdd el olvasni az oldalt a Keresőoptimalizálás bejegyzésnél, de semmiképpen se hagyd ki a Linknépszerűség növelése és a Linkre rakott kulcsszavak témáit sem!

Re: nem jutok előre

2008. 03. 17. 09:19 · Névtelen hozzászóló →

Nagyon egyszerű a megoldás: légy türelmes. (És persze addig is dolgozz a honlapon és a bejövő linkeken…)

A Google-nél ugyanis rendkívül nagy súllyal esik latba az időtényező. Előbbre jutni közvetlenül nem a saját munkád eredményeképpen fogsz, hanem azért, mert a Google egy adott napon úgy dönt, hogy onnantól kezdve jobban megbízik a honlapodban.

Ez a gyakorlatban úgy jelentkezik, hogy hosszú hónapokon át látszólag hiába fejleszted a weblapodat, hiába szerzel rengeteg elsőrangú linket – a helyezéseidet mintha bebetonozták volna. Aztán egy reggel megnézed a találati listát, és benne vagy az első ötben.

Ezután még egy ideig ingadozhat a helyezés, időnként visszaesel a korábbi helyedre, de néhány héten belül majd stabilizálódik.

Re: nem jutok előre

2008. 03. 17. 10:16 · Névtelen hozzászóló →

Mondjuk a turizmus témakörben elég vérre menő verseny lehet, biztos vannak néhány százan, akik arról álmodnak, hogy mikor jutnak be az első 5-be 🙂

Re: nem jutok előre

2008. 03. 17. 10:31 · Névtelen hozzászóló →

A turizmus… Van egy történetem: Még a nyáron megkeresett linkcserével egy turisztikai oldal. Az én pr 3mas oldalamra kérték az ő linkjük kirakását, cserébe én kikerülök az ő pr4es lapjukra. Mondom rendben van, jó üzlet ez. Én szépen kiraktam őket címlapra, bannerrel együtt, ők meg az egyik apartmanjukat bemutató oldal legaljára, 6-os betűmérettel. Természetesen nem pr4es volt az oldal. Egy hét elteltével vettem ezt észre, mert közben más dolgom volt. Kapásból le is vettem őket.Kíváncsi lennék, hogy hány laptulajdonossal játszották el ezt? Gyanítom, hogy mindenki egy jó pr-ű oldalra kerül alapból, aztán szépen szétszórják a linkeket. Egyébként, ha a horvátország szóra rákerestek, az ominózus oldalt dobja elsőnek a „Barátunk” + csomó hasonló kifejezésre.