Webhely strukturálása

március 29, 2005

Robotok kontra oldalhierarchia mélysége

Minél több kattintásra van egy weblap a webhely Nyitólapjától, annál ritkábban fogják a Keresőrobotok meglátogatni az a lapot. Valószínű, hogy az is számít, hogy mennyi / jel van az Elérési útvonalban, tehát az oldal hierarchiájának hány szintje van, ennek megfelelően a több könyvtárba ágyazott oldalak tartalmát ritkábban frissítik a keresők adatbázisukban. Érdemes tehát egyrészt minden oldalt a lehető legkevesebb kattintásból elérhetővé tenni (Oldaltérkép segítségével például) illetve a lapokat három hierarchikus szintnél nem mélyebben fekvő könyvtárakba temetni. A túl sok hierarchikus szint ráadásul túlságosan hosszúvá teheti az URL-eket, ami a felhasználók számára sem kényelmes, de lehet, hogy a hosszabb URL-ekben szereplő egyes kulcsszavak súlya kisebb lesz a Google szemében.

Nem árt továbbá odafigyelni a használhatóságra is: az emberek általában csak 5-6 elemből álló listákat tudnak áttekinteni, ahol ennyi mappánál nagyságrendileg több szerepelne a navigációs menüben, ott érdemes újabb hierarchiát beiktatni.

A strukturálás lehetőségei mások a statikus és dinamikus oldalak esetén:

Tárhely kiválasztása és a strukturálás

A Tartalomkezelő rendszer műfajától függ, hogy milyen lehetőségeink vannak. Például a Zwiki (lásd: WikiPedia:Zwiki) egy klasszikusan „lapos”, hierarchia nélküli webhely: pontosabban a hierarchia nem a fáljrendszer szintjén jelenik meg, hanem attól teljesen elkülönülve. A webni.innen.hu oldalon is megfigyelhető, hogy minden lap közvetlenül a legfelső szinten található, a navigáláskor azonban megjelenik a hierarchia. (Ebben az a zseniális, hogy menetközben változtathatjuk az oldalak csoportosítását anélkül, hogy változna az egyes oldalak Elérési útvonala.) Más rendszereknél, mint pl. a Plone tartalomkezelőnél úgy természetes, hogy több mappát hozunk létre almappákkal, a fáljrendszer-szerű strukturálást a különböző témák felhasználói felületen való megjelenése határozza meg, és igencsak meg kellene erőszakolni a rendszert, ha lapos struktúrát akarnánk létrehozni, kevés szinttel.

A lapos hierarchia hátránya lehet, hogy robots.txt-vel nem lehet annyira kifinomultan kezelni az oldal egyes részeinek elérését (letiltani pl. az offline böngészőket a túl nagy sávszélességfoglalás miatt.)

Mindkét, fenn említett tartalomkezelő az objektum-orientált Zope rendszerre épül (lásd: WikiPedia:Zope), azonban az elterjedtebb PHP + MySQL tartalomkezelőknél és az egyéni megoldásoknál gyakori, hogy az oldalak címében semmilyen strukturálás nem érhető tetten, például fiktívoldal.hu/modules.php?name=Forums szerpel a sokkal természetesebb fiktívoldal.hu/forums helyett, a fórum egyik témája meg mondjuk fiktívoldal.hu/modules.php?name=Forums&file=viewforum&f=2&sid=1d47376309eeb28f95c61597b22dc18d formában jelenik meg, tehát az Elérési útvonal az oldalak tárolására szolgáló adatbázis lekérdezésének paraméterei alapján alakul ki.

Statikus weboldalak strukturálása

Figyelembe kell venni, hogy ha minden oldalt egy szinten helyezünk el, akkor nehezen válik majd áttekinthetővé a sok html és képfálj. Emiatt érdemes a képeket külön mappába tenni, illetve a hasonló témacsoportba tartozó oldalak nevét úgy megírni, hogy az ábécésorrendben egymás mellé kerüljenek: ekkor némileg könnyebb a sok fálj kezelése és kevesebb mappára is van szükség.

Struktúra és PageRank

Érdemes úgy összelinkelni webhelyünk oldalait, hogy a PageRank értékek ne egyenenletesen oszoljanak meg, hanem bizonyos oldalakra jobban koncentrálódjék a PR érték. Ezek az oldalak között elsősorban a Nyitólap és az altémák oldalai (ezen a webhelyen, pl. ilyen a Keresőoptimalizálás, Keresés, stb. weblapok ) szerepeljenek, de szóba jöhetnek még a Mélylinkelés jellegű bejövő Külső hivatkozások céloldalai is. A lényeg, hogy nagyobb esélyünk van akkor jó helyezést elérni egy Kereső-kifejezésre, ha szerepelnek a Kulcsszavak az oldalon, és minél magasabb a PR értéke. Ezt a fajta hierarchikus megoszlást úgy érhetjük el, ha a hierarchia felső szinten lévő oldalak nem minden alattuk álló oldalt hivatkoznak meg, hanem csak néhányat, viszont az alattuk levő oldalak mind visszamutatnak az PR érték koncentrálására kijelölt lapra. Emiatt érdemes továbbá az Oldaltérképet nem a nyitólapon megjeleníteni, csak onnan belinkelni.

Ezen a webhelyen például ezért nem szerepel a FrontPage nevű nyitóoldalon a hierarchiában alatta levő összes weblap, mint a webhely egyéb helyein, noha használhatósági szempontból létjogosultsága lehetne.

Leggyakoribb html elemek a Google szerint

http://code.google.com/webstats/index.html

A Google kereső 2005 decemberében több mint egy milliárd weblap elemzése alapján érdekes kimutatásokat készített a leggyakoribb html elemekről és attribútomokról.

A „Webhely strukturálása” című bejegyzést 2005. 03. 29. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2008. 02. 26., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások

Szerintem elszúrtuk…

2007. 11. 26. 16:44 · Névtelen hozzászóló →

Kedves József !

Rendkívül lenyűgöz, amikor olyan emberek írására akadok bárhol, akik SZERETNÉK ÁTADNI a tudásukat.Köszönet és elismerés érte !!!

A helyzet röviden:

Van két domain nevünk… – Csak példa lesz: 1. sajatunk.hu, 2. fontos.hués van EGY tárhelyünk…

A tárhely, végülis a „sajatunk.hu” domain „tárhelye”…A „sajatunk.hu” domain KÖZVETLENÜL a tárhely „gyökerébe” „érkezik” , az itt lévő index.html-állomány a kezdőlapja…A tárhelyen több alkönyvtárat hoztunk létre, hogy témakör szerint tovább tudjuk csoportosítani a honlapot…

Pl.:sajatunk.hu/egyebek /fontos /kicsitaz /nemerdekes /talankell

NA és innen az érdekes ! Végülis anyagi megfontolásból, nem akartunk újabb tárhelyet bérelni a „fontos.hu” számára…(nagyon! kevés állomány lesz…)Ezért megkértük a domain-regisztráló céget, irányítsa a „fontos.hu”-domainünket a meglévő tárhely /fontos könyvtárába… 😛

A baj az, hogy a „fontos.hu” oldalunkat a google mintha „nem is látná”… hiába miénk a domain, a tartalmát nem ismeri… (??)A „sajatunk.hu” oldalt azt megtalálja OK… ! – ha az ott szereplőkre keresünk.Tudom… az eddig olvasottak alapján, simán vesztettünk a réven is, meg a vámon is… 🙁

A kérdésem:Ésszerű lenne-e „megcserélni” a két domain tartalmát ?Tehát a „fontos.hu” lenne (érkezne) a „gyökérben” -mert ez a fontosabb… 🙂 És akkor a google megtalálná az ott szereplőket…A „sajatunk.hu” domaint pedig „átirányítanánk” egy (valamelyik) alkönyvtárba… – mert ez nem annyira lényeges…

Vagy, valamilyen módon egyenértékűvé lehet-e tenni -keresés szempontjából- a két domain nevet, a jelenlegi könyvtárszerkezettelés átírányítással…

Vagy inkább saját tárhely kell mindkét domain névnek, hogy egyenértékűek legyenek?

A választ nagyon köszönöm !!!

Tisztelettel: Lac

Szerintem eszúrtuk… – pontosítás

2007. 11. 27. 10:32 · Névtelen hozzászóló →

Az „alkönyvtárak” mind külön-külön vannak a „gyökérben”…nem egymásból nyílnak… – csak itt így jelentek meg…

Lac

re: Szerintem elszúrtuk…

2007. 11. 27. 13:56 · Névtelen hozzászóló →

Én azt tenném, hogy a sajátunk.hu-ból a link ne sajátunk.hu/fontos-ra mutasson, hanem fontos.hu -ra, sehol ne tedd láthatóvá hogy a fontos az egy almappa. sőt a .htacces-ben tennék egy átirányítást, hogyha a googli emlékezetből keresné sajátunk.hu/fontos-t akkor tudni fogja, hogy a helyett fontos.hu-t kell keresni. s ha már a /fontosnak van pagerank értéke akkor azt a googli át fogja adni a fontos.hu -nak.Mondom én, de majd József megmondja, ő a kompetens.

Szerintem elszúrtuk…

2007. 11. 27. 14:42 · Névtelen hozzászóló →

Helló!

Ha már az OldalGazda nyitott tárhelyek oldalakat … akkor mediacenter ott egy tárhelyre sok domaint tehetsz.Lesz egy fontos.hu és egy sajatunk.hu könyvtárad és a netről úgy látszik mint két teljesen független domain … nem akarok többet írni nehogy reklám gyanúba keveredjek … külön stat, email, meg minden … és egy tárhelyet fizetsz

NT

köszönöm…

2007. 11. 27. 16:02 · Névtelen hozzászóló →

Köszönöm a segítségeket!

…bár most kicsit így érzem magam… :

„Részt vettem egy gyorsolvasó-tanfolyamon. A Háború és békét nem egészen 20 perc alatt olvastam el. Az oroszokról szól.” /Woody Allen/

  • szóval az első javaslat, a domain nevekről szól :-)))Hol van az a „link” ami ide-oda mutat…? Én egy átlagos felhasználó vagyok aki FTP-vel tudok a tárhelyre feltölteni állományokat.

Húú…

NT hozzá(m)szólása az OK 😉 – köszi.

Lac

Pontosítás kellene

2007. 11. 28. 06:22 · Névtelen hozzászóló →

Ha beírod, hogy fontos.hu/valami.html, akkor a böngészőben

a) fontos.hu/valami.html vagyb) sajatunk.hu/egyebek/fontos/valami.html

jelenik meg?

Ha az utóbbi, akkor a fontos.hu csak egy továbbugrasztó oldal, nem csoda, hogy a Google-t nem érdekli. Ha viszont az alkönyvtárhoz hozzá van rendelve a fontos.hu domain (amit egyébként nemcsak a Mediacenternél lehet megcsinálni, hanem gyakorlatilag bárhol, ahol admin-felületen keresztül te intézheted a beállításaidat), akkor az teljes értékű különálló honlappá válik.

A „hiába miénk a domain, a tartalmát nem ismeri” problémát is pontosítani kellene. Úgy érted, hogy a sajatunk.hu/egyebek/fontos/valami.html oldalt se ezen a címen, se a fontos.hu/valami.html címen nem vette fel az adatbázisába, pedig mutat rá hivatkozás?

Pontosítás kellene

2007. 11. 28. 08:38 · OldalGazda →

Nem csak én vagyok ám kompetens, köszönet mindenkinek, aki hozzászól és segíteni akar!

Egyébként én nem bonyolítanám túl ezt a helyzetet, csak egy dolgot tartanék szem előtt: egy tartalom, egy domain! Ha tehát az egyik domain alól tartalomként csak a másik domain egyik mappáját tudjuk felkínálni, akkor ne tegyünk ilyesmit, ez nem túl gyümölcsöző.

Válasszuk ki a fontosabb domaint, használjuk csak azt mindenhol. Ha a kevésbé fontos domainra mutatnak külső linkek, akkor keressük meg a hivatkozó rendszergazdákat, és kérjük a linkek átirányítását a fontosabb domainra. A kevésbé fontos domainnak tehát csak akkor lenne szerepe, ha beírják a böngészőbe, és akkor is csak annyi, hogy egyből a fontosabb domainra irányít át. Később, majd ha sikerült önálló, egyedi tartalmat kitalálni a kevésbé fontos domainra is, akkor lehet értelme azzal foglalkozni.

Némi pontosítás:

2007. 12. 02. 06:01 · Névtelen hozzászóló →

Mindenek előtt, köszönöm az ötleteiteket és az elemzéseiteket !!!

  1. „2007 06:22:33″Ez segített hozzá ahhoz, hogy rájöjjek, valami gond az átirányítással van…Pl.: Ha a bongésző (URL)-be beírom: hátétépé://fontos.hu , megjelenik az „Ő” index.html-tartalma, DE’ nem az „Ő” „title” szövege jelenik meg !Pl.: A mi fontos dolgaink – Mozilla Firefox, hanem ez: 3duplavé.fontos.hu – Mozilla FirefoxPersze az is lehet, ennek nincs jelentősége… (a keresés szempontjából) ezt Ti jobban tudjátok… De ha a gépemen lévő index.html-t indítom (jelenítem meg) akkor szépen kiírja: A mi fontos dolgaink – Mozilla FirefoxTehát az átirányítás nem „egészen” jó…Na most, hogy mi a baj vele azt nem én fogom kideríteni… megkérem a szolgáltatót cserélje meg a két domain „hozzáférését a tárhelyhez” és akkor remélem megoldódik a gondunk… 🙂

1/b. pontosítás -hoz én kérek segítséget… :-)”se ezen a címen, se a fontos.hu/valami.html címen nem vette fel az adatbázisába, pedig mutat rá hivatkozás?”Hogy tudom leellenőrizni, hogy „felvette-e” – beírom a keresőbe az oldal jellemző szavait ? És ha kiadja találatként, akkor felvette ?Vagy van a google-nek „ilyen” megtekinthető adatbázisa ?”pedig mutat rá hivatkozás?” – ez a hivatkozás hol van ? Egy másik honlapon, vagy a tárhelyünk egy másik oldalán ?

  1. Az OldalGazda írására „2007 08:38:07”:Valószínű ez a leghatékonyabb eljárás esetünkben (is)…

KÖSZÖNÖM a segítségeteket !! – majd jelzem ha fordult a kocka 😉

Lac

Re: Némi pontosítás

2007. 12. 02. 09:53 · Névtelen hozzászóló →

Amit leírsz, az így látatlanban arra utal, hogy nem teljesértékű tárhelyed van, hanem egy ingyentárhely (pl. ultraweb, freeweb), amiről levették a hirdetési csíkot, de a mérőkódot vagy valami más szemetet bennehagytak. Ezért az oldal, bár nem látod, valójában keretes szerkezetű.

Ettől van más title szöveg a gépeden elindítva (mert ekkor a saját title-odat látod), és más title szöveg az interneten (mert ott a keretrendszert meghatározó oldal valószínűleg automatikusan adott title-ját látod).

Ha tényleg erről van szó (mármint reklámcsíktalanított ingyentárhelyről, vagy freewebnél vett szarról), akkor hagyd ott és vegyél rendes tárhelyet.