Keresés és az információ rendszerezése
Az, hogy egy információ-tároló rendszerben – egyszerűbben információforrásban – hogyan lehet keresni, azt a rendszer felépítése alapvetően befolyásolja. Az alábbiakban a főbb információkezelő rendszer-típusok, az információhoz való hozzáférés szerint történő csoportosítása következik.
Lineáris információtároló rendszerek (egydimenziós)
Általában: Az információ tárolása, létrehozása, fellelése lineáris módon történik. Leggyakrabban időrendben, vagy gondolatmenet szerint következnek az egyes információegységek. Vegytisztán ilyen például egy film, egy regény, vagy egy verseskötet. Leggyakrabban azonban egy másik rendszerrel ötvözött formában létezik, amely az egyes egységeket fejezetekbe csoportosítja: ezek közvetlenül is elérhetőek például tartalomjegyzék segítségével.
Az interneten: Régebben léteztek még olyan honlapok, ahol az új weblapokat sorolták fel, mutatták be. Manapság már annyi webhely létezik, hogy az effajta feldolgozás értelmét vesztette.
A webhelyeken: Jelenleg ez a legnépszerűbb, legdivatosabb honlaptípus, melyet Weblognak neveznek. A weblogok esetén legtöbbször csak az időrendi sorrend a szervezőerő, melyet az archiválás tesz némileg átláthatóbbá, illetve a mai modern weblogoknál már elterjedt a címkézés használata is.
A számítógépen: A felhasználói felületen közvetlenül a legutóbb megnyitott dokumentumokat listázó menü formájában létezik, melyeket sok alkalmazás, de maga az operációs rendszer is felkínál. Közvetetten ilyen a fájlkezelők listáinak név, méret, típus, stb. szerinti sorrendbe állítása.
Adatbázis alapú rendszerek (táblázatos, vagyis kétdimenziós)
Általában: Nagy mennyiségű adat tárolására leginkább ez a formátum használatos. Sok adattípusnál szükségtelen és értelmetlen is lenne az összes adat megjelenítése, így az információhoz lekérdezések segítségével férhetünk hozzá. Legtöbbször egy vagy több feltétel megadásával listázhatóak ki a lekérdezésnek megfelelő találatok, de sokszor a szabadszavas keresésen alapuló információkezelő rendszerekkel ötvözik az adatbázisokat.
Az interneten: Nem jellemző, hogy az interneten található weboldalakat adatbázisokkal rendszerezzék, bár kivételként említést érdemel a Wayback Machine, ahol a weboldalak régebbi állapotait kérdezhetjük le az URL és az idő ismeretében.
A webhelyeken: Számtalan adatbázishoz férhetünk hozzá webes felületen keresztül, azonban az ezekben az adatbázisokban található információ a legtöbb esetben a Láthatatlan webet gyarapítja.
A számítógépen: A táblázatkezelő programok már nagyon régóta minden irodai alkalmazáscsomag alapvető részét képezik.
Térinformatikai rendszerek (kétdimenziós)
Általában: Az adatbázis alapú rendszerek egy altípusa, mely a felület koordinátáihoz rendel információkat, melyeket térbeli navigációs funkciók segítségével (mozgás, nagyítás, kicsinyítés) lehet elérni, majd előhívni.
Példák: A különböző térképek már régóta léteznek a weben, de a Google Maps, Google Earth és a rájuk épülő alkalmazások azok, melyek forradalmasíthatják az információ-tároló rendszerek fejlődését. Vannak továbbá olyan alkalmazások, melyek nem valós koordinátákat vizualizálnak, hanem más típusú információkat. Ilyen például a http://visitorville.com , ami a weboldal Látogatottsági statisztika‘ját jeleníti meg egy háromdimenziós városmodell segítségével.
Hierarchikus rendszerek
Általában: Az információt fa-struktúrának megfelelő, egymásba ágyazott kategóriák segítségével csoportosító rendszer, melyből a megfelelő kategóriák kiválaszásával, a köztük való böngészéssel lehet kinyerni az adatokat. A csoportok rendszerezőelve rendkívül sokféle lehet, mint például a származás (botanikában), témakör a tematikus besorolásoknál, illetve több elv kombinációja is, mint a számítógépeken tárolt mappák és fájlok esetén.
Az interneten: A weboldalak rendszerezésében régen fontos szerepet töltöttek be a Tematikus katalógusok. A Yahoo! Inc. is kizárólag téma szerinti katalógust fejlesztő cégként indult, de azóta ez már csak egy (marginális) szolgáltatása a sok közül. Az Open Directory Projecttel kapcsolatban is merülhetnek fel kifogások manapság. Mindez azért alakult így, mert a weboldalak nagyságrendje meghaladta már azt a szintet, ami kezelhető lenne hierarchikus csoportokba sorolással. Egyrészt az webhelyek csoportosítása emberi közreműködést igényel, mely nem tud lépést tartani a fejlődéssel, másrészt ekkora mennyiségű információt kezelhető formában nehéz ebben a formában prezentálni.
A webhelyeken: Gyakorlatilag minden webhelyen használnak hierarchikus rendszerezést, ez a legelterjedtebb webes rendszerezési forma. A statikus weboldalak esetén ez teljesen magától értetődő, mivel az fájlok a szerveren fizikailag is ilyen csoportosításban lelhetőek fel.
A számítógépeken: A fájlok rendszerezése, kezelése szinte kizárólag csak egymásba ágyazott kategóriákkal lehetséges, melyeket mappáknak hívunk. Említésre méltó kivétel a Mac OS X Spotlight funkciója, illetve a BeOS Queries Folder funkciója. Az OS X Tiger segítségével szabadszavas kereséssel rendszerezhetjük a fájlokat, a BeOS-ban hosszú évekkel ezelőtt megjelent funkció segítségével pedig lekérdezéseket lehetett mappaként elmenteni. Mindkét esetben másodlagossá válhat, hogy fizikailag hol található a fájl a hierarchiában, ami új utakat nyithat a számítógépes életünk szervezésében.
Nemhierarchikus hálózatok
Általában: Az egyes információegységek között többszörös kapcsolatok léteznek, melyek az egymással összefüggő adatok között teremtenek közvetlen kapcsolatot. A keresett információ fellelése e kontextusba ágyazott hivatkozások segítségével történik.
Az interneten: Nos, ez a hipertext általános leírása is, az egész internet egy ilyen típusú információkezelő rendszer.
A webhelyeken: Talán a Wiki mondható a klasszikus hipertext ideájához legközelebb eső tartalomkezelési műfajnak. Mivel nagyon egyszerű az egyes oldalak között hivatkozásokat létesíteni, ezért sűrű, és ennélfogva jól használható hivatkozás-hálózat épülhet ki az oldal alegységei között.
A számítógépeken: Az információkezelés efféle módját csak pár úttörő jellegű alkalmazás segítségével gyakorolhatjuk, mint például a személyes adatok rendszerezésére wiki alapú megoldást nyújtó TiddlyWiki.
Szabadszavas keresésen alapuló rendszerek
Általában: Az információegységekben található adathoz Kulcsszavak alapján történő hozzáférést biztosító rendszer. Elsődleges funkciója szerint megjeleníti az összes olyan egységet, mely megfelel a kulcsszavakra épülő Kereső-kifejezéseknek. Legfontosabb másodlagos funkciója, a Rangsorolás, mely során speciális tényezők figyelembevételével rangsort állít fel a találatok között. Így a relevánsabb egységek kerülnek az élre, ami megkönnyíti a megfelelő információ fellelését.
Az interneten: Az webes információkeresés leggyakrabban használt eszközei a Szabadszavas keresők.
A weboldalakon: A használható weboldal fontos eleme a keresőmező, mely segítségével az oldal tartalmára szűkítve kereshetünk. Ezt a funkciót vagy a saját Tartalomkezelő rendszer biztosítja, vagy pedig egy harmadik fél, mint például az „AdSense Kereséshez” program. Az épp olvasott weblapon is kereshetünk böngészőnk segítségével: sokszor e funkció segítségével olvassuk a weboldalakat, különösen, ha már az oldalra magával egy kereső segítségével érkeztünk.
A számítógépeken: A Mac OS X Tiger Spotlight funkciója az első igazán használható szabadszavas keresőfunkció, mely egy asztali operációs rendszer részét képezi. Ezen felül pedig léteznek még olyan egyéb alkalmazások erre a célra, melyeket külön installálni kell, mint pl. a Google Desktop Search.
Címkézésen alapuló rendszerek
Általában: Az egyes információegységeknek az adott egységet leíró plusz adatok hozzárendelésével történő csoportosítása. A fenti példákkal szemben – ahol az információ egységhelyzete vagy tartalma önmagában meghatározza annak besorolását, elérhetőségét –, a címkézésen alapuló rendszerek létrehozásához egy másodlagos információrendszer felépítése szükséges. Ez a rendszer lehet összetett és szigorúan szabályozott metaadatok rendszere, mint például a Dublin Core, vagy egyszerű egy-két szavas kifejezések segítségével történő taggelés.
Az interneten: Legszebb példa a del.icio.us, Flickr és társai, mely oldalak a webhelyek linkjeihez a nagyszámú felhasználó által hozzáadott egyszerű címkék segítségével rendszerezik az interneten fellelhető információkat.
A webhelyeken: A modern Weblog oldalak mindegyike él a címkézés lehetőségével; a címkék laza rendszere jól passzol az egymáshoz csak laza szálakkal kapcsolódó információegységek rendszer(telen)ségéhez. A TiddlyWiki szintén jó példát ad a címkézés praktikus megvalósítására.
A számítógépeken: Az egyszerű címkézésen (taggelés) alapuló rendszerek diadalmenete egyenlőre csak a weben kezdődött meg, az operációs rendszereken megvalósítása még várat magára.
Összegzés
A fenti csoportosítások az információ hozzáférésének módján alapulnak, nem veszik figyelembe azt, hogy például ezekben a rendszerekben található adatok fizikailag milyen formában vannak letárolva. Rengeteg dinamikus weboldal működik adatbázis alapon, azonban ez az oldal működése során sokszor csak az adatbázis lekérdezéseit kódoló Elérési útvonalakban mutatkozik meg, a felhasználói felületben, elérési funkciókban nem.
Általánosságban elmondható, hogy ritka a vegytisztán egyik, vagy másik kategóriába sorolható rendszer. Minél többfajta rendszer áll rendelkezésre az adatok eléréséhez, annál hatékonyabban, könnyebben használható az információforrás. Például ezen az oldalon az alábbi hozzáférési lehetőségek találhatóak meg:
- Lineáris: az egyes fejezetekben található oldalak sorrendje megváltoztataható, a felhasználói felületen van következő és előző oldalra mutató link.
- Hierarchikus: az oldalak szülő oldala szabadon változtatható, a tartalomjegyzékre kattintva megtekinthetjük az egész webhely összes lapjának rendszerezését.
- Szabadszavas hozzáférés: keresőmező is létezik, jelenleg külső szolgáltató, a Google Inc. szolgáltatásaként.
- Nemhierarchikus hálózat: mivel az oldal technikailag és műfajilag egy Wiki, az egyes lapok között sűrű hivatkozáshálózat segíti (vagy bonyolítja) a navigálást.
A „Információszervező rendszerek” című bejegyzést 2005. 10. 24. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2008. 04. 29., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.