Krauszné Princz Mária,
pmaria@delfin.klte.hu,
E cikk a weben lévő óriási
mennyiségű információ elérhetőségének lehetőségeit elemzi.
A weben át elérhető
információ egy része strukturált formában van tárolva (pl. relációs
adatbázisok), amelyek a megszokott eszközökkel (pl. SQL alkalmazásával)
lekérdezhetők.
Félig strukturáltak a HTML–ben
írt dokumentumok, ahol a strukturálást, s evvel a lekérdezhetőséget a
különböző meta elemek alkalmazásával érjük el. A HTML-t követő
XML–ben különböző névtereket alkalmazva
fokozhatjuk a szöveges állományaink
strukturáltságát, s ezáltal kereshetővé tételét.
Nem strukturált adatok (pl.
program fájlok, kép fájlok) is elérhetők természetesen a weben keresztül.
A weben lévő információ
megtalálásában két alapvető stratégiát követhetünk: egyrészt tematikus
keresőkben, rendszerező
könyvtárakban böngészhetünk a megfelelő információ után, másrészt
kereső motoroknak fogalmazhatjuk meg a kérdéseinket, amelyek
adatbázisaikból veszik elő a leginkább megfelelő válaszokat.
A láthatatlan web részét azon
információk képezik, amelyek fellelésében a keresőmotorok nem segítenek
nekünk.
Kulcsszavak: adatbázisok a weben , HTML, XML,
keresőmotorok, tematikus keresők, a láthatatlan web