Indexelési stratégiák az indexelt adatbázis alapú keresőkben
Nagy Tamás <bigtom@avalon.aut.bme.hu>
BME, Automatizálási és Alk. Informatikai Tanszék
Az ember több ezer éve próbálja rendszerezni, katalogizálni írásos dokumentumait. A rendszerezés egyik kiváló és régóta használt módszere a tartalom jegyzék készítése, illetve igen gyakran használnak dokumentumok reprezentálására illetve az azokban való gyors keresés megteremtésére index halmazokat, amelyek a dokumentumok legfontosabb kifejezéseit tartalmazzák rendezett formában. A dokumentumokhoz tartozó azokat leginkább reprezentáló legfontosabb kifejezések halmazát egészen az utóbbi időkig mindig emberek állították össze, amikor is a számítógépes kapacitások növekedésének köszönhetően lehetővé vált az indexek automatikus előállítása.
A modern kereső rendszerek működésének lényege azon dokumentumok megtalálása, amelyek a felhasználó által kívánt információt tartalmazzák. Ehhez a rendszerek kulcsa minden esetben a rendszer által kezelt index halmazok minősége. Az indexek a dokumentumok kivonatai, olyan minden információt nem hordozó elemtől megszabadított kifejezés listák, melyek lehetővé teszik a dokumentumok gyors kereshetőségét. A keresés legfontosabb kérdése tehát az a transzformációs lépés sorozat, amelynek eredményeként előáll a dokumentumot reprezentáló index kifejezések halmaza. Ennek mind megvalósítására, mind az egyes modellek finomítására számtalan módszer létezik.