Ontológia-alapú Tudástárház Rendszerek
Az előadás keretében egy nyelv- és témaspecifikus információ
beszerző, elemző és szolgáltató rendszer általános architektúráját és
tudás-orientált technikai megoldásait mutatjuk be. A teljes rendszer a
különböző tudás-intenzív technológiai és elméleti kihívások tükrében
került megvalósításra. Ez magába foglalja a témaspecifikus dokumentumok
automatikus keresését és begyűjtését a webről, a különböző, nem-
vagy alig-strukturált szöveges források elemzését és így a tudás kinyerését,
illetve a kinyert tudás tárolását és a felhasználók felé történő
tálalását. Ezen kívül speciális megoldásokat igényel a magyar nyelvű
szöveges dokumentumok nyelvészeti elemzése is.
Az említett rendszer fejlesztése a nemzetközi Információ és Tudás Tárház
(Information and Knowledge Fusion – IKF) projekt keretében zajlik. A projekt
globális céljai között elsősorban új intelligens tudás beszerző,
elemző és kezelő rendszerek tervezése és implementálása szerepel,
amelyek különböző alkalmazási területeken nyújtanak hatékony segítséget a
tudás-menedzsment szinten [1]. A magyar
konzorcium (IKF-H) a gazdasági szféra számára fejleszt tanácsadó és
döntéstámogató alkalmazásokat. A rendszer célja, hogy a weben hozzáférhető
heterogén és strukturálatlan magyar nyelvű információ forrásokból a
lehető legtöbb tudást kinyerje és ezt felhasználva támogatást nyújtson
bankok és egyéb pénzügyi szervezetek számára.
Ahhoz, hogy egy tipikus információ beszerző rendszer teljesítményét
felülmúljuk, az emberek által végzett információ keresés és elemzés folyamatát
kell megvizsgálnunk és – legalább részben – követnünk. Az emberi intelligencia
két fő összetevőjén múlik az említett folyamat sikeressége: (1) a nyelvészeti
szakértelem és (2) a rendelkezésére álló tudás használatán. Mivel a
különböző nyelvészeti technikák gyorsan fejlődnek és az alkalmazásuk
számos egyéb információ elemző rendszerben is előfordul, a legnagyobb
kihívást a megfelelő tudásbázis kilalkítása és rendszerbe integrálása
jelenti. Az emberek által is sokszor nehezen megfogható fogalmi tudás
reprezentálására egy hatékony megoldást kínál a megfelelő ontológia
felhasználása [2]. A projekt egyik fő célja, hogy egy
jól-definiált ontológia megalkotásával és felépítésével, illetve különböző
dokumentum elemzési technikákkal való integrálásával (nyelvi elemző,
indexelő és kereső, stb.) növelje meg a teljes információ beszerzési
és kinyerési folyamat teljesítményét.
Egy másik mód arra, hogy az információ beszerzéshez hasznos tudást
beépítsünk a rendszerbe az, hogy az emberek által végzett internetes dokumentum
keresési és elemzési folyamatot modellezzük és a rendszer működését ennek
megfelelően alakítjuk ki. A tervezett rendszer része egy autonóm
dokumentum kereső és beszerző modul, amely az említett elven alapuló
technikákat, illetve különböző internetes források tulajdonságának
modellezését felhasználva végez hatékony dokumentum beszerzést a teljes
rendszer számára [3].
Jelenleg a magyar IKF projekt keretében egy konkrét prototípus rendszer
fejlesztése folyik, amely lehetőséget ad a különböző ötletek és
megoldások implementálására valós alkalmazási környezetben.
[1] EUREKA PROJECT “IKF - Information and Knowledge Fusion”, March 2000.
[2] N. Guarino, “Formal Ontology in Information Systems,” In N.Guarino (ed.) Formal Ontology in Information Systems. Proceedings of FOIS'98, Trento, Italy, 6-8 June 1998. IOS Press, Amsterdam: 3-15.
[3] P. Varga, T. Mészáros, Cs. Dezsényi, T.P. Dobrowiecki, “An Ontology-based Information Retrieval System”, The 16th International Conference on Industrial & Engineering Applications of Artificial Intelligence and Expert Systems, Loughborough, UK, June 23-26, 2003.