URN:NBN - elektronikus dokumentumok hossztv azonostsa

Aradi Blint[i], Ittzs Pter, Horvth dm

Orszgos Szchnyi Knyvtr, 1827 Budapest, Budavri Palota F. plet

Kivonat

Az URN (Universal Resource Name) egy olyan azonost, amely az interneten tallhat elektronikus dokumentumok hossztv azonostsra szolgl. Ennek egy altpusa az NBN (National Bibliography Number). Az URN azonost tpust azzal a cllal hoztk ltre, hogy kikszbljk az URL-ek hasznlatbl fakad htrnyokat. Mivel az URL-ek gyakran vltoznak, a hivatkozsok folyamatos karbantartsa nagy erőfesztst ignyel. A problmt mg tovbb nveli, hogy a vltozst kzlnnk kell mindazokkal, akik az ltalunk kzztett forrsra hivatkoznak. Az URN azonostk (termszetesen az URL-el egytt) ezekre a nehzsgekre prblnak megoldst nyjtani. Az Orszgos Szchnyi Knyvtrban is ppen most zajlik az URN-NBN rendszer bevezetse egy nylt projekt keretben, amely rvn lehetősg nylik a magyarorszgi knyvtrak s internetfelhasznlk szmra, hogy elektronikus dokumentumaikat egyedi hossztv azonostval lthassk el.

1. Bevezets

A vilghl dinamikus fejlődsnek ksznhetően rohamosan nvekszik az elektronikusan (is) elrhető informcik mennyisge. A papralap informcikzlssel szemben az elektronikus tartalomszolgltats egyik nagy előnye az informcik sszekapcsolsban rejlik, vagyis hogy nem csak hivatkozni tudunk ms (szintn elektronikus) forrsokra, de azok egy kattintssal meg is tekinthetőek. Mindez azonban csak akkor műkdik hossz tvon, ha az azonostk, amelyek alapjn a dokumentumokra a hivatkozs trtnik, nem vltoznak az időben, s mindig ugyanazt az objektumot jellik.

Az elektronikus tartalom azonostsra az interneten egyelőre szinte kizrlag az URL-t (Universal Resource Locator) hasznljk, amely minden egyes dokumentum esetben annak lelőhelyt adja meg. Elvileg URL-ek is lehetőv teszik a dokumentumok hossztv azonostst, m az elterjedt gyakorlat alapjn ezek tartssgra nem lehet szmtani, mert igen sokszor előfordul, hogy egy-egy dokumentum lelőhelye megvltozik. Sajnos, ezek nem csak olyankor fordulnak elő, amikor valamilyen honlapot ms szerverre (vagy ms szolgltat ltal zemeltetett szerverre) teleptenek t, hanem igen gyakoriak az olyan vltozsok is, amikor csupn a szerveren kialaktott knyvtrstruktrt alaktjk t, m ezltal az rintett dokumentumok eredeti URL-je rvnytelenn vlik [[1]]. Az trendezs sorn rintett dokumentumok kztti koherencit (a belső hivatkozsokat) az zemeltetők ltalban helyrelltjk, m a msok ltal kezelt (klső) hivatkozsok frisstse sok esetben nem (vagy csak nagy ksssel) trtnik meg, gy olyan hivatkozsok maradnak htra, amelyek nem ltező dokumentumra mutatnak.

Erre a problmra jelentenek megoldst az elrsi helytől fggetlen egyedi azonostk. Ezek az azonostk nem tartalmaznak informcit a dokumentum tnyleges lelőhelyről, gy alapjt kpezhetik egy hossz tvon is koherens hivatkozsrendszernek. Termszetesen a dokumentum elrshez annak lelőhelyre (URL-jre) is szksg van, m az adott azonosthoz tartoz tnyleges lelőhelyet elegendő csupn egy kzponti helyen megadni s frissteni, ahonnan aztn az azonost alapjn trtnő keresskor ez kiolvashat. Amennyiben a dokumentum gazdja a lelőhely megvltoztatsakor az azonost s a lelőhely kzti hozzrendelst ezen a kzponti helyen frissti, az egyedi azonostkon keresztl trtnő klső s belső hivatkozsok koherencija adminisztrcis munka nlkl is automatikusan megmarad.

2. Az URN

Az hossztv azonosts előző pontban lert kvetelmnyek tbbek kztt az Orszgos Szchnyi Knyvtr (OSZK) ltal is bevezetni kvnt URN (Universal Resource Name) is megfelel. Az URN egy olyan azonost, amely kiadsa szablyozott mdon, erre felhatalmazott intzmnyek ltal trtnik. Szintakszist az RFC 2141-es szm ajnlsa rgzti [[2]], amely alapjn egy URN

urn:<nid>:<nss>

alak, ahol a <nid> (name space identifier) az URN-ek tpust (nvtert) jelli, az <nss> pedig az adott tpus (adott nvtrbe tartoz) URN-nek kztt mr egyrtelmű azonostt ad meg.

A nvtr szerinti megklnbztets (<nid>) szksgessge abbl fakad, hogy tbb fajta rendszer is ltezik, amely alapjn egyrtelműen be lehet sorolni az elektronikus dokumentumokat. Ilyen jl ismert rendszer lehet pldul knyvek illetve folyiratok esetn az ISBN ill. az ISSN szm, de kpezheti egy, a nemzeti knyvtrak ltal adott szm (NBN -- national bibliography number) is az azonosts alapjt. Ez utbbi előnye, hogy tetszőleges knyvtri kategriba eső elektronikus dokumentumnak adhat.

3. Az URN:NBN

Az URN:NBN azonostk az URN azonostk egy olyan nvterbe tartoznak, amely felett minden orszgban a nemzeti knyvtr rendelkezik. Maga az URN:NBN nvterlet a Finn Nemzeti Knyvtr kezdemnyezsre kerlt bejegyzsre, felgyelett s adminisztrcijt az Egyeslt llamokbeli Library of Congress vgzi. Minden nemzeti knyvtr ignyelhet ezen a nvtren bell egy tartomnyt magnak, amelyen bell azonostkat adhat ki. Az URN:NBN szintakszisa

urn:nbn:<orszgkd>-<egyedi azonost>

alak, ahol az <orszgkd> a krelmező orszg ktbetűs (ISO 3166 szabvny szerinti) rvidtst, az <egyedi azonost> pedig tetszőleges, az URN szintakszisn bell megengedett egyrtelmű azonostt jelent. rvnyes URN:NBN azonostk lehetnek pldul az

urn:nbn:fi-fe20010312 s urn:nbn:hu-11234

azonostk, ahol az előbbi a finn, az utbbi pedig a magyar nemzeti knyvtr hatskrbe tartozik.

4. URN:NBN kezdemnyezs az OSZK-ban

Az Orszgos Szchnyi Knyvtr a kzeljvőben a bevezets vgleges fzisba rő URN:NBN rendszer segtsgvel lehetősget kvn nyjtani a magyarorszgi knyvtrak s a hazai internetfelhasznlk szmra, hogy dokumentumaikat egyedi hossztv azonostkkal lthassk el. Az azonostk ignylse teljesen nyilvnos, brki szmra elrhető szolgltats. A bevezetendő rendszer kialaktsa olyan, hogy az azonostk ignylse, mind HTML-űrlapokon, mind pedig automatikusan, program segtsgvel is trtnhet. URN:NBN azonost csak nyilvnos, mindenki szmra hozzfrhető dokumentumnak ignyelhető. A bevezets első fzisban az ignyls csak HTML (text/html) tpus dokumentumokhoz trtnhet, ez azonban ksőbb egyb dokumentumformtumokra (pl. pdf) is bővlhet. Szintn csupn az első időszakot jellemző korltozs, hogy egy dokumentumhoz csak egy URN:NBN azonostt lehet ignyelni, valamint, hogy egy URN:NBN azonosthoz csak egy URL rendelhető. (A ksőbb bevezetendő tbbes hozzrendels azt a clt szolglja, hogy ugyanazon dokumentum klnbző helyeken megtallhat pldnyainak mindegyike nyilvntarthat legyen a rendszerben.) A projekt sorn kszlő szerver, illetve az URN:NBN ignylst s karbantartst segtő programok forrskdja nylt, gy az brki szmra hozzfrhető lesz.

4.1. URN:NBN ignylse

Az URN:NBN azonostk ignylse HTTP protokollon keresztl trtnik, amelyben az azonostt előllt (s HTTP GET metdussal meghvott) szervernek paramterknt t kell adni azt az URL-t, amelyen az azonostval elltni kvnt dokumentum tallhat, pldul

http://nbn.oszk.hu/GetNBN?url=http://igenylo.hu/dokumentum

alakban. (A pldkban szereplő szerver- s paramternevek mg nem vglegesek, ezrt a nyilvnos verziban eltrhetnek az itt feltntetettektől.) A szerver ezutn elvgzi az adott URL-lel rendelkező dokumentum ellenőrzst (html-formtum dokumentum-e, nincs-e mg azonostja, stb.), majd sikeres ellenőrzs utn egy URN:NBN azonostt ad vissza vlaszknt. Ezt az azonostt el kell helyezni a html formtum dokumentum fejlcben (a <head> s </head> elemek kztt) egy <meta> elemben a kvetkező formban:

<meta name=''dc.identifier'' scheme=''urn'' content=''urn:nbn:hu-1234''>

(Felttelezve, hogy a szerver ltal szolgltatott azonost az ''urn:nbn:hu-1234'' volt.) Ezekutn megerőstsknt msodszor is meg kell hvni a szervert az első hvssal teljesen megegyező mdon. Ekkor a rendszer ellenőrzi, hogy a dokumentumba tnylegesen belekerlt-e <meta> elem formjban az urn:nbn azonost, s ha igen, akkor vglegesti a bejegyzst. (Ellenkező esetben a bejegyzsi krelem rvnytelennek minősl.) A bejegyzett URN:NBN - URL hozzrendels ksőbb termszetesen mdosthat, ennek rszletei azonban itt hely hinyban nem kerlnek ismertetsre.

4.2. Az URN:NBN azonostk feloldsa

Az URN-nek automatikus feloldst, vagyis hogy egy kliensprogram (pl. egy bngsző) csupn az URN alapjn megtalljon egy dokumentumot, a DDDS (Dynamic Delegation Discovery System) szolgln, m ez a rendszer egyelőre gyakorlatilag csak papron ltezik, s nem valsznű, hogy a kzeljvőben kipl az ltalnos hasznlathoz szksges infrastruktra. Ugyanakkor az URN azonostk rtelmket vesztik, amennyiben nem lehet automatikusan megtallni az adott azonosthoz tartoz dokumentumot. Az OSZK ezrt egy, tbb nemzeti knyvtr ltal is hasznlt, meglehetősen npszerű hibridmegoldst alkalmaz erre a clra, amelyben az URN:NBN feloldsa egy fix URL-lel rendelkező feloldszerveren keresztl trtnik. A folyamat az n. THTTP (Trivial convention for using HTTP in URN resolution) protokolon keresztl trtnik [[3]], amely egy erősen leszűktett rszhalmaza a HTTP-nek. A felolds gy jn ltre, hogy az URN-t URL-l talakt, n. N2L szolgltatst nyjt szervernek (egy GET hvs sorn) paramterknt t kell adni az elrni kvnt dokumentum URN azonostjt

http://nbn.oszk.hu/N2L?urn:nbn:hu-1234

amire vlaszul a szerver egy HTTP tirnyts ad az adott URN-hez tartoz URL-re, vagy hibazenetet amennyiben ilyen nem ltezik. A felhasznlnak teht ltalban (pl. amennyiben egy bngszővel krdezi le a szervert) nem kell azzal trdnie, hogy a visszakapott URL-t mg kln letltse, ez ugyanis az tirnyts rvn automatikusan megtrtnik.

A THTTP protokollal trtnő felolds htrnya, hogy egy fix URL (az N2L szolgltatst vgző szerver URL-je) szksgeltetik hozz. Ugyanakkor nagyon nagy előnye, hogy ezen keresztl az URN-ek feloldsa mr a jelenlegi internetes infrastruktrval is megvalsthat, gy a DDDS rendszer bizonytalan jvője nem htrltatja az URN azonostk bevezetst.

4.3. Biztonsgi krdsek

A bevezetendő URN:NBN rendszer megtervezsnl fontos szempont volt, hogy hasznlata a lehetőleg egyszerű legyen, de ugyanakkor biztostsa azt, hogy csupn a dokumentum tulajdonosa ignyelhessen azonostt dokumentuma szmra, valamint hogy csak ő mdosthassa a dokumentuma URN:NBN azonostja s URL-je kztti lekpezst. Tovbbi szempont volt, hogy a folyamat nagymrtkben automatizlhat lehessen, hogy nagy mennyisgű dokumentum feldolgozsakor programbl is trtnhessen az ignyls vagy a mdosts. Ez utbbi kritrium gyakorlatilag kizrja a jelszavas azonostst, ezrt az URN:NBN-nel kapcsolatos műveletek sorn mindig azt tekinti a rendszer a dokumentum gazdjnak, aki bizonytani tudja, hogy rsjoggal rendelkezik az adott dokumentum felett. Ezt szolglja az ignylsnl lert ktlpses mdszer, amely sorn a rendszer ellenőrzi, hogy belekerlt-e (egy <meta> elem formjban) az URN:NBN azonost a dokumentum fejlcbe, vagyis az ignylő mdostani tudta-e azt a dokumentumot, amelyre az azonostt ignyelte. Amennyiben ez megtrtnt, a rendszer elfogadja, hogy ő a dokumentum tulajdonosa, s vglegesti a bejegyzst, mg ellenkező esetben a bejegyzs rvnytelen lesz.

4.4. Kitekints

Az URN:NBN szolgltatst nyjt infrastruktra (programok) fejlesztse jelenleg is folyik az OSZK-ban. A nyilvnos szerver zembe helyezse, valamint a bejegyzst s karbantartst segtő oldalak elksztse 2003. mjus kzepre vrhatak.



[i]Email: aradi@oszk.hu



[1]Termszetesen a webszerver segtsgvel megoldhat lenne, hogy a kvlll semmit se rzkeljen a knyvtrstruktra megvltozsbl, de a gyakorlat azt mutatja, hogy az oldalak zemeltetői sok esetben nincsenek erre figyelemmel.

[2]http://www.ietf.org/rfc/rfc2141.txt

[3]http://www.ietf.org/rfc/rfc2169.txt