Julkaisupalvelut

Bookmark and Share

URI, URN ja URL

Dokumenttien nimeäminen ja paikantaminen

Ville Varjonen

Oulun yliopiston kirjasto

17.4.2000

Versio 1.0

Kommentit, korjaukset ja ehdotukset voi lähettää osoittella: vili@cc.oulu.fi

URI - Uniform Resource Identifier

Elektronisten dokumenttien jakelun, haettavuuden ja löydettävyyden/saatavuuden varmistamiseksi tarvitaan kaksi erillistä erillistä lähtökohtaa. Dokumentilla tulee olla sekä nimi että osoite.

Nimi erottaa (identifioi) dokumentin kaikista muista dokumenteista, sen tulee olla siis pysyvä ja ainutlaatuinen. Nimiä voi tässä tapauksessa verrata luontevasti kirjojen ISBN-numeroihin, ihmisten henkilötunnuksiin jne.

Osoitetta tarvitaan nimetyn dokumentin sijainnin selvittämiseen, sitä voi verrata vaikkapa kirjojen paikkamerkintöihin (signum), (tietyn nimisellä) kirjalla voi olla useita eri hyllysijainteja. Vastaavasti sitä voi verrata puhelinnumeroihin, samalla ihmisellä voi olla useita puhelinnumeroita, jotka voivat tietysti vaihtuakin ja siirtyä jopa toisille käyttäjille.

Tarvitaan siis menetelmä dokumentin nimeämiseksi ja sen sijainnin selvittämiseksi. Tällaisen menetelmän antava URN (Uniform Resource Name) ja URL (Uniform Resource Locator), jotka yhdessä muodostavat URI (Uniform Resource Identifier) -nimisen kokonaisuuden.

URI

URI Uniform Resource Identifier on merkkijono, abstraktin tai fyysisen resurssin identifioimiseksi. Resurssi on jotakin joka on identifioitavissa (yleensä dokumentti tai sen osa). URI on joko nimi tai paikannin, mahdollisesti jopa molempia.

Yleisesti URI on muotoa:

 <scheme>:<scheme-specific-part>

missä <scheme> on jokin http://www.w3.org/Addressing/schemes sivulla luetelluista mahdollisuuksista. Tutuin ja yleisin on varmaankin HTTP (HyperText Transfer Protocol).

Esimerkki 1. URI ja URL

Esimerkki "tavallisista" URLeista

 http://herkules.oulu.fi/vili/viittaus/
http://www.academicpress.com/aam

Esimerkki 2. URI ja URN

URN alkaa "yllättäen" nimellä urn

URN:NBN:fi-fe19991068

URN

URN nimeää jonkin objektin, resurssin, joka voi olla kokonainen dokumentti, kuva, dokumentin osa, mikä tahansa nimettävissä oleva asia. URN on pysyvä, eli sitä ei voida siirtää jollekin toiselle resurssille kuin se oli alunperin annettu. URN on myös yksikäsitteinen, yksi URN ei voi kuulua kuin yhdelle ainoalle resurssille. Resurssilla voi tietysti olla useampia URNeja.

URNit ovat yleisesti muotoa:

<URN> ::= "urn:" <NID> ":" <NSS>

missä <NID> on Namespace Identifier, joka kertoo mitä koodausta URN käyttää. Arvoina voi olla esimerkiksi ISBN. Vastaavasti NSS on Namespace Specific String, merkkijono, joka noudottaa annettua NID:tä.

Esimerkki 3. URN

 URN:ISBN:951425533X
 URN:DOI:10.1006/aama

Valitettavasti URN -resoluutiopalvelimet eivät ole tällä hetkellä vielä valmiita, tulevaisuudessa on kuitenkin luultavasti mahdollista kirjoittaa URN suoraan selaimen osoiteikkunaan ja selain hoitaa dokumentin fyysisen kappaleen löytämisen joltakin palvelimelta automaattisesti ja käyttäjälle läpinäkyvästi. Tärkeää on huomata, että yhtä URN:ää kohti voi olla periaatteessa rajaton määrä URL:eja, jotka eivät välttämättä ole edes pysyviä.

Katso tarkemmin erilaisista mahdollisuuksista: Juha Hakala: Elektronisten julkaisuiden identifiointi

URL

URL kertoo dokumentin (fyysisen) sijainnin. URL voi olla joko absoluuttinen tai suhteellinen.

Esimerkki 4. Absoluuttinen URL

 http://herkules.oulu.fi/vili/viittaus/index.html

Esimerkki 5. Suhteellinen URL

c594.html

URL (käytetään esimerkkinä http:tä) on yleisesti muotoa:

<scheme>:<scheme-specific-part>

ja <scheme-specific-part> on (http:n tapauksessa:)

//<user>:<password>@<host>:<port>/<url-path>

mistä yleensä käytetään osia <host> ja <url-path>

//<host>:<url-path>

<host> on jonkin palvelimen nimi:

herkules.oulu.fi

ja <url-path> on tiedoston sijainti: /vili/viittaus/index.html

Lisätietoja osoitteessa: http://narnia.tky.hut.fi/jukka/www/urlit.html

Päivitetty 22.1.2010 | Webmaster