URI, URN ja URL
Dokumenttien nimeäminen ja paikantaminen
Ville Varjonen
Oulun yliopiston kirjasto
17.4.2000
Versio 1.0
Kommentit, korjaukset ja ehdotukset voi lähettää osoittella: vili@cc.oulu.fi
URI - Uniform Resource Identifier
Elektronisten dokumenttien jakelun, haettavuuden ja löydettävyyden/saatavuuden varmistamiseksi tarvitaan kaksi erillistä erillistä lähtökohtaa. Dokumentilla tulee olla sekä nimi että osoite.
Nimi erottaa (identifioi) dokumentin kaikista muista dokumenteista, sen tulee olla siis pysyvä ja ainutlaatuinen. Nimiä voi tässä tapauksessa verrata luontevasti kirjojen ISBN-numeroihin, ihmisten henkilötunnuksiin jne.
Osoitetta tarvitaan nimetyn dokumentin sijainnin selvittämiseen, sitä voi verrata vaikkapa kirjojen paikkamerkintöihin (signum), (tietyn nimisellä) kirjalla voi olla useita eri hyllysijainteja. Vastaavasti sitä voi verrata puhelinnumeroihin, samalla ihmisellä voi olla useita puhelinnumeroita, jotka voivat tietysti vaihtuakin ja siirtyä jopa toisille käyttäjille.
Tarvitaan siis menetelmä dokumentin nimeämiseksi ja sen sijainnin selvittämiseksi. Tällaisen menetelmän antava URN (Uniform Resource Name) ja URL (Uniform Resource Locator), jotka yhdessä muodostavat URI (Uniform Resource Identifier) -nimisen kokonaisuuden.
URI
URI Uniform Resource Identifier on merkkijono, abstraktin tai fyysisen resurssin identifioimiseksi. Resurssi on jotakin joka on identifioitavissa (yleensä dokumentti tai sen osa). URI on joko nimi tai paikannin, mahdollisesti jopa molempia.
Yleisesti URI on muotoa:
<scheme>:<scheme-specific-part>
missä <scheme>
on jokin http://www.w3.org/Addressing/schemes sivulla luetelluista mahdollisuuksista. Tutuin ja yleisin on varmaankin HTTP (HyperText Transfer Protocol).
Esimerkki 1. URI ja URL
Esimerkki "tavallisista" URLeista
http://herkules.oulu.fi/vili/viittaus/
http://www.academicpress.com/aam
Esimerkki 2. URI ja URN
URN alkaa "yllättäen" nimellä urn
URN:NBN:fi-fe19991068
URN
URN nimeää jonkin objektin, resurssin, joka voi olla kokonainen dokumentti, kuva, dokumentin osa, mikä tahansa nimettävissä oleva asia. URN on pysyvä, eli sitä ei voida siirtää jollekin toiselle resurssille kuin se oli alunperin annettu. URN on myös yksikäsitteinen, yksi URN ei voi kuulua kuin yhdelle ainoalle resurssille. Resurssilla voi tietysti olla useampia URNeja.
URNit ovat yleisesti muotoa:
<URN> ::= "urn:" <NID> ":" <NSS>
missä <NID>
on Namespace Identifier, joka kertoo mitä koodausta URN käyttää. Arvoina voi olla esimerkiksi ISBN. Vastaavasti NSS on Namespace Specific String, merkkijono, joka noudottaa annettua NID:tä.
Esimerkki 3. URN
URN:ISBN:951425533X
URN:DOI:10.1006/aama
Valitettavasti URN -resoluutiopalvelimet eivät ole tällä hetkellä vielä valmiita, tulevaisuudessa on kuitenkin luultavasti mahdollista kirjoittaa URN suoraan selaimen osoiteikkunaan ja selain hoitaa dokumentin fyysisen kappaleen löytämisen joltakin palvelimelta automaattisesti ja käyttäjälle läpinäkyvästi. Tärkeää on huomata, että yhtä URN:ää kohti voi olla periaatteessa rajaton määrä URL:eja, jotka eivät välttämättä ole edes pysyviä.
Katso tarkemmin erilaisista mahdollisuuksista: Juha Hakala: Elektronisten julkaisuiden identifiointi
URL
URL kertoo dokumentin (fyysisen) sijainnin. URL voi olla joko absoluuttinen tai suhteellinen.
Esimerkki 4. Absoluuttinen URL
http://herkules.oulu.fi/vili/viittaus/index.html
Esimerkki 5. Suhteellinen URL
c594.html
URL (käytetään esimerkkinä http:tä) on yleisesti muotoa:
<scheme>:<scheme-specific-part>
ja <scheme-specific-part>
on (http:n tapauksessa:)
//<user>:<password>@<host>:<port>/<url-path>
mistä yleensä käytetään osia <host>
ja <url-path>
//<host>:<url-path>
<host>
on jonkin palvelimen nimi:
herkules.oulu.fi
ja <url-path>
on tiedoston sijainti: /vili/viittaus/index.html
Lisätietoja osoitteessa: http://narnia.tky.hut.fi/jukka/www/urlit.html
Päivitetty 22.1.2010 | Webmaster