6.4 Resurssien kuvailun puitteet

Dublin Core aineiston kuvailun muotona on vain yksi näkökulma tietoverkoissa olevien dokumenttien ja muun aineiston käsittelyyn ja hallintaan. Warwickin DC-2:ssa käynnistyi kehitystyö, joka sittemmin on alkanut käyttää itsestään nimitystä RDF (Resource Description Framework)[1] Hanke on yksi lukemattomista WWW-konsortion käynnistämistä yhteistyöhankkeista, joilla WWW:n kehitystä ohjataan.

RDF:n tavoitteena on muodostaa yhtenäiset puitteet erilaisten ongelmaryhmien hallinnalle, jotka ovat tavallaan eri näkökulmia samoihin tietoverkkojen resursseihin. Näitä näkökulmia ovat resurssien tavoitettavuus, luettelointi ja kuvailu, älykkäiden agenttien käyttö, sisältöluokitus, kokonaisuuksien hallinta, henkisen omaisuuden suoja, jne.

Sisältöluokitus (content rating) on sekä Yhdysvalloissa että EU:n piirissä vakavaksi koettu ongelma, kun lapsia halutaan varjella pornografiselta tai sopimatonta kielenkäyttöä sisältävältä aineistolta. Kuviin ja teksteihin liitetyt luotettavat luokitustiedot mahdollistaisivat selainten konfiguroinnin niin, että lapset eivät saisi dokumentteja lainkaan katseltavakseen. Sisältöluokitus on käyttökelpoinen monissa muissakin yhteyksissä. Tieteelliseen artikkeliin liitetty tieto vertaisarvioinnista tai kirjoittajan virallisesta asiantuntija-asemasta auttaisi aineiston valinnassa.

Kokonaisuuksien hallinnalla tarkoitetaan useista erillisistä osista muodostuvan yhtenäisen dokumentin sisäisten suhteiden esittämistä. Esimerkiksi kirja saattaa koostua useista luvuista, jotka ovat erillisinä dokumentteina WWW-palvelimessa. Jos käyttäjä kuitenkin haluaa kirjan yhtenäisenä kokonaisuutena selaimelleen niin, että sisällysluettelo ja sivunumerointi ovat kokonaisen teoksen mukaisesti, se vaatii sekä lisätietoja että lisätoimintoja nykyisen kaltaisiin selaimiin.

Henkisen omaisuuden suoja (copyright) liittyy esimerkiksi kuvien kopiointiin ja niiden mahdolliseen hyödyntämiseen kaupallisessa toiminnassa. Kuviin on liitettävä tietoja siitä, kuuluvatko ne mahdollisesti public domain -alueeseen, ovatko ne lainkaan kopioitavissa ja jos ovat, millä ehdoilla niitä voidaan käyttää omissa julkaisuissa.

WWW:n selainten tekemisen kannalta on välttämätöntä, että erilaisten RDF:n osat toteutetaan yhtenäisellä tavalla. Tulevaisuuden selaimesta löytyy toimintoja, jotka osaavat näitä osia aina tarpeen mukaan hyödyntää. Yhdestä alasvetovalikosta löytyvät kaikki kaupankäyntiin liittyvät toiminnot, toisessa ovat aineiston sisällön arviointitietoja hyödyntävät toiminnot, kolmannen avulla hallitaan moniosaisia dokumentteja jne.

RDF:n määrittelytyö on aivan alkuvaiheessaan. Erilaisten kuvailujen merkintäkielenä tullaan käyttämään XML:ää mutta kovin paljoa enempää ei varmuudella tästä asiasta pysty vielä sanomaan. RDF on sisällöllisessä mielessä laajentunut nopeasti kattamaan suuren joukon mahdollisia sovellusalueita. W3C:n määrittelytyössä pyritään sen vuoksi työn alkuvaiheessa enemmänkin RDF-kielen luomiseen kuin sovelluskohtaisten yksityiskohtien määrittelemiseen. RDF-työryhmä julkisti 14.8.1998 alustavan luonnoksen skeemamäärittelyksi.[2] Siinä pyritään määrittelemään joukko tärkeiksi katsottuja ominaisuuksia, joita hyödyntämällä voidaan määritellä varsinaisia dokumenttiluokkia.

Esimerkkinä ominaisuuskeskeisestä lähestymistavasta (vastakohtana luokkakeskeiselle lähestymistavalle) voidaan tarkastella ominaisuutta tekijä. Tämän ominaisuuden määritysalueena (domain) voivat olla esimerkiksi kirjat, arvoalueena (range) merkkijonot, jotka esittävät tekijöiden nimiä. Ominaisuus tekijä sovellettuna kirjojen luokkaan kuuluvaan esiintymään Tuntematon sotilas antaa arvoksi merkkijonon Väinö Linna. Tekijä on siis kirjojen luokkaan kuuluvien olioiden perusominaisuus ja se on syytä käsitteellisesti erottaa ominaisuuden arvosta (tekijöiden nimistä).

Eri dokumenttiluokissa voi esiintyä runsaastikin yhteisiä ominaisuuksia. Jokaisella dokumentti- tai verkkoresurssien luokalla on kuitenkin oltava joko erityisiä ominaisuuksia tai ainakin kaikista muista poikkeava ominaisuuksien joukko. Jos kahden erilliseksi ajatellun dokumenttiluokan kaikki ominaisuudet ovat samoja, kyseessä ei olekaan kaksi erillistä dokumenttiluokkaa vaan kaikki tarkastelun kohteena olevat dokumentit kuuluvat yhteen ja samaan dokumenttien luokkaan.

[1]

Hankkeen kotisivu on http://www.w3.org/Metadata/RDF.

[2]

http://www.w3.org/TR/WD-rdf-schema.