next up previous contents
Seuraava: 6.5 SGML:n ``suuret'' sovellukset Ylempi: 6 SGML ja rakenteiset Edellinen: 6.3 SGML:n rakenne ja

6.4 SGML:n hyötykäyttö

Edellä olevasta, ehkä liiankin pinnallisesta esityksestä voidaan tehdä joitakin johtopäätöksiä. Hyvinkin luotettavana voinee pitää sellaista johtopäätöstä, että SGML:n ottaminen tuotantokäyttöön isossa organisaatiossa on vaativa ja monitahoinen tehtävä. Hyötyjen on oltava todellisia ja kiistattomia. Niiden on lisäksi oltava taloudellisilla indikaattoreilla mitattuna merkittäviä, jotta tarvittavat investoinnit on perusteltua tehdä. Pienten aineistomäärien käsittelyssä SGML saattaa osoittautua ylimitoitetuksi.

Esimerkkinä monien näkökohtien samanaikaisesta huomioon ottamisesta esittelen lyhyesti eduskunnan asiakirjatuotannon ja tekstiarkiston siirtymistä SGML:n käyttöön. Eduskunnan tietohallinnon tekemät ratkaisut ovat monella tavoin edelläkävijän asemassa suomalaisessa yhteiskunnassa. Siellä tehdyt ratkaisut ovat säteilleet laajalti muuhun yhteiskuntaan.

SGML ja Internetin käyttöönotto kietoutuvat saumattomasti yhteen eduskunnan ratkaisuissa. Eduskunnan tietohallinto selvitti vuonna 1994 samanaikaisesti asiakirjatuotannon ongelmia ja edustajien käyttöön tarkoitetun FAKTA-järjestelmän teknisiä perusteita [19]. Tietohallinnossa päädyttiin yhtenäiseen ja kokonaisvaltaiseen ratkaisuun, jonka ytimenä on asiakirjojen tuottaminen ja tallentaminen SGML-muodossa. Järjestely mahdollistaa automaattiset muunnokset sekä painatuksessa tarvittavaan muotoon että Internetin selainten käyttämään muotoon. Internetin selainten käyttö on puolestaan osoittautunut parhaaksi ratkaisuksi integroitaessa eri puolilla julkishallintoa tuotettuja informaatiopalveluja riittävän helppokäyttöisiksi.

Kun edellä olevat rivit kirjoittaa julki syksyllä 1997, suurin osa lukijoista ei huomaa niissä mitään erityisen merkille pantavaa. Jotta eduskunnan tekemän ratkaisun ennakkoluulottomuuden pystyy ymmärtämään, on ensinnäkin muistettava, että valtiovalta ei vielä vuonna 1994 ollut lainkaan ottamassa Internetiä käyttöön ainakaan keskeisimpien hallintovirastojen tuotantokäytössä. Valtionhallinnon tietohallinnosta vastaavien virkamiesten, päällikköjen ja johtavien asiantuntijoiden kanta Internetin suhteen oli myönteisimmilläänkin torjuva. Suurille tietojenkäsittelyalan yrityksille Internet oli täysin tuntematon eikä mistään nykyisen kaltaisesta tietoverkkojen vyörystä pystytty edes haaveilemaan.

Ei myöskään SGML:n käyttöönotto ollut mitenkään itsestäänselvyys. Kun eduskunnan tietohallinto käynnisti SGML-hankkeen yhteistyössä Jyväskylän yliopistossa toimivan, AIRI SALMISEN johtaman työryhmän kanssa [22], valtioneuvoston kanslia selvitti omalla tahollaan WP 5.1:n käyttöä valtioneuvoston tekstiarkistojen tallennusmuotona. Lähestymistavat tuskin voisivat olla kauempana toisistaan. Ne eroavat toisistaan sekä tietojenkäsittelyn pitkäaikaista kehitystä koskevan arviointikyvyn osalta että varsinkin sen osalta, miten asiakirjajulkisuuteen ja kansalaisten demokraattisiin oikeuksiin suhtaudutaan.

Eduskunnan tietohallinnon tavoitteena SGML-hankkeen ensi metreiltä alkaen on ollut tarjota lainsäädäntötyöhön liittyvät ja sen tuottamat asiakirjat mahdollisimman tehokkaalla ja taloudellisella tavalla maksutta koko suomalaisen yhteiskunnan käyttöön. Eduskunnassa asiakirjoja ei tuoteta ja tallenneta pienen virkamiespiirin ja -- kuten yleisesti käytetty eufemismi kuuluu -- tärkeimpien sidosryhmien käyttöön (vrt. WP 5.1 asiakirjojen tavoitettavuuden esteenä). Eduskunta ei myöskään myy asiakirjojaan tai informaatiopalvelujaan, laki ei anna siihen edes mahdollisuutta. Eduskunta edustaa kansaa ja eduskunnan työn tärkeimmät tulokset, so. SUOMEN LAKI, on tarkoitettu kansakunnan käyttöön.

Vuonna 1994 käynnistyneet hankkeet ovat tulossa vuoden 1998 aikana varsinaiseen tuotantokäyttöön. Valiokuntien tekstintuotannossa siirrytään SGML-pohjaisten työvälineiden käyttöön ja koko eduskunnan tekstiarkisto muutetaan SGML-muotoon. Käytännössä ratkaisu toimii niin, että tavalliset mikronkäyttäjät tuottavat perustekstit tavanomaisilla tekstinkäsittelyohjelmilla, joiden tyylitiedostojen avulla saadaan aikaan SGML:n perusmerkinnät. Valiokuntien osastosihteerit tuottavat lopulliset SGML-muotoiset asiakirjat, jotka viedään heti valmistuttuaan tekstitietokantaan. Edustajat ja virkamiehet käyttävät eduskunnan sisäistä tekstiarkistoa WWW:n selainten avulla. Kun asiakirjat tulevat julkisiksi, ne kopioidaan automaattisesti eduskunnan julkiseen tekstitietokantaan, jota kuka tahansa kansalainen voi tutkia oman selaimensa avulla. Aikaviive asiakirjan julkiseksi tulon ja julkiseen WWW-palveluun tulon välillä on muutamia tunteja.

Tässä on tärkeää korostaa, että muunnos SGML-muodosta HTML-muotoon on täysin automaattinen. HTML-muotoisissa dokumenteissa olevat lukuisat hyperlinkit syntyvät nekin automaattisesti. Valtaosa hyperlinkeistä on itse asiassa tarkasti kohdennettuja hakuja tekstitietokantaan. Kun käyttäjä jotain pöytäkirjaa selatessaan valitsee hyperlinkin osoittaman hallituksen esityksen, esittelymuistion, edustajan suullisen kysymyksen tai jonkin muun asiakirjan, dokumentti haetaan linkkiin ``piilotetun'' kyselyn avulla tekstitietokannasta SGML-muotoisena, rakennetaan hyperlinkit, muunnetaan DTD:n ja muunnostaulujen avulla HTML-muotoon ja näytetään selaimessa. HTML-muodossa asiakirja on ainoastaan selailun ajan. HTML-muotoisia asiakirjoja ei tallenneta mihinkään.

Tällä järjestelyllä on useita merkittäviä etuja. Ensinnäkin SGML:n kontrolloitu määrämuotoisuus varmistaa ajonaikaisesti rakennettavien hyperlinkkien tarkkuuden. Yhteenkään dokumenttiin ei koskaan lisätä hyperlinkkejä käsityönä. Kymmeniin tai satoihin tuhansiin dokumentteihin linkkien lisääminen käsityönä vaatisi suunnattoman määrän työtä ja suuren määrän työntekijöitä. Vielä merkittävämpi on kuitenkin etu, joka jo muutaman vuoden sisällä saavutetaan, kun nyt käytössä oleva HTML-koodaus vanhenee käyttökelvottomaksi. Vanhentuneen HTML-koodauksen muuntaminen automaattisesti johonkin uudempaan ja mitä todennäköisimmin ilmaisuvoimaisempaan merkintäkieleen on jo periaatteessa mahdotonta. Muunnos nykyisestä HTML:stä johonkin tulevaisuuden järjestelmään on ennemmin tai myöhemmin pakko tehdä käsin.

Eduskunnan tekstiarkiston käyttöön tuleva SGML-koodaus sen sijaan mahdollistaa automaattiset muunnokset mihin tahansa tulevaisuudessa käyttöön tulevaan selainten merkintäjärjestelmään, kunhan vain myös uusi järjestelmä on SGML-standardin kanssa yhteensopiva. Muunnoksessa tarvitaan vain uudet muunnossäännöt, jotka koskevat samalla kertaa kaikkia dokumentteja. Ihmisen tekemää työtä tarvitaan vain uusien muunnossääntöjen laatimiseen ja se on kertaluonteinen tehtävä. Dokumentteja ei tallennusta silmällä pitäen muunneta yksitellen tai tietokannoittain, niitä ei tarvitse lainkaan tallentaa muunnetussa muodosssa. Dokumenttien annetaan olla tekstitietokannassa alkuperäisessä SGML-muodossaan. Uudenlainen muunnos tehdään ainoastaan ajonaikaisesti uusien muunnossääntöjen avulla kyseisen ajankohdan selainten käyttämään katselumuotoon. Toisin sanoen, jos tulevaisuudessa WWW:n ja sen selainten palvelut muuttuvat radikaalilla tavalla ja niiden hyödyntämisessä tarvittava koodaus muuttuu täysin nykyisestä koodauksesta, myös ne voidaan ottaa täysimääräisesti käyttöön.

Eduskunnan tietohallinnon tekemiä ratkaisuja on jo jonkin aikaa voinut eräänlaisena välivaiheen versiona katsella Internetin välityksellä. Tekstiarkiston asiakirjat ovat vielä toistaiseksi pelkkää raakatekstiä ja sen vuoksi WWW:n selainten näyttämät dokumentit ovat muotoilujensa osalta hyvin vaatimattomia. Dokumentit ovat pääasiassa pelkkää raakatekstiä ja dokumenttien sisältä hyperlinkit puuttuvat kokonaan. Vain dokumenttien alussa olevien määrämuotoisten tietojen perusteella pystytään ajonaikaisesti tekemään toimivia hyperlinkkejä. Tämä tilanne siis muuttuu täysin vuoden 1998 aikana. Syksyllä 1998 eduskunnan kokoontuessa kesän jälkeen uudet palvelut tulevat olemaan käytössä.

Suomen eduskunnan ratkaisujen edistyksellisyydestä saa parhaan käsityksen, kun toteaa, että Euroopassa vain kaksi muuta parlamenttia käyttää tai harkitsee SGML:n käyttöä. Norjassa parlamentin asiakirjat muunnetaan niiden jalostusketjun loppuvaiheessa SGML-muotoon painatusprosessin nopeuttamiseksi ja tehostamiseksi. SGML-muotoa ei hyödynnetä muulla tavoin. Saksassa SGML:n käyttöä tiettävästi parhaillaan tutkitaan ja kokeillaan rajoitetusti. Kaikkialla muualla, myös Ruotsissa, parlamenttien WWW-palveluihin tuottamat asiakirjat koodataan joko käsin tai tekstinkäsittelyohjelmien avulla HTML-merkinnöillä. On itsestään selvää, että kyseessä on nopeasti umpikujaan johtava ratkaisu. Ruotsissa onkin jouduttu jo toteamaan, että kymmenien tuhansien dokumenttien ajantasalla pitäminen koodauksen osalta ajaa ylläpidosta vastuussa olevan henkilöstön kestämättömään tilanteeseen. Ylläpito on toisin sanoen räjähtämässä käsiin.


next up previous contents
Seuraava: 6.5 SGML:n ``suuret'' sovellukset Ylempi: 6 SGML ja rakenteiset Edellinen: 6.3 SGML:n rakenne ja
Timo Kuronen