5.7 SGML valtionhallinnossa

SGML:n ottaminen tuotantokäyttöön isossa organisaatiossa on vaativa ja monitahoinen tehtävä. Hyötyjen on oltava todellisia ja kiistattomia. Niiden on lisäksi oltava taloudellisilla indikaattoreilla mitattuna merkittäviä, jotta tarvittavat investoinnit on perusteltua tehdä. Pienten aineistomäärien käsittelyssä SGML on todennäköisesti ylimitoitettu ratkaisu.

Esimerkkinä monien näkökohtien samanaikaisesta huomioon ottamisesta esittelen lyhyesti eduskunnan asiakirjatuotannon ja tekstiarkiston siirtymistä SGML:n käyttöön. Eduskunnan tietohallinnon tekemät ratkaisut ovat monella tavoin edelläkävijän asemassa suomalaisessa yhteiskunnassa.

SGML ja Internetin käyttöönotto kietoutuvat saumattomasti yhteen eduskunnan ratkaisuissa. Eduskunnan tietohallinto selvitti vuonna 1994 samanaikaisesti asiakirjatuotannon ongelmia ja edustajien käyttöön tarkoitetun FAKTA-järjestelmän teknisiä perusteita [[12]]. Tietohallinnossa päädyttiin yhtenäiseen ja kokonaisvaltaiseen ratkaisuun, jonka ytimenä on asiakirjojen tuottaminen ja tallentaminen SGML-muodossa. Järjestely mahdollistaa automaattiset muunnokset sekä painatuksessa tarvittavaan muotoon että Internetin selainten käyttämään muotoon. Internetin selainten käyttö on puolestaan osoittautunut parhaaksi ratkaisuksi integroitaessa eri puolilla julkishallintoa tuotettuja informaatiopalveluja riittävän helppokäyttöisiksi.

Kun yllä olevia rivejä lukee vuonna 1998 tai sen jälkeen, suurin osa lukijoista ei huomaa niissä mitään erityisen merkille pantavaa. Jotta eduskunnan tekemän ratkaisun merkittävyyden pystyy ymmärtämään, on ensinnäkin muistettava, että valtiovalta ei vielä vuonna 1994 ollut lainkaan ottamassa Internetiä käyttöön ainakaan keskeisimpien hallintovirastojen tuotantokäytössä. Valtionhallinnon johtavien asiantuntijoiden, virkamiesten ja päällikköjen kanta Internetin suhteen oli parhaimmillaankin torjuva[1]. Suurille tietojenkäsittelyalan yrityksille Internet oli täysin tuntematon eikä mistään nykyisen kaltaisesta tietoverkkojen vyörystä pystytty edes haaveilemaan.

Ei myöskään SGML:n käyttöönotto ollut mitenkään itsestäänselvyys. Kun eduskunnan tietohallinto käynnisti SGML-hankkeen yhteistyössä Jyväskylän yliopiston Airi Salmisen johtaman työryhmän kanssa, valtioneuvoston kanslia selvitti WP 5.1:n käyttöä valtioneuvoston tekstiarkistojen tallennusmuotona. Lähestymistavat tuskin voisivat olla kauempana toisistaan. Ne eroavat toisistaan sekä tietojenkäsittelyn pitkäaikaista kehitystä koskevan arviointikyvyn osalta että varsinkin sen osalta, miten asiakirjajulkisuuteen ja kansalaisten demokraattisiin oikeuksiin suhtaudutaan.

Eduskunnan tietohallinnon tavoitteena SGML-hankkeen ensi metreiltä alkaen on ollut tarjota lainsäädäntötyöhön liittyvät ja sen tuottamat asiakirjat mahdollisimman tehokkaalla ja taloudellisella tavalla maksutta koko suomalaisen yhteiskunnan käyttöön. Eduskunnassa asiakirjoja ei tuoteta ja tallenneta pienen virkamiespiirin ja — kuten yleisesti käytetty eufemismi kuuluu — tärkeimpien sidosryhmien käyttöön. Eduskunta ei myöskään myy asiakirjojaan tai informaatiopalvelujaan, laki ei anna siihen edes mahdollisuutta. Eduskunta edustaa kansaa ja eduskunnan työn tärkeimmät tulokset, so. Suomen laki, on tarkoitettu koko kansakunnan käyttöön.

Tätä kirjoitettaessa ensimmäiset SGML-pohjaiset ratkaisut on otettu käyttöön. Vuoden 1998 syyskuun alusta lukien valiokuntien lausunnot ja mietinnöt talletetaan tekstitietokantaan SGML-muotoisina. Lisäksi niistä talletetaan kaksipalstaiset, ladottua dokumenttia vastaavat versiot pdf-muodossa. HTML-muotoiset dokumentit muodostetaan automaattisesti käyttäjän klikattua dokumenttiin osoittavaa hyperlinkkiä. Myös SGML-muotoisen dokumentin saa halutessaan katseltavaksi, jos käytettävissä on tarkoitukseen soveltuva selausohjelma.

Käytännössä ratkaisu toimii niin, että raakatekstin tuotannossa käytetään tavanomaisia tekstinkäsittelyohjelmia, joiden tyylitiedostojen avulla saadaan aikaan SGML:n perusmerkinnät. Valiokuntien osastosihteerit tuottavat kehittyneemmillä työvälineillä lopulliset SGML-muotoiset asiakirjat, jotka viedään heti valmistuttuaan tekstitietokantaan. Edustajat ja virkamiehet käyttävät eduskunnan sisäistä tekstiarkistoa WWW:n selainten avulla. Kun asiakirjat tulevat julkisiksi, ne kopioidaan automaattisesti eduskunnan julkiseen tekstitietokantaan, jota kuka tahansa kansalainen voi tutkia oman selaimensa avulla. Aikaviive asiakirjan julkiseksi tulon ja julkiseen WWW-palveluun tulon välillä on muutamia tunteja.

Tässä on tärkeää korostaa, että muunnos SGML-muodosta HTML-muotoon on täysin automaattinen. HTML-muotoisissa dokumenteissa olevat lukuisat hyperlinkit syntyvät nekin automaattisesti. Valtaosa hyperlinkeistä on itse asiassa tarkasti kohdennettuja hakuja tekstitietokantaan. Kun käyttäjä jotain asiakirjaa selatessaan valitsee hyperlinkin osoittaman hallituksen esityksen, esittelymuistion, edustajan suullisen kysymyksen tai jonkin muun asiakirjan, dokumentti haetaan linkkiin “piilotetun” kyselyn avulla tekstitietokannasta SGML-muotoisena. Se muunnetaan DTD:n ja muunnostaulujen avulla HTML-muotoon, rakennetaan hyperlinkit ja näytetään selaimessa. HTML-muodossa asiakirja on ainoastaan selailun ajan. HTML-muotoisia asiakirjoja ei talleteta mihinkään.

Tällä järjestelyllä on useita merkittäviä etuja. Ensinnäkin SGML:n kontrolloitu määrämuotoisuus varmistaa ajonaikaisesti rakennettavien hyperlinkkien tarkkuuden. Yhteenkään dokumenttiin ei koskaan lisätä hyperlinkkejä käsityönä. Kymmeniin tai satoihin tuhansiin dokumentteihin linkkien lisääminen käsityönä vaatisi suunnattoman määrän työtä ja suuren määrän työntekijöitä. Vielä merkittävämpi on kuitenkin etu, joka jo muutaman vuoden sisällä saavutetaan, kun nyt käytössä oleva HTML-koodaus vanhenee käyttökelvottomaksi. Vanhentuneen HTML-koodauksen muuntaminen automaattisesti johonkin uudempaan ja mitä todennäköisimmin ilmaisuvoimaisempaan merkintäkieleen on mahdotonta. Muunnos nykyisestä HTML:stä johonkin tulevaisuuden järjestelmään olisi ennemmin tai myöhemmin pakko tehdä käsin.

Liikkeellelähtö SGML-ratkaisujen tuotantokäytössä on harkitun varovainen. Jostain on kuitenkin aloitettava ja valiokuntien asiakirjat ovat hyvä kohde. Ne tarjoavat runsaasti informaatiota käsittelyssä olevista asioista ja kaiken lisäksi vaiheessa, jossa asioiden käsittelyn myöhempään kulkuun on vielä mahdollisuus vaikuttaa. SGML-ratkaisut laajenevat myöhemmin koskemaan muuta asiakirjatuotantoa ja suurta osaa eduskunnan tekstiarkistosta. Kaikkea vanhaa aineistoa ei tulla muuntamaan SGML-muotoon. Muuntamisen mahdollisuuteen vaikuttaa talletetun aineiston määrämuotoisuus.

[1]

Poikkeuksiakin toki oli. Yhden käden sormet riittävät luultavasti niiden laskemiseen, jos yliopistojen ja korkeakoulujen atk-ammattilaiset jätetään pois laskuista.