Tätä sivua ei enää ylläpidetä. Siirry uuteen julkaisuluetteloon tästä
Perspectives on the utility of linguistic knowledge in English word prediction
Pertti Väyrynen
Humanistinen tiedekunta, Humanistinen tiedekunta, Oulun yliopisto
Humanistinen tiedekunta, Englannin kielen laitos, Oulun yliopisto
Teknillinen tiedekunta, Teknillinen tiedekunta, Oulun yliopisto
Teknillinen tiedekunta, Sähkö- ja tietotekniikan osasto, Oulun yliopisto
Academic Dissertation to be presented with the assent of the Faculty of Humanities, University of Oulu, for public discussion in Raahensali (Auditorium L10), Linnanmaa, on November 19th, 2005, at 12 noon
Tiivistelmä suomeksi
Copyright © 2005
Oulun yliopisto
Esitarkastajat
Dosentti Sheri Hunnicutt
Professori Stefan Werner
OULUN YLIOPISTO, OULU 2005
ISBN 951-42-7850-X (PDF)
ISSN 1796-2218 (Online)
URN:ISBN:951427850X
Näkökulmia lingvistisen tiedon hyödyllisyyteen sananennakointisovelluksissa
Abstrakti
Tässä työssä tutkittiin lingvistisen tiedon hyödyllisyyttä kieliteknologian yhdellä sovellusalueella eli sanan ennakointia englannin kielessä. Sovellus pyrkii ennakoimaan sanan, jota käyttäjä kirjoittaa parhaillaan tai aikoo kirjoittaa seuraavaksi. Nämä sovellukset ovat hyödyllisiä esim. pienissä päätelaitteissa, joissa tekstin tuottaminen on hankalaa. Eräs kieliteknologiasovellusten tärkeimmistä ominaisuuksista on niiden tehokas toiminta ja suorituskyky, jonka tulisi olla kvantitatiivisesti mitattavissa. Oleellisin tutkimuskysymys on näin ollen: (1) miten käytännön kieliteknologiasovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla ja (2) mitä tämä vaatii käytännössä? Yleisellä tasolla tutkimuksen tärkeimmät tulokset ovat seuraavat: lingvistisen tiedon käytännön hyödyllisyyttä pitäisi arvioida ainakin kolmesta näkökulmasta, jotka ovat: (1) kielen näkökulma, (2) teknologian näkökulma ja (3) sovelluksen käyttäjän näkökulma. Näiden kolmen näkökulman avulla voidaan määrittää joukko tekijöitä, jotka joko lisäävät tai vähentävät lingvistisen tiedon hyödyllisyyttä käytännön kieliteknologiasovelluksissa. Työn empiirisessä osassa kehitettiin tilastollinen sananennakointisovellus englannin kieleen hyödyntäen parhaiten toimivia ennakointitekniikoita yhdessä ja samassa järjestelmässä. Kehitetyssä järjestelmässä suorituskyky vastaa täysin aiempien järjestelmien suorituskykyä. Työssä testattiin myös joitakin uusia, lingvististä tietoa hyödyntäviä ennakointitekniikoita, joiden suorituskyky vastasi tiettyjen tilastollisten ennakointimenetelmien suorituskykyä. Tutkimuksen tuloksista voidaan päätellä muun muassa, että sananennakointisovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla vain käyttämällä samanaikaisesti useita lingvistisen tiedon lähteitä. Tämä taas saattaa hidastaa sovelluksen reaaliaikaista toimintaa ja vaikuttaa sovelluksen suorituskykyyn silloin kun se mitataan näppäinsäästönä merkkisäästön asemesta.
Asiasanat: computational linguistics, englannin kieli, ennakointi, kieliteknologia, language technology, leksikologia, linguistic knowledge, sananennakointi, tietokonelingvistiikka, word completion, word prediction
- Julkaisu Adoben PDF-muodossa 1.76 MB
Julkaistu painettuna:
![]() | Acta Universitatis Ouluensis Humaniora B 67 ISBN 951-42-7849-6 ISSN 0355-3205 |
Oulun yliopiston muita julkaisuja
- Muita Oulun yliopiston julkaisemia elektronisia julkaisuja
- Sarjan Acta Universitatis Ouluensis Humaniora kotisivu
Päivitetty 24.8.2011 | Webmaster

