Julkaisupalvelut

Bookmark and Share

In English

Tätä sivua ei enää ylläpidetä. Siirry uuteen julkaisuluetteloon tästä

Perspectives on the utility of linguistic knowledge in English word prediction

Pertti Väyrynen

Humanistinen tiedekunta, Humanistinen tiedekunta, Oulun yliopisto

Humanistinen tiedekunta, Englannin kielen laitos, Oulun yliopisto

Teknillinen tiedekunta, Teknillinen tiedekunta, Oulun yliopisto

Teknillinen tiedekunta, Sähkö- ja tietotekniikan osasto, Oulun yliopisto

Academic Dissertation to be presented with the assent of the Faculty of Humanities, University of Oulu, for public discussion in Raahensali (Auditorium L10), Linnanmaa, on November 19th, 2005, at 12 noon

Tiivistelmä suomeksi

Oulun yliopisto

Esitarkastajat

Dosentti Sheri Hunnicutt

Professori Stefan Werner

OULUN YLIOPISTO, OULU 2005

ISBN 951-42-7850-X (PDF)

ISSN 1796-2218 (Online)

URN:ISBN:951427850X

Näkökulmia lingvistisen tiedon hyödyllisyyteen sananennakointisovelluksissa

Abstrakti

Tässä työssä tutkittiin lingvistisen tiedon hyödyllisyyttä kieliteknologian yhdellä sovellusalueella eli sanan ennakointia englannin kielessä. Sovellus pyrkii ennakoimaan sanan, jota käyttäjä kirjoittaa parhaillaan tai aikoo kirjoittaa seuraavaksi. Nämä sovellukset ovat hyödyllisiä esim. pienissä päätelaitteissa, joissa tekstin tuottaminen on hankalaa. Eräs kieliteknologiasovellusten tärkeimmistä ominaisuuksista on niiden tehokas toiminta ja suorituskyky, jonka tulisi olla kvantitatiivisesti mitattavissa. Oleellisin tutkimuskysymys on näin ollen: (1) miten käytännön kieliteknologiasovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla ja (2) mitä tämä vaatii käytännössä? Yleisellä tasolla tutkimuksen tärkeimmät tulokset ovat seuraavat: lingvistisen tiedon käytännön hyödyllisyyttä pitäisi arvioida ainakin kolmesta näkökulmasta, jotka ovat: (1) kielen näkökulma, (2) teknologian näkökulma ja (3) sovelluksen käyttäjän näkökulma. Näiden kolmen näkökulman avulla voidaan määrittää joukko tekijöitä, jotka joko lisäävät tai vähentävät lingvistisen tiedon hyödyllisyyttä käytännön kieliteknologiasovelluksissa. Työn empiirisessä osassa kehitettiin tilastollinen sananennakointisovellus englannin kieleen hyödyntäen parhaiten toimivia ennakointitekniikoita yhdessä ja samassa järjestelmässä. Kehitetyssä järjestelmässä suorituskyky vastaa täysin aiempien järjestelmien suorituskykyä. Työssä testattiin myös joitakin uusia, lingvististä tietoa hyödyntäviä ennakointitekniikoita, joiden suorituskyky vastasi tiettyjen tilastollisten ennakointimenetelmien suorituskykyä. Tutkimuksen tuloksista voidaan päätellä muun muassa, että sananennakointisovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla vain käyttämällä samanaikaisesti useita lingvistisen tiedon lähteitä. Tämä taas saattaa hidastaa sovelluksen reaaliaikaista toimintaa ja vaikuttaa sovelluksen suorituskykyyn silloin kun se mitataan näppäinsäästönä merkkisäästön asemesta.

Asiasanat: computational linguistics, englannin kieli, ennakointi, kieliteknologia, language technology, leksikologia, linguistic knowledge, sananennakointi, tietokonelingvistiikka, word completion, word prediction

Julkaistu painettuna:

serieslogo

Acta Universitatis Ouluensis

Humaniora

B 67

ISBN 951-42-7849-6

ISSN 0355-3205

Oulun yliopiston muita julkaisuja


Julkaisupalvelut

Päivitetty 24.8.2011 | Webmaster