KIELITEKNOLOGIASTA SUOMENKIELISTEN TEKSTIEN TUTKIMISESSA
Abstrakti
Kieliteknologian ja kielentutkimuksen suhde on monitahoinen. Kielentutkimus on kieliteknologialle
välttämätön osa perustutkimusta, ja kieliteknologia antaa perinteiselle
kielentutkimukselle uusia kvantitatiivisia näkökulmia. Kieliteknologian käyttöön soveltuva
lingvistinen pohjatyö on kallista ja huonosti näkyvää, ja se vaatii poikkiteteellistä
osaamista. Sama pätee kieliteknologian käyttöön kielentutkimuksen apuvälineenä.
Olemassaolevat tieteen rahoitusmallit eivät tue tämänkaltaista työtä, mikä
johtaa siihen, että työkalut pienellä kielialueella eivät useinkaan ole riittävän hyviä
tieteellisen kielentutkimuksen pohjaksi.
Artikkeli syventyy kieliteknologian ja korpuslingvistiikan käyttöön tekstilingvistiikan
apuvälineenä. Se esittelee mallin, jonka mukaisesti suomenkielisiä tekstiaineistoja
voidaan valmistella tieteelliseen tutkimukseen kelpaavalle tasolle ja käyttää kvantitatiivisen
tiedon eristämiseen tekstiaineistoista. Se esittelee mallin käyttöä vertailemalla
Aamulehden paikallisuutisten ja presidentti Kekkosen uudenvuodenpuheiden
kvantitatiivisia kieliopillisia piirteitä.
Avainsanat: Korpuslingvistiikka, kieliteknologia, kvantitatiivinen tekstintutkimus.
Key words: Corpus linguistics, language technology, quantitative text linguistics.