Kirjoitetun suomen kielen diskurssifunktiot
Korpusvetoinen näkökulma tekstilajien kielenpiirteiden variaatioon
Abstrakti
Tutkimuksessa tarkastellaan huolitellun yleiskielen variaatiota suomen kielen neljässä tekstilajissa: tutkimusartikkeleissa, kaunokirjallisuudessa, puolueohjelmissa ja uutisissa. Kullekin tekstilajille tyypilliset kielenpiirteet tunnistetaan laskennallisten menetelmien avulla suhteessa muihin tekstilajeihin. Vastaavaa tutkimusta on runsaasti esimerkiksi englannista, mutta suomen yleiskielen tekstilajeista vertailevaa kvantitatiivista tutkimusta ei ole tehty.
Tutkimusaineisto on koostettu neljästä eri korpuksesta, ja se sisältää tutkimusartikkeleita, kaunokirjallisia tekstejä, poliittisia puheenvuoroja ja uutistekstejä. Tutkimuksessa käytettiin ensin avainrakenneanalyysia tunnistamaan aineistosta merkitykselliset eli aineistolle tyypilliset kielen piirteet. Piirteet ryhmiteltiin moniulotteisen analyysin avulla joukoiksi, joiden jäsenten esiintyminen tekstissä korreloi toistensa kanssa.
Tulokset osoittavat, että huolitellussa yleiskielessä on runsaasti vaihtelua ja että jokaisessa neljässä tekstilajissa käytetään erilaista kielen rekisteriä. Tutkimusartikkeleille tyypillistä on määritteiden kertyminen virkkeen alkuun ja loppuun. Kaunokirjallisuudelle on tyypillistä pronominien käyttö ja virkkeen tiiviys lauseen ydinjäsenten ympärillä. Puolueohjelmille on tyypillistä substantiivin määritteiden käyttö sekä rinnasteisten ja alisteisten lauseiden runsaus, ja uutisteksteille tyypillistä on runsas numeraalien määritteiden ja erisnimien käyttö. Kielen vaihtelun perusteella tunnistetaan erilaisia diskurssifunktioita, jotka tukevat tekstilajin kommunikatiivista tavoitetta.
Discourse functions in written Finnish: Corpus-based study in register variation
This study examines the variation of standard Finnish across four genres: research articles, fiction, political programs, and news items. The linguistic features typical of each genre are defined through computational methods in relation to other genres. Comparable research is abundant – for example, in English – but there is a lack of comparative quantitative research on the standard language genres in Finnish.
The research data stems from four different corpora, comprising research articles, fictional texts, political speeches, and news texts. Key structure analysis was employed to identify linguistically significant features within the material, features typical to these texts. These features were then grouped into sets according to their patterns of co-occurrence within the data, using multi-dimensional analysis.
The results indicate that there is considerable variation in standard Finnish, and each studied genre employs a different linguistic register. Research articles are characterised by the accumulation of modifiers at the beginning and end of sentences. Fiction is characterised by the use of pronouns and compact sentence structures with core members surrounding the sentence nucleus. Political programs are characterised by the use of noun modifiers and the abundance of both coordinating and subordinating clauses, while news texts are characterised by the extensive use of numerical modifiers and proper nouns. Based on linguistic variation, various discourse functions are identified, reflecting the communicative goals of each genre.