Lukijat sanaston monimuotoisuutta määrittämässä

Leksikaalisen diversiteetin tarkastelua määrällisen ja laadullisen tutkimuksen rajapinnassa

  • Mari Honko Jyväskylän yliopisto
  • Scott Jarvis Ohio University
  • Seppo Vainio Turun yliopisto
Avainsanat: sanasto, diversiteetti, kielen arviointi

Abstrakti

Artikkelissa tarkastellaan leksikaalisen diversiteetin eli tekstin sanastollisen monimuotoisuuden rakentumista. Tavoitteena on esitellä leksikaalisen diversiteetin tutkimuksen metodiikkaa ja osoittaa sen potentiaali kielitaidon arvioinnin välineenä. Tutkimuksessa selvitetään, kuinka yksilöllisiä arvioijien käsitykset tietyn tekstin sanastollisesta monimuotoisuudesta ovat, missä määrin arvioijien käsityksiä voidaan selittää tekstien sanastollisilla piirteillä ja mitkä näistä piirteistä ovat käsitysten selittäjinä tärkeimpiä.

Artikkelissa leksikaalista diversiteettiä tutkitaan tekstejä ja niiden tulkintaa vertailemalla. Aineisto koostuu koululaisten kirjoittamista kertomusteksteistä ja aikuisten lukijoiden teksteille antamista sanastollisen monimuotoisuuden arvioista. Kunkin tekstin (yht. 60) arvioi 23 arvioijaa, joiden vastausten yhdenmukaisuutta tarkasteltiin tilastollisesti. Tämän jälkeen selvitettiin tätä tutkimusta varten rakennetun tilastollisen mallin avulla, millaisiin sanastollisiin piirteisiin inhimilliset arvioijat kiinnittävät huomiota tekstien sanastollista monimuotoisuutta arvioidessaan.

Tulokset osoittavat, että arvioijien käsitykset yksittäisten tekstien sanastollisesta monimuotoisuudesta ovat hyvin yhdenmukaisia (Cronbachin alfa = 0,959). Arviointien luotettavuutta lisää se, että arvioitavien tekstien suuresta määrästä huolimatta kaikki arvioijat suorittivat tehtävän loppuun saakka eikä arviointilinja olennaisesti muuttunut tehtävän aikana. Leksikaalisen diversiteetin määrittelyn kannalta on olennaista, että tekstien yksittäisistä sanastollisista muuttujista neljä riittää selittämään lähes kolme neljäsosaa (n. 73 %) arvioiden vaihtelusta. Tutkitun aineiston perusteella lukijoiden tulkinta tekstin sanastollisesta monimuotoisuudesta tukeutuu vahvasti 1) tekstin eri sanojen määrään (runsaus), 2) tietyn sanan esiintymien välisiin etäisyyksiin tekstissä (sironta), 3) sanojen laatuun (erityisyys) sekä 4) tekstin sanastolliseen tiheyteen (vaihtelevuus), joka perustuu uusien sanojen tasaiseen ilmaantumiseen tekstissä.

 

Readers’ perceptions of lexical diversity: Examining lexical diversity at the interface between quantitative and qualitative research

This article examines the construct of lexical diversity while focusing on research methodology and the potential for lexical diversity to be used as an index of language proficiency. The study gives attention to questions of inter-rater reliability, the effects of texts’ lexical characteristics on raters’ lexical diversity ratings, and which set of features best accounts for raters’ perceptions of lexical diversity.

The present study focuses on lexical diversity in Finnish, and it does this by comparing the lexical characteristics of texts with how they are perceived. The data consists of narrative texts written by school children, as well as lexical diversity ratings assigned to the same texts by adult raters. Each text (n = 60) was rated by 23 raters, whose ratings were tested statistically for inter-rater reliability. A regression model was then used to investigate which lexical features the raters relied on while assessing the texts’ levels of lexical diversity.

The results show that the raters’ lexical diversity ratings were highly consistent with one another (Cronbach’s alpha = 0.959). Despite the large number of texts they were asked to rate, all raters rated each of the 60 texts, and their intra-rater consistency remained high from the beginning to the end of the rating task. The results have important implications for the construct definition of lexical diversity: of all the lexical features examined in the present study, four alone suffice to account for nearly three quarters (roughly 73%) of the variance in the ratings. The results suggest that raters’ perceptions of lexical diversity are strongly associated with 1) the number of different words in a text (abundance), 2) the intervals between occurrences of the same word (dispersion), 3) the semantic quality of individual words in the text (specialness) and 4) the overall degree of repetitiveness in the text (variety).

 

Osasto
Artikkelit
Julkaistu
Mar 20, 2019
Viittaaminen
Honko, M., Jarvis, S., & Vainio, S. (2019). Lukijat sanaston monimuotoisuutta määrittämässä: Leksikaalisen diversiteetin tarkastelua määrällisen ja laadullisen tutkimuksen rajapinnassa. Virittäjä, 123(1). https://doi.org/10.23982/vir.59025