Eteneminen omalla vastuulla
Lähdekriittinen laskennallinen näkökulma sähköisiin kansanrunoaineistoihin
DOI:
https://doi.org/10.30666/elore.126008Avainsanat:
kansanrunous, digitaaliset ihmistieteet, arkistot, aineistot, metadata, itämerensuomalaiset kielet, runonlauluAbstrakti
Historiallisista, Suomen ja Viron kansallisvaltioiden syntyyn liittyvistä syistä johtuen itämerensuomalaista runolaulua (viroksi regilaul) eli niin kutsuttua kalevalamittaista kansanrunoutta on tallennettu, arkistoitu, järjestetty ja digitoitukin poikkeuksellisen paljon. Virolaisessa ERAB-korpuksessa ja suomalaisissa SKVR- ja JR-korpuksissa on tällä hetkellä 283 206 pääosin runolauluun liittyvää tekstiä viron (sis. seto), karjalan, lyydin, inkeroisen, vatjan ja suomen kielillä.
Tässä artikkelissa analysoimme näiden korpusten määrällisiä perusominaisuuksia. Luomme ensin yleiskuvaa aineistojen järjestely- ja digitointihistoriasta ja kerromme, miten olemme FILTER-hankkeessa käsitelleet sähköisiä korpuksia. Sitten tarkastelemme aineiston ja tallennushistorian luonteeseen liittyviä määrällisiä perusominaisuuksia ja lopuksi työn aikana paljastuneita aineiston ja sen metatietojen ongelmakohtia, joista on hyvä olla tietoinen myös laadullista tutkimusta tehtäessä.
Itämerensuomalaisen runolaulun sähköisessä muodossa oleva lähdeaineisto ei ole tasaista, kaikilta osiltaan systemaattista tai kattavaa, ja siinä on yllättäviäkin historian eri vaiheissa syntyneitä painotuksia ja ongelmia. Monet näistä ovat tiedossa aiemman tutkimuksen pohjalta, mutta laskennalliset menetelmät luovat aineistoon myös uusia näkökulmia. Samaan aikaan aineiston ongelmat vääristävät helposti erilaisia laskentoja, visualisointeja ja tulkintoja. Onkin tärkeää, että tutkijat myös sähköisiä välineitä käyttäessään lukevat yksittäisiä tekstejä, suhtautuvat aineiston metatietoihin varauksella ja osaavat tarvittaessa hakeutua alkuperäisten muistiinpanojen tai laajemman arkistoaineiston pariin.
Tiedostolataukset
Julkaistu
Viittaaminen
Numero
Osasto
Lisenssi
Lehti noudattaa ns. timanttista avoimen julkaisemisen mallia: lehti ei peri maksuja kirjoittajilta ja julkaistut tekstit ovat välittömästi avoimesti saatavana tiedelehtien Journal.fi-palvelussa. Toimittamalla artikkelin Eloreen julkaistavaksi kirjoittaja suostuu syyskuusta 2024 alkaen siihen, että teos julkaistaan CC BY 4.0 –lisenssillä.Lisenssin mukaan muut saavat kopioida, välittää, levittää ja esittää tekijänoikeuksiin kuuluvaa teosta sekä sen pohjalta tehtyjä muokattuja versioita teoksesta vain, jos he mainitsevat lisenssin, alkuperäisen julkaisun (linkki tai viite) ja kirjoittajan alkuperäisenä tekijänä. Kaikki tehdyt muokkaukset on ilmoitettava.
Tekstien tekijänoikeus säilyy kirjoittajilla ja julkaistun version rinnakkaistallennus on sallittua. Tämä koskee myös ennen syyskuuta 2024 julkaisuja tekstejä. Rinnakkaistallenteessa tulee näkyä Eloren julkaisutiedot.
Julkaistujen artikkeleiden metadatan käyttölisenssi on Creative Commons CC0 1.0 Universal.