Historioitsija lukee yhä useammin arkistolähteitään digitaalisina, oman työhuoneensa rauhassa, omalta koneeltaan. Kätevyys ja jatkuva saatavuus ovat kiistattomia etuja, mutta mitä lähteiden digitaalisuus tarkoittaa tutkijan työn sisällön kannalta?
Tässä artikkelissa käsittelemme kirjeiden materiaalisuutta ja sen merkitystä 1800-luvun todellisuudessa. Nostamme esiin parhaillaan digitaalisena editiona ilmestyvän Elias Lönnrotin kirjeenvaihdon, 1800-luvun keskeisen suomalaisen kirjeverkoston, ja kerromme haasteista ja ratkaisuista, joita paperisen kirjeen digitaaliseen julkaisemiseen on liittynyt. Lopuksi pohdimme digitaalisen kirjeen käyttöä tutkijan työn kannalta: mitä merkitsee aineellisuuden katoaminen?
Elias Lönnrotin kirjeenvaihdon digitaalisen edition (http://lonnrot.finlit.fi/omeka/) julkaisuvaihe Suomalaisen Kirjallisuuden Seurassa on osa Erkon säätiön rahoittamaa Avoin tiede- ja kulttuuriperintö -hanketta. Työssä ovat mukana historioitsija-tietojenkäsittelytieteilijä, Lönnrotiin erikoistunut folkloristi ja 1800-luvun kirjeenvaihdon tutkija.
Materiaalisuus uudessa kirjetutkimuksessa
Materiaalisuudesta on tullut tärkeä osa kirjeenvaihdon tutkimusta kuten muutakin egodokumenttien tutkimusta. Kun aikaisemmin historioitsijat käyttivät kirjeitä usein lähteinä, joista tutkija etsii faktoja vastatakseen tutkimuskysymyksiinsä, uudessa kirjetutkimuksessa kiinnostuksen kohteiksi ovat nousseet myös itse kirjoittaminen ja kirjeenvaihdon kulttuuri. Samoin on alettu tutkia kirjeenvaihdon materiaalisia ja fyysisiäkin edellytyksiä, jotka 1800-luvun Suomessa ja erityisesti maaseudulla vaikuttivat merkittävästi kirjeenvaihdon toteutumiseen.
Kirjeenvaihdon ehdoton edellytys oli luonnollisesti kirjoitustaito, joka 1800-luvun alun Suomessa oli vielä hyvin harvinainen. Tarkkoja tietoja ei ole, mutta on arvioitu että 1830-luvulla noin viisi prosenttia maaseudulla asuvista miehistä osasi kirjoittaa.1 Kirjeiden kirjoittaminen, lähettäminen ja vastaanottaminen edellyttivät mahdollisuutta ja varoja hankkia kirjoitusvälineitä – kyniä, mustetta, paperia, kirjekuoria ja postimerkkejä.
Harvaan asutussa 1800-luvun Suomessa postilaitos, postireitit sekä postinkulun aikataulut vaikuttivat merkittävästi kirjeiden kirjoittamiseen, niiden ajoittamiseen ja kirjeenvaihdon tiheyteen. Postinkuljetuksen infrastruktuuri sekä postilähetysten hinnat olivat yksi syy siihen, että virallisen postilaitoksen sijaan kirjeitä lähetettiin paikkakunnalta toiselle usein tuttavien mukana. Postin kulku oli etenkin vuosisadan alkupuolella sekä hidasta että kallista, ja erot maan eri osien välillä olivat suuret. 1830-luvulle asti posti kulki useimmilla postireiteillä vain kerran viikossa, ja vuosisadan puolivälissä koko maassa oli vain 37 postikonttoria.
Materiaalisuuteen kuuluu myös kirjoittamisen tila. Monet tutkijat ovat todenneet, että oma, kirjoittamiselle rauhoitettu tila oli säätyläistenkin keskuudessa usein miesten etuoikeus: heillä saattoi olla työhuone ja kirjoituspöytä, kuten Elias Lönnrotilla. Kirjoitusrauhaa etsivät naiset siirtyivät tarpeen mukaan kotonaan huoneesta toiseen ja kirjoittivat esimerkiksi vuoteessaan.2 Maaseudun tuvissa kirjoitettiin todennäköisesti yhteisen pöydän ääressä, samassa tilassa askareitaan hoitelevan talonväen kanssa.
Kirjoitustaito oli matala ja infrastruktuuri heikko, ja Suomessa kirjoitettiinkin kansainvälisesti katsoen hyvin vähän kirjeitä: esimerkiksi vuonna 1865 lähetettiin runsaat 725 000 kirjettä eli 0,39 kirjettä asukasta kohti – luvussa ovat mukana liikekirjeet. Lönnrotin kirjeitä on samalta vuodelta säilynyt 24. Hänen kirjeenvaihtonsa vilkkaimmat vuodet osuvat 1830-luvun Kajaaniin, jolloin hän saattoi kirjoittaa jopa 150 kirjettä vuodessa.
Kirjeet ja ajan eroosio
Elias Lönnrotin kaksikielinen kirjeenvaihto onkin harvinaisen laaja, hyvin säilynyt ja kiinnostava: Lönnrotin omia kirjeitä, konsepteja ja mainintoja konseptikirjassa on yhteensä noin 2 500, ja lisäksi kirjeenvaihtoon kuulu noin 3 500 Lönnrotille lähetettyä kirjettä. Kirjeiden digitaalisen edition julkaiseminen alkoi keväällä 2017, ja ensimmäisessä vaiheessa julkaistaan noin 1800 Lönnrotin kirjoittamaa yksityiskirjettä kuvina ja transkriptioina.
Kirje on materiaalinen esine, ja kirjeenvaihdon tutkija saa kokoelman käsiinsä vasta ajan eroosion vahingoittamana. Sen jälkeen, kun kirje on täyttänyt alkuperäisen tehtävänsä yhteydenpidon välineenä kahden henkilön välillä, sitä ovat muokanneet vaihtelevat olosuhteet ja se on kulkenut monien käsien kautta. Fyysisen eroosion lisäksi säilymistä määrittävät kirjeenvaihtoa säilyttävät ja järjestävät ihmiset. Jälkeläisille kirje on usein muistoesine, joka peritään ja omistetaan ja johon liitetään tunnearvoa. Arkistoon päätyessään kirje on ammatillisin ottein järjestettävä dokumentti. Tutkija on tässä toimenpiteiden ja käsittelijöiden ketjussa useimmiten viimeinen.3
Elias Lönnrotin kirjeenvaihdon säilymiseen vaikutti merkittävimmin kirjoittaja itse. Lönnrot ymmärsi hyvin oman työnsä ja arkistonsa merkityksen ja testamenttasi kirjastonsa sekä käsikirjoitus- ja kirjeaineistonsa SKS:lle. Kuoleman lähestyessä hän vielä määräsi, että kanslianeuvos Carl Gustav Borgin tuli hävittää kirjeaineistosta kokoelmiin soveltumaton arkaluontoinen aineisto, jonka hän oli vastaanottanut lääkärinä, perheenisänä tai ystävänä.4
Kirjeen matka arkistosta digitaaliseen kirje-editioon
Elias Lönnrotin kirjeenvaihto -editio on rakennettu digitaalisten aineistojen esittämiseen tarkoitetulle avoimen lähdekoodin Omeka-julkaisualustalle.5 Kukin kirje muodostaa julkaisualustalla oman dokumenttinsa, joka sisältää kirjeen faksimilekuvat sekä transkription ja metatiedot XML/TEI5-muodossa.6 Kirjeiden faksimilekuvat ja transkriptiot ovat katsottavissa rinnakkain omalla sivullaan, ja kuvia voi suurentaa ja liikuttaa. Tutkijan kannalta tämä on tärkeä muutos kirjamuotoiseen editioon verrattuna: hän voi aina tarkistaa transkriptioiden oikeellisuuden vertaamalla niitä alkuperäisiin kirjeisiin. Tämä on erityisen oleellista suomenkielisissä kirjeissä, jotka on kirjoitettu aikana, jolloin kirjoitettu kieli oli vielä kehittymässä. Editiossa on avoin tekstihaku sekä laajennettu haku, jolla voi hakea kirjeitä tärkeimpien metatietokenttien perusteella. Kirjeiden faksimilekuvat, XML/TEI5-tiedostot, transkriptiot tekstimuodossa sekä tekstihakujen tilastotieto ovat vapaasti ladattavissa.
Elias Lönnrotin kirjeenvaihto -editiota suunnitellessa oli otettava huomioon tiettyjä digitaalisiin editioihin liittyviä haasteita. Kirjoja luetaan yleensä alusta loppuun. Digitaalisen edition käyttäjä voi sitä vastoin lähestyä aineistoa missä tahansa järjestyksessä: esimerkiksi editiossa tekemänsä haun, hakukoneen löytämän linkin tai satunnaisen selailun kautta. Siten ei voi olettaa, että kun tietty käsite selitetään kerran, käyttäjä tietää sen aiemmin lukemansa perusteella. Editiossa päädyttiinkin koodipohjaiseen toteutukseen, jossa termeihin lisätään automaattisesti selitys, kun ne esiintyvät ensimmäistä kertaa tietyssä dokumentissa. Toinen haaste liittyy aineiston säilyvyyteen ja oli merkittävä syy siihen, että kirjeaineistot tuotiin julkaisualustalle standardin mukaisessa XML/TEI5-muodossa. Aineiston on säilyttävä muuttumattomana sen jälkeen, kun alkuperäisellä toteutushetkellä valittu julkaisualusta ei enää vastaa ajan vaatimuksia.
Nykypäivän digitaaliselle editiolle ei enää riitä se, että arkistoaineisto on sen avulla nähtävillä verkossa. Oikeuttaakseen olemassaolonsa edition tulisi tuoda tieteelliseen tutkimukseen lisäarvoa, tapoja käsitellä lähdeaineistoa uudella tai erilaisella tavalla verrattuna esimerkiksi perinteiseen arkistotyöskentelyyn. Lönnrotin kirje-editiosta on pyritty luomaan työkalukokonaisuus, joka on selkeä käyttää ja tuo kirjeaineiston ja niihin liittyvän datan tutkijoiden käyttöön monipuolisilla ja tutkimusta aidosti hyödyttävillä tavoilla. Samalla työkalut tarjoavat uusia ja erilaisia tapoja hahmottaa ja aineellistaa arkistoaineistoa, jonka arkistoyhteys ja materiaalisuus heikkenevät digitaaliselle alustalle siirrettäessä.
Lönnrot-editiossa kirjeet on järjestetty kokoelmiin vastaanottajien mukaan. Näiden alla kirjeet ovat kirjoitusajan mukaisessa järjestyksessä. Kirjeiden määrä ja kirjeenvaihdon vuodet ovat nähtävissä jo kokoelmien otsikoissa. Tämän vuoksi Lönnrotin ja kunkin vastaanottajan välisen kirjeenvaihdon laajuus ja ajallinen ulottuvuus on hahmotettavissa yhdellä silmäyksellä.
XML/TEI5 on perinteinen tapa hahmottaa arkistoaineistoja digitaalisissa julkaisuissa. TEI (Text Encoding Initiative) on vakiintunut kansainväliseksi standardiksi, jota muun muassa arkistot käyttävät humanististen tekstien sekä niihin liittyvien metatietojen tallentamiseen ja esittämiseen esimerkiksi käsikirjoituseditioissa ja kielikorpuksissa.7 Standardi mahdollistaa tekstin piirteiden ja sisällön kuten henkilön- ja paikannimien sekä dokumenttien fyysisten ominaisuuksien yksityiskohtaisen kuvailun tarkasti määritellyillä tunnisteilla. Lönnrotin kirjeiden editiossa on käytetty keveämpää TEI-merkkausta. Metatietoihin on merkitty omilla tunnisteillaan kirjeiden lähettäjä, vastaanottaja, kirjoitusaika, -paikka sekä arkistotiedot. Transkriptioihin on merkattu Lönnrotin käyttämät alleviivaukset, yliviivaukset ja lisäykset ja tietyt transkribointiprosessiin liittyvät piirteet (epäselvät kohdat, tyhjät kohdat tekstissä, kohdat joita ei voi transkriboida). Sen sijaan TEI-tiedostoihin ei ole merkattu esimerkiksi henkilön- ja paikannimiä. Näiden merkkaus vaatisi paljon turhaa käsin tehtävää työtä, kun samoihin tietoihin pääsee käsiksi sekä metatiedot että transkriptiot kattavalla avoimella haulla. Samalla avoin haku tarjoaa perinteistä arkistotyöskentelyä helpomman tavan päästä käsiksi Lönnrotin kirjeissään käsittelemiin teemoihin, henkilön- ja paikannimiin.
Digitaalinen työkalupakki
Avoin haku ei sinällään ole uusi ominaisuus digitaalisissa julkaisuissa, mutta Lönnrotin kirje-editiossa se sisältää lisäominaisuuden, jolla hakutuloksia voi rajata ja kohdentaa vastaanottajan, kirjoitusajan, kirjoituspaikan, kielen ja dokumentin lajin (kirje, kirjekonsepti tai merkintä konseptikirjassa) mukaan. Käyttäjän tehtyä haun esimerkiksi sanalla ”Kanteletar” hakutulosten rajausvaihtoehdot näkyvät tulossivulla linkkeinä. Kun käyttäjä painaa ”Kirjoitusaika”-otsikon alla linkkiä ”1840 – 1849”, haku rajautuu 1840-luvulla kirjoitettuihin kirjeisiin, joissa mainitaan Kanteletar.
Elias Lönnrotin kirjeenvaihto -editiossa avoimeen hakuun nivoutuu joukko lisätyökaluja, jotka yhdessä haun kanssa hahmottavat Lönnrotin kirjeenvaihtoa uudenlaisella tavalla.
Julkaisun kaikkien kirjeiden, yksittäisten kokoelmien kirjeiden ja avoimen tekstihaun antamien tulosten XML/TEI5-tiedostot ovat vapaasti ladattavissa ja muokattavissa. Datan saatavuus avaa Lönnrotin kirjeenvaihdon sellaiselle tutkimukselle, joka hyödyntää koneellisen tekstinlouhinnan tapoja kuten rakenteiden/mallien etsimiseen suurissa korpuksissa käytettävä topic modeling.8 Editiota ei ole suunniteltu kielentutkijoille, mutta jaettavuuden ansiosta tutkijat voivat jatkojalostaa kirjeiden datan käytettäväksi esimerkiksi Kielipankin tarjoamilla työkaluilla.9 Myös uudenlaiset visualisointiratkaisut kuten karttasovellukset vaativat datan XML-muodossa. Esimerkki voisi olla sovellus, joka havainnollistaa Lönnrotin kirjeissään kuvaamia runonkeräysmatkoja näyttämällä kirjeissä mainitut paikannimet interaktiivisella kartalla. Tällainen sovellus edellyttäisi paikannimien annotoimista kirjeiden XML/TEI5-tiedostoihin.10
Kaikki tutkijat eivät käytä työssään tekstinlouhinnan työkaluja eivätkä siten tarvitse kirjeiden dataa näiden työkalujen vaatimassa muodossa. Lönnrotin kirjeitä tutkimuksessaan käyttävät tutkijat hyötyvät siitä, että transkriptiot ovat saatavissa omaan käyttöön, mutta XML/TEI5 tunnisteineen saattaa tuntua vieraalta. Toisaalta kvalitatiivisen aineiston analysointityökalut kuten Atlas11 vaativat aineiston tekstimuodossa.12 Lönnrot-editiossa vaihtoehtoinen tapa tuoda digitaaliset kirjeet käsinkosketeltavaan muotoon on sekä kirjeiden selaussivuihin että avoimen hakuun liittyvä työkalu, jolla transkriptiot voi ladata tekstimuodossa. Transkriptioiden tallentaminen tekstinä karsii pois XML-tunnisteet mutta säilyttää Lönnrotin alleviivauksien, yliviivauksien ja lisäyksien sekä epäselvien kohtien merkinnät.
Kolmas Lönnrot-edition tarjoaman työkalupakin osa on tilastotyökalu, joka nivoutuu avoimeen hakuun. Käyttäjän tekemä haku näyttää hakusanoilla löydettyjen kirjeiden lisäksi luettelon niiden tilastodatasta vastaanottajan, kirjoitusajan, kielen, dokumenttityypin (kirje, kirjekonsepti, merkintä konseptikirjassa) ja kirjoituspaikan mukaan jaoteltuna. Tilastodata on tutkijalle keskeistä, koska etenkin suurissa aineistoissa tilastointi ja visualisointi saattavat tuoda esiin piirteitä, joita on hankala hahmottaa aineistoa kokonaisuutena lukemalla. Tilastojen käytettävyyttä avoimen haun yhteydessä kuitenkin rajoittaa, jos data ei tallennu mihinkään. Työkalun avulla datan saa vietyä taulukkoon yhdellä painalluksella. Kun tilastotiedon saa näin suoraan käsiinsä kohdistamalla haun tarkoituksenmukaisesti, tilastojen kokoamiseen tarvittava työmäärä vähenee. Toiminto on käytössä ensimmäisen tason hakutulosten lisäksi myös rajatuissa hakutuloksissa, joten käyttäjä voi halutessaan luoda tekemistään hauista hyvinkin tarkasti kohdennettuja erillisiä tilastoja.
Mahdollisuus siirtää valmis tilastodata suoraan taulukkoon nopeuttaa ja helpottaa datan käsittelyä ja visualisointia taulukkosovellusten valmiilla työkaluilla. Yhtä lailla tärkeä etu on hakutulostilastojen helppo vertailtavuus. Käyttäjä saattaa olla kiinnostunut esimerkiksi siitä, miten paljon Lönnrot puhuu kirjeissään Kantelettaresta verrattuna Kalevalaan. Kanteletarta ja Kalevalaa koskevien hakutulosten tilastoja voi vertailla nopeasti rinnakkain viemällä erillisten hakujen tulokset omiin taulukoihinsa. Toisaalta samaan teemaan liittyviä kirjeitä on usein mahdollista hakea useilla hakusanoilla. Lönnrot – kuten useimmat kirjeen kirjoittajat kaikkina aikoina – kirjoittaa usein postin kulusta, postihallituksen toimista, järjestelyistä joilla posti löytää perille hänen runonkeruumatkoillaan tai vaikkapa postinjakajien kommelluksista. Tilastotyökalu helpottaa myös näiden eri tavoilla tehtyjen hakujen tilastojen vertailua.
Suullinen on kirjallista
Tulkitessaan arkistoaineistoa ja aineiston digitalisointia tutkija kohtaa joitakin kontekstuaalisia haasteita, jotka ovat peräisin aineistojen dokumentoinnin historiasta ja käytännöistä. Kun suullisen perinteen, lähinnä kalevalamittaisen kansanrunouden, dokumentointi laajemmin alkoi 1800-luvulla, taustalla vaikutti kaksi huomioon otettavaa seikkaa: heikko suomen kielen ja kulttuurin asema sekä arkistoinstituutin puuttuminen. Näitä vasten runojen keruuta määrittivät kaipuu ”yhteiseen” menneisyyteen sekä keruun painottuminen kirjallisiin julkaisuihin: tallennettiin aineistoa julkaisuja, kuten Kalevalaa, varten.
Sanotaan, että kulttuurinen muistimme ja tietomme, koko historiamme, on arkistossa.13 Arkistoitu, tallennettu, alun perin suullisesti välittynyt perinne, kuten suomalais-karjalaiset kalevalamittaiset runot, on katsottu edustavan ”aitoa” ja alkuperäistä suomalaista kulttuuria ja perintöä. Sitä ne tietyssä mielessä ovatkin, mutta käsityksemme suullisesta perinteestä perustuvat kirjallisiin lähteisiin. Käytössämme oleva kulttuurinen aineisto on aina jo tuotettua jossain historian vaiheessa ja siten valintojen ja tulkintojen tulosta.14
Huolimatta siitä, että henkilökohtainen ja kirjoitettu kirjeaineisto on merkittävästi erilainen kuin vaikkapa arkistoon tallennettu runoaineisto, on aineisto käynyt samanlaisen julkaisu- ja tulkintaprosessin. Elias Lönnrotin kirjeaineisto on valtaosin tallennettuna ja saatavilla Suomalaisen Kirjallisuuden Seuran arkistossa. Käsityksemme Lönnrotin kirjeenvaihdosta pohjautuvat kuitenkin tavallisesti julkaistuihin kirjeisiin. Kirjeitä on vuosien varrella julkaistu osana Lönnrotin matkoja15 ja elämäkertaa16 sekä vuonna 1990 ilmestyneessä laajassa kirjevalikoimassa. Raija Majamaan toimittama ja kommentoima Elias Lönnrot. Valitut teokset 1: kirjeet sisältää viidesosan (508) Lönnrotin noin 2500 kirjoittamasta kirjeestä. Valitut teokset on kattava valikoima kirjeenvaihdon eri aiheita, vastaanottajia ja aikakausia.
Konteksti(t) ja kontekstualisointi
Vaikka arkisto – tai tässä tapauksessa digitaalinen editio – perustuu järjestykseen ja johdonmukaisuuteen, kantaa se mukanaan keskeneräisyyden, epäjohdonmukaisuuden ja erilaisten halujen, toiveiden ja vallan ulottuvuuksia.17 Lönnrotin digitaalinen kirje-editio tuo koko kirjemateriaalin avoimesti saataville, mutta millaisia ratkaisuja järjestämiseen liittyy verkkojulkaisussa? Miten digitaalinen kirje-editio mahdollisesti laajentaa tai muuttaa – tai kenties kaventaa – käsityksiämme Lönnrotin kirjeistä?
Tutkija, joka on tottunut käyttämään arkistoaineistoa ja tuntee arkiston luokittelu- ja järjestämisperiaatteet, saattaa kohdata uudenlaisia kontekstiin liittyviä haasteita käyttäessään digitaalista editiota. Yksi haasteista liittyy kirjeen sijaintiin arkistokontekstissa. Arkistoon saatu kirjemateriaali on käynyt tietynlaisen valinta- ja tulkintaprosessin.18 Tämän seurauksena aineisto on tehty luettavaksi siitä kiinnostuneille, mutta samalla arkiston järjestäminen ja luettelointi on muodostanut aineiston tietynlaiseksi, osaksi arkistoympäristöä. Siten digitaalisessa editiossa tieto arkistokontekstista, jossa kirje on luokiteltu ja arkistoitu tiettyyn paikkaan osana laajempaa kokonaisuutta, heikkenee. Digitaalisessa editiossa kirjeen yhteys aineelliseen arkistoon näkyy enää vain abstraktina metatietona. Yksittäinen kirje täytyy kontekstualisoida uudelleen osana koko aineistoa.
Liz Stanley on artikkelissaan ”The Epistolarium: On Theorizing Letters and Correspondences” (2004) teoretisoinut kirjekokoelmien säilymistä, arkistointia ja editointia sekä säilyneiden kirjeiden suhdetta todelliseen, menneisyydessä toteutuneeseen kirjeenvaihdon kokonaisuuteen. Hänen tunnettu käsitteensä epistolarium käsittää laajimmassa merkityksessään yhden henkilön koko kirjeenvaihdon, kaikki hänen kirjoittamansa ja vastaanottamansa kirjeet.19 Tutkijalla on harvoin mahdollisuutta saada selville, minkälainen kirjeenvaihto on alun perin ollut: hänellä on useimmiten käytettävissään vain fragmentaarinen kokoelma säilyneitä kirjeitä. Tieto kirjeenvaihdon kokonaisuudesta on kuitenkin oleellisen tärkeä. Pitkässä kirjesuhteessa osapuolten välille muodostuu oma, kirjeiden sisäinen maailmansa, ja kirjeet paitsi heijastavat myös rakentavat heidän välistään suhdetta.
Epistolarium-käsitteen valossa Lönnrotin kirjeenvaihto on harvinainen: yhden kirjeen kontekstualisointi osana koko kirjeenvaihtoa on mahdollista, sillä Lönnrot piti kirjediaaria. Diaarin avulla voidaan jäljittää lähes koko kirjeenvaihdon kronologia, kirjeiden vastaanottajat ja kirjeiden kulku. Digitaalisen edition avulla Lönnrotin kirjeistä on mahdollista muodostaa epistolarium-kokonaisuus, joka kattaa yhden henkilön koko kirjeenvaihdon, sekä kirjoitetut että vastaanotetut kirjeet. Tämä mahdollistaa kirjeenvaihdon syvällisen tutkimisen osana kirjeiden sisäistä maailmaa ja kirjoittajien välistä suhdetta.20
Toinen kontekstuaalinen haaste kiinnittyy kirjeen historialliseen, henkilökohtaiseen ja sosiaaliseen asemaan osana sekä kirjeenvaihtoa että kirjeen kirjoittamisaikaa. Kirjeiden järjestys on arkistoon nähden erilainen. Lönnrotin kirjeet SKS:n arkistossa on järjestetty kronologisesti, jolloin voidaan seurata Lönnrotin aktuaalista kirjoitusprosessia; kirje havainnollistuu osana saman aikaan kirjoitettua muuta kirjemateriaalia. Yksittäisen kirjeen lukeminen tietokoneen ruudulta ei sinänsä avaa vielä mitään siitä, minkälaisten muiden kirjeiden ja kontekstien ympäröimänä Lönnrot on kirjettä kirjoittanut. Kirjeiden yhteys muuhun samanaikaiseen kirjemateriaaliin täytyy arvioida uudelleen.
Digitaalisessa muodossa aineiston materiaalisuus ei myöskään tule samalla tavalla näkyviin kuin arkiston pöydällä kirjepinoa selatessa. Kirjeeseen liittyvät aistittavat seikat häviävät. Vaikka digitaalisen kuvan suurennus takaa suhteellisen tarkan kuvan käsialasta, kynänkäytöstä tai paperin laadusta, katoaa digitaalisesta kuvasta materian kolmiulotteisuus. Lönnrotin kirjeaineisto sisältää eripaksuista paperilaatua sekä erikokoisia kirjeitä. Digitaalisessa editiossa esimerkiksi kirjepaperin pieni koko, ohut, läpinäkyvä paperi tai kirjeen sinetin kohokuvio ei välttämättä tule näkyviin. Lisäksi kirjeen aistimiseen (näkö, tunto, haju) liittyvät tunteet katoavat, eikä digitaalinen kirje voi antaa samanlaista ”kokemusta” kirjeestä kuin konkreettinen arkistoaineisto.
Toisaalta digitaalisen edition edut ovat kiistattomat. Digitaalisuus palauttaa tai havainnollistaa kirjeeseen liittyvän materiaalisuuden. Kirjeen aineellisuus säilyy huolimatta siitä, miten tiheässä käytössä aineisto on. Kirjeisiin voi palata yhä uudestaan, suurentaa, kääntää ja käsitellä ilman että kirjepaperi vaurioituisi. Kirje tulee myös subjektiivisesti lähelle, kun sitä voi lukea sekä transkription että originaalin kuvan kanssa samanaikaisesti. Laajojen metatietojen näkökulmasta digitaalinen editio saattaa myös eheyttää käsitystä kirjeaineistosta. Metatiedot taustoittavat ymmärrystä aineiston synnystä, käytöstä, tekijöistä ja esimerkiksi arkistopaikasta, ja lisäävät näin tietoa tutkimusaineistosta.21 On kuitenkin muistettava, että digitaalinen editio ja siihen lisätyt metatiedot ovat myös erilaisten valintojen tulosta, ja näin ne täytyy suhteuttaa aineiston taustoihin, vaihtuviin konteksteihin ja merkityksiin.
Hakujen moninaiset merkitykset
Arkistossa kirjeenvaihdon pitkä ajallisuus ja aineiston tiheys ei niinkään tule näkyviin, sillä tiedon hakeminen aineistosta edellyttää koko kirjemateriaalin läpi kahlaamista ja jäsennystä. Lönnrotin digitaalisen kirje-edition yksi eduista on se, että kirjeet on järjestetty vastaanottajan mukaan, jolloin saadaan isosta kirjemassasta vaivatta näkyviin esimerkiksi Lönnrotin ja Frans Johan Rabben monikymmenvuotinen kirjeenvaihto (1833-1871). Pelkästään Lönnrotin kirjeitä ja konsepteja Rabbelle on säilynyt 255 kappaletta.
Digitaaliseen editioon voidaan kohdistaa laajoja hakuja, jotka eivät ole mahdollisia pelkällä arkistoaineistolla. Esimerkiksi hakusanalla Kalev* saadaan esille, kuinka monessa kirjeessä Lönnrot mainitsee Kalevalan. Tulokseksi saadaan tämänhetkisellä aineistolla22 107 kirjettä ja konseptia, joista Frans Johan Rabben kirjeissä Kalevala mainitaan ylivoimaisesti eniten (56 kirjeessä). Tämän jälkeen Kalevala mainitaan 20 kirjeessä Carl Niklas Keckmanille. Hakutulos osoittaa myös Kalevalan ja kirjoitusajankohdan tai kirjoituspaikan välisen tiheyden. Ylivoimaisesti eniten Lönnrot on kirjoittanut Kalevalasta vuosina 1840-1849, aikana, jolloin hän valmisteli Kalevalan uutta, laajennettua laitosta. Kirjoituspaikka on ollut puolessa kirjeistä Kajaani (53 kirjettä), jossa Lönnrot toimi piirilääkärinä 1833-1853.
Mitä merkitsee, että Lönnrot mainitsee Kalevalan useimmiten kirjeissään lääkärikollegalleen ja asianhoitajalleen Frans Johan Rabbelle? Tulos on vastoin sitä tietoa, että Lönnrot keskusteli Kalevalaan liittyvistä kielellisistä ja rakenteellisista haasteista erityisesti suomen kielen lehtorin Carl Niklas Keckmanin kanssa.23 Oliko Rabben merkitys sittenkin suurempi Kalevalaan liittyvissä keskusteluissa kuin Keckmanin? Ei välttämättä, mutta hakutuloksia on avattava suhteessa konteksteihin, jotta aineisto ja sen antamat tiedot merkityksellistyvät.
Keckman kuoli varhain, jo vuonna 1838. Lönnrotin lähettämiä kirjeitä Keckmanille on tämän vuoksi vähemmän (kuutisenkymmentä). Lönnrot oli aktiivisessa kirjeenvaihdossa lääkärikollegansa ja läheisen ystävänsä Rabben kanssa 40 vuotta, mutta erityisen tiheää kirjeenvaihto oli 1830- ja 1840-luvuilla. Kirjeitä Rabbelle lähti kuukausittain, välillä useita kirjeitä saman kuukauden aikana. Rabbe huolehti Helsingistä käsin Kajaanissa piirilääkärin virkaa hoitavan Lönnrotin käytännönasioista: raha-asioista, kirjalähetyksistä, virkavapauksista, tilityksistä jne. Samaan aikaan Lönnrot työskenteli Kalevalan uuden, laajennetun version kanssa. Voidaan olettaa, että Lönnrotin mielessä olevat erilaiset asiat, rahahuolet, Kalevalan valmistuminen, kirjalähetykset jne. kirjautuvat samanaikaisesti myös kirjeisiin. Vaikka Lönnrot kirjoittaa Rabbelle myös runojen keruusta ja Kalevalan valmistelutöistä, Kalevala kirjeissä liittyy tavallisesti käytännön asioihin: Lönnrot esimerkiksi pyytää Rabbea lähettämään Kalevalan kappaleita eteenpäin.
Arkisto tai digitaalinen editio voi myös paljastaa unohduksiin jääneitä dokumentteja. Hakuehdolla Kantelet* and lyr* saadaan tulokseksi 39 kirjettä. Yli puolet kirjeistä ajoittuu 1840-luvulle, jolloin Kanteletar ilmestyi, siitä keskusteltiin ja sen runoja käännettiin ruotsiksi. Ruotsi onkin ylivoimaisesti tiheimmin käytetty kieli näissä kirjeissä (37). Jälleen Rabbelle on kirjoitettu eniten (19), mutta entä kymmenen kirjettä kanslianeuvos Carl Gustav Borgille 1870-1880-lukujen vaihteessa. Miksi Kanteletar ilmestyi Lönnrotin kirjeisiin 1880-luvulla? Vähemmän on tiedetty saati keskusteltu siitä, että Lönnrot valmisteli viimeisinä vuosinaan Kantelettaresta uutta, laajennettua laitosta, johon hän halusi hyödyntää kaiken siihen asti kerätyn runoaineiston. Työn vaiheita Lönnrot selosti Borgille, joka Rabben kuoleman jälkeen vuonna 1879 ryhtyi hoitamaan Lönnrotin asioita.24
Minkälaisia lisäkysymyksiä nämä kaksi tulosta nostavat? Vahvistaako tulos (Kanteletar ja lyyriset runot 39 kirjeessä, Kalevala 107 kirjeessä) sen, että Kanteletar oli Kalevalalle alisteinen, vähemmän arvostettu sekä julkisessa keskustelussa että Lönnrotin kansanrunotöiden kannalta? Voidaan myös kysyä, miksi Lönnrot puhuu näinkin harvoin Kantelettaresta. Olihan lyyrinen runous Lönnrotin mielestä viehättävintä kansanrunoutta, jota nimenomaan Kanteletar edusti.25 Vai onko kyse Kantelettaresta kokoelmana? Se ei aiheuttanut niin paljon päänvaivaa tekijälleen kuin Kalevalan kokonaisuus, joka vaati muun muassa juonen ja henkilöhahmojen yhtenäisyyttä. Pohtiko Lönnrot tunteisiin liittyvän lyyrisen runon haasteita enemmän yksityisesti? Kirjeiden kieli molemmissa hakutuloksissa on pääsääntöisesti ruotsi (Kalevalan kohdalla 2/3 kirjeistä, Kantelettaren kohdalla vain kahdessa käytetään suomea). Tämä varmasti johtui vastaanottajista, esimerkiksi Rabbe ei osannut suomea, mutta nivoutuiko ruotsin kieli myös kansanrunojen tekstualisointiin. Kalevala ja Kanteletar olivat tarkoitettu sivistyneelle lukijakunnalle, samalle joukolle, joiden kanssa Lönnrot kävi kirjeenvaihtoa. Pyrkiessään vastaamaan lukijoiden odotuksiin kansanrunojen kirjallisessa esittämisessä Lönnrot kävi keskustelua töidensä sisällöistä ja tulkinnoista lukijoidensa kanssa.
Lopuksi
Lönnrotin kirjeenvaihto on kestänyt ajan eroosiota erittäin hyvin. Arkistossa tapahtuneen kirjeiden käsittelyn viimeinen vaihe on ollut digitointi, ja sen yhteydessä kirjeiden olemus ja merkitys muuttuivat monella tavalla. Yksittäinen kirje ei enää ole vain ainutlaatuinen esine muistiorganisaation arkistossa, vaan myös loputtomasti monistettava tiedosto. Sen jakaminen ja liittäminen osaksi erilaisia kokoelmia ja käyttöympäristöjä on tullut mahdolliseksi ja merkittäväksikin tavaksi jakaa yhteistä kulttuuriperintöä. Lönnrotin kirjeet muodostavat poikkeuksellisen suuren yhtenäisen, XML-muotoisena transkriboidun kokoelman, jolle on jo ollut käyttöä alkuperäisen julkaisuhankkeen ulkopuolellakin. Kirjeiden transkriptiot luovutetaan Kielipankille, joka liittää ne osaksi suomen- ja ruotsinkielisiä korpuksiaan. Siellä ne ovat kielitieteilijöiden käytettävissä yhdessä Kielipankin työkalupakin kanssa. Erityisesti suomenkieliset kirjeet ovat kielihistoriallisesti kiinnostavia, sillä Lönnrot kollegoineen loi uutta suomen kirjakieltä kirjeissään: niissä keskustellaan kieliopista, käytetään uudissanoja ja jopa kokeillaan uusia kirjaimia. Kirjeitä käyttää myös Helsingin yliopiston STRATAS-hanke26. Kansainvälinen READ- hanke27 on saanut Lönnrotin kirjeiden faksimileja käyttöönsä kehittääkseen käsinkirjoitetun tekstin automaattista tunnistamista. Kansallisarkisto ja kansalliskirjasto puolestaan ovat antaneet Lönnrotin kirjeitä omista kokoelmistaan digitoitavaksi SKS:n verkkojulkaisuun. Voidaan hyvällä syyllä sanoa, että jakamisen ajatus on yksi tärkeimmistä digitaalisten ihmistieteiden työkaluista, ja jakaminen on mahdollista vasta uniikin kirje-esineen muututtua digitaaliseksi tiedostoksi.
Väitämme, että monet digitaaliseen julkaisemiseen liittyvät ratkaisut, jotka ensi näkemältä näyttävät ”teknisiltä” – alustan valinta, tiedostomuodot ja niiden lataus, hakukone – vaikuttavat itse asiassa syvällisesti tutkijan työskentelyyn. Siksi on tärkeää, että tutkijat ja tietojenkäsittelytieteilijät suunnittelevat julkaisuja tiiviissä yhteistyössä. Muussa tapauksessa humanistit luovuttavat päätösvallan työvälineidensä kehityksestä oman alansa ulkopuolelle.
Niin arkisto kuin digitaalinen kirje-editio on paikka, joka vaatii käyttäjän ja lukijan, jotta aineisto merkityksellistyy.28 Digitaalisessa julkaisussa voidaan tehdä isosta aineistomassasta hakuja, jotka tuottavat päteviä tuloksia, mutta hakujen tulokset on osattava suhteuttaa laajempaan kontekstiin. Digitaalinen editio ja arkistossa järjestetty aineisto täydentävät toisiaan. Digitaalisessa muodossa aineistoon liittyvät aistittavat tunteet ja kirjeiden prosessuaalinen ajallisuus heikkenevät, mutta toisaalta digitaalinen editio auttaa säilyttämään materiaalisen kirjeen tai kirjeenvaihdon diakronisen tiheyden. Digitaalista editiota voikin ajatella ”laajennettuna arkistona”, joka täydentää käsityksiämme kirjeaineistosta, mutta edellyttää – ainakin tutkimuksessa – ymmärrystä ja tietoutta sekä aineiston aineellisesta ja aineettomasta asemasta arkistossa että aineiston ympärillä vaikuttaneista konteksteista.
Kirjoittajat toimittavat Elias Lönnrotin kirjeiden digitaalista editiota Suomalaisen Kirjallisuuden Seuran tutkimusosastolla. FT Niina Hämäläinen on Lönnrotin tuotantoon perehtynyt folkloristi, joka vastaa kirjeiden transkriboinnista ja kommentaareista. FT Kirsi Keravuori on biografiaan ja 1800-luvun kirjeenvaihtoon erikoistunut historioitsija ja toimituspäällikkö. FT Maria Niku on historiasta väitellyt tietojenkäsittelytieteen kandidaatti, joka on rakentanut edition julkaisualustan.
Lähteet ja tutkimuskirjallisuus
Painetut lähteet
Anttila, Aarne. Elias Lönnrot. Elämä ja toiminta. Suomalaisen Kirjallisuuden Seura [1931, 1935] 1985.
Binder, Jeffrey M. Alien Reading: Text Mining, Language Standardization, and the Humanities. Debates in Digital Humanities. Toim. Matthew K. Gold. University of Minnesota Press 2012. http://dhdebates.gc.cuny.edu/debates/text/69.
Dauphin, Cécile; Lebrun-Pézerat, Pierrette ja Poublan, Danièle. Ces bonnes lettres: Une correspondance familiale au XIXáµ siècle. Bibliothèque Albin Michel, Histoire. Èditions Albin Michel 1995.
Elo, Kimmo. Digitaalisen historiantutkimuksen kenttää louhimassa. Digitaalinen humanismi ja historiatieteet. Toim. Kimo Elo. Historia Mirabilis 12. Turun Historiallinen yhdistys 2016.
Fält, Katja. Tutkijoiden digitaaliset tutkimusaineistot ja datan avoin jakaminen digitaalisen humanismin kontekstissa. Toim. Kimmo Elo. Digitaalinen humanismi ja historiatieteet, 39-75. Historia mirabilis 12. Turun Historiallinen Yhdistys 2016.
Hakala, Petra. Arkivsamlingarna vid SLS: En spegling av kultursyn och självbild?
Arkiv, minne, glömska: arkiven vid Svenska litteratursällskapet i Finland 1885-2010. Toim. Carola Ekrem, Pamela Gustavsson, Petra Hakala ja Mikael Korhonen. Svenska litteratursällskapet i Finland 2014.
Hyttinen, Elsi & Kivilaakso, Katri. Johdanto. Lukemattomat sivut. Kirjallisuuden arkistot käytössä, 7-18. Toim. Elsi Hyttinen ja Katri Kivilaakso. Suomalaisen Kirjallisuuden Seura 2010.
Hyvönen, Jouni. Lönnrotin eläytyminen kansanrunojen maailmaan. Toim. Anna-Leena Siikala et al. Kalevala ja laulettu runo, 299-339. Suomalaisen Kirjallisuuden Seuran Toimituksia 958. Suomalaisen Kirjallisuuden Seura 2004.
Hämäläinen, Niina. Yhteinen perhe, jaetut tunteet. Lyyrisen kansanrunon tekstualisoinnin ja artikuloinnin tapoja Kalevalassa. Turun yliopisto 2012.
Hämäläinen, Niina. “Why is Aino not described as a black maiden? Reflections on the textual presentations by Elias Lönnrot in the Kalevala and the Kanteletar.” Journal of Finnish Studies. Vol. 18, no. 1: 91-129, 2014.
Leino-Kaukiainen, Pirkko. Suomalaisten kirjalliset taidot autonomian kaudella. Historiallinen aikakauskirja 105. Suomen Historiallinen Seura 2007.
Lönnrot, Elias. Valitut teokset 1: Kirjeet Toim. Raija Majamaa. Suomalaisen Kirjallisuuden Seuran Toimituksia 510. Suomalaisen Kirjallisuuden Seura 1990.
Niemi, A. R. Elias Lönnrotin matkat. Suomalaisen Kirjallisuuden Seura 1902.
Pääkkönen, Irmeli. Suomalainen sydämestä. Carl Niklas Keckmanin toiminta suomen kielen kehittäjänä. Suomalaisen Kirjallisuuden Seura 1994.
Schwartz, Joan M. and Cook, Terry. Archives, Records, and Power: The Making of Modern Memory in Archival Science 2, pp. 1-19, 2002.
Smit, Brigitte. Atlas.ti for quantitative data analysis. Perspectives in Education, 20(3), 2002, 65-76, 2002. http://repository.up.ac.za/bitstream/handle/2263/4813/Smit_Atlas(2002).pdf.
Verkkolähteet
Omeka: Serious Web Publishing. http://omeka.org/about
TEI: Text Encoding Initiative. http://www.tei-c.org/index.xml
What is TEI?- Text Encoding (TEI) – Research Guides at UCLA Library. http://guides.library.ucla.edu/tei#s-lg-box-3584417
- Leino-Kaukiainen 2007, 426. Tieto perustuu Carl Christian Böckerin keräämään suomalaista yhteiskuntaa kartoittavaan tilastoaineistoon vuosilta 1834 ja 1835. [↩]
- Dauphin, Lebrun-Pézerat ja Poublan 1995, 118. [↩]
- Dauphin, Lebrun-Pézerat ja Poublan 1995, 76-84 ja Hakala 2014, 251. [↩]
- Majamaa 1990, 7. [↩]
- http://omeka.org/about. [↩]
- http://www.tei-c.org/index.xml. [↩]
- Esim. http://guides.library.ucla.edu/tei#s-lg-box-3584417. [↩]
- Binder 2012. Elo 2016, 19. [↩]
- https://www.kielipankki.fi/tyokalut/. [↩]
- Esimerkki kirjeaineistoja hyödyntävästä karttasovelluksesta on pohjoismaisia historiallisia kirjeaineistoja käyttävä Kultur- og naturreise, http://knreise.github.io/demonstratorer/. [↩]
- http://atlasti.com/. [↩]
- Smit 2002. [↩]
- Schwartz and Cook 2002, 3. [↩]
- Fält 2016, 40. [↩]
- Niemi 1902. [↩]
- Anttila 1931, 1935. [↩]
- Hyttinen & Kivilaakso 2010, 10-11. [↩]
- Arkisto on myös vallankäytön paikka, jossa osa aineistosta tuodaan käyttäjille saataville, osa jätetään huomiotta (ks. Schwarzt and Cook 2002, 14). Toisaalta ”kaikki mikä on arkistossa, on olemassa” (Hyttinen & Kivilaakso 2010, 13), ja siten arkistossa oleva ns. hiljainen tieto, unohdettu aineisto, toimii myös vallan vastustamisen välineenä (ibid.). [↩]
- Stanley 2004. [↩]
- Lönnrotin digitaalista kirje-editiota täydennetään jatkuvasti. Lopullisessa editiossa ovat mukana myös kaikki Lönnrotin vastaanottamat kirjeet. [↩]
- Ks. Fält 2016, 49-50. [↩]
- Kirjeitä digitaalisessa editiossa kirjoittamisen hetkellä (22.6.2017) 654 kappaletta. [↩]
- Pääkkönen 1994, 97-104; Hyvönen 2004, 307; Hämäläinen 2012, 71-72. [↩]
- Lönnrotin uusi Kanteletar työ keskeytyi Lönnrotin kuolemaan 1884. Siitä julkaistiin postuumina vain virsilaulut vuoden 1887 Kantelettaren 3. painoksessa. SKS:n arkistossa voi tutustua työn eri vaiheisiin, ks. lisää Anttila 1985; myös Hämäläinen 2014. [↩]
- Anttila 1985, 255. [↩]
- Interfacing structured and unstructured data in sociolinguistic research on language change. [↩]
- Recognition and Enrichment of Archival Documents. [↩]
- Schwartz & Cook 2002. [↩]