2014/4
Linkit menneen ja tulevan välillä

Numeron sisällöstä

Maailma on tietoa pullollaan, ja yhä suurempi osa siitä on elektronisessa muodossa. Yhdysvalloissa The Library of Congress -kirjastossa yksinomaan American Memory -arkisto koostuu yli kahdeksasta miljoonasta digitaalisesta dokumentista. Brittiläinen The Thomson Corporation puolestaan on säilönyt Eighteenth Century Collections Online -palveluun kaikki merkittävät 1700-luvulla Iso-Britanniassa julkaistut teokset – yhteensä 33 miljoonaa sivua. Google Books -projekti oli jo vuosi sitten skannannut yli 30 miljoonaa kirjaa, minkä lisäksi palvelu tarjoaa myös alkuperältään sähköisiä aineistoja. Suomessa ei ole jääty sivustakatsojiksi; marraskuun alussa Arkistolaitoksen Digitaaliarkistossa oli 23,3 miljoonaa tiedostoa, ja määrä näyttää kasvavan vuodessa keskimäärin viidellä miljoonalla tiedostolla. Massiivisista tiedostomääristä ei kuitenkaan ole kenellekään iloa, ellei niiden säilyvyyttä ja saatavuutta voida taata. Ja siinä onkin pähkinää purtavaksi, sillä tiedostomuodot muuttuvat, tiedostoja siirrellään ja niitä tuhoutuu.

Tiina Valosen pro gradu Sähköiset aineistot Suomen historian vuosina 2000-2007 valmistuneissa opinnäytetöissä pureutui omalla näkökulmallaan tähän ongelmaan. Hän tarkasteli muun muassa sitä, missä määrin viitatut nettilähteet olivat vuosien jälkeen edelleen saatavilla sekä linkkejä klikkaamalla että tiedostoja etsimällä. Tarkastelujakson aikana opinnäytetöissä oli käytetty – vuosittain voimakkaasti kasvavin määrin – 160 nettilähdettä. Niistä 63:ssa (40 %) ilmeni ongelmia ja 36 (~22 %) oli kokonaan kadonnut. Minkälainen haloo nousisikaan, jos viidesosa yksittäisessä tutkimuksessa käytetystä tutkimuskirjallisuudesta olisi kadonnut taivaan tuuliin, tai jos vastaava määrä alkuperäislähteistä olisi täysin saavuttamattomissa?

Suomessa Arkistolaitos on tehnyt määrätietoista työtä PID (Persistent Identifier) -hankkeen parissa vuodesta 2012 lähtien estääkseen juuri linkkien katkeilua, parantaakseen tiedostojen saatavuutta nyt ja tulevaisuudessa sekä yhtenäistääkseen elektronisiin aineistoihin kohdistuvia viittauskäytäntöjä. Tässä numerossa Olli Kleemola, Olli Viitaniemi, Arja Virta, Ritva Kylli ja Helena Pilke testaavat käytännössä, miten automaattinen viitetyökalu toimii ja miten URN-tunnisteita linkkeineen hyödynnetään. Kuten julkaisuilla on yksilölliset ISBN- tai ISSN-tunnukset, on jatkossa myös Digitaaliarkiston tiedostoilla yksilölliset URN-tunnisteet.

Kirjoittajat hyödynsivät Digitaaliarkiston antia varsin laajalla skaalalla. Sekä Kleemola että Pilke tarkastelivat kumpikin sotapäiväkirjoja, Kleemola tiedotuksen ja propagandan näkökulmasta ja Pilke yksittäisten sotilaiden kirjeenvaihtoon peilaten. Viitaniemi puolestaan hyödynsi laajaa rippikirja-aineistoa tutkiessaan sitä, näkyikö uskonnollinen herätys yksilön lukutaidossa ja -tottumuksissa. Kansainvälisesti ainutlaatuinen rippikirjojen lähdesarja osoitti jälleen kerran monipuolisuutensa. Virran aineistona toimivat ylioppilaskirjoitusten historian ja yhteiskuntaopin reaalikoetehtävät vuosilta 1921-1969. Niistä hän tarkasteli tietosisältöjen muuttumista vuosien mittaan eli sitä, minkälaisia tietoja lukiolaisten odotettiin osaavan. Samalla aineistot kertoivat siitä, mitkä historialliset ilmiöt nousivat minäkin aikana niin vahvasti esille, että niitä haluttiin käsitellä ylioppilaskirjoituksissa. Kyllin tarkastelun kohteena olivat puolestaan kuolinsyyt 1700- ja 1800-luvuilla muutaman pohjoissuomalaisen esimerkkipitäjän valossa. Pääasiallisena alkuperäisaineistona toimivat pitäjien seurakuntien arkistot.

Käytetyt aineistot toisin sanoen ulottuivat ajallisesti 1700-luvulta vuoteen 1969 ja maantieteellisesti eteläisestä Suomesta Utsjoelle. Internetin välityksellä ne olivat kuitenkin vaivattomasti käytettävissä ympäri Suomea niin tutkijoiden työhuoneissa kuin kotonakin – taidettiinpa yhden käsikirjoituksen viitteitä viilata Teneriffallakin. Ennen ja nyt oli ilolla mukana yhteistyöhankkeessa, jonka tavoitteena oli sähköisten arkistojen käytön parantaminen entisestään. Toivon mukaan tulevaisuuden tiinavaloset toteavat tässä numerossa käytetyistä linkeistä: 100 % toimii moitteetta.