2019/2
Digitaalinen historiantutkimus

Kekkonen, Euroviisut ja Helsinki – kansallinen audiovisuaalinen perintö NER-analyysin tunnistamana

Johdanto

Suomalaista kansallista audiovisuaalista perintöä on tallennettu Ylen Elävään arkistoon. Elävä arkisto on digitaalinen audiovisuaalinen historiapalvelu, jonka julkisen palvelun yhtiö antoi 80-vuotislahjaksi suomalaisille 9.9.2006. Arkiston avaamisesta kertovassa tv-uutisessa linjattiin, että ”Elävä arkisto esittelee merkittäviä suomalaisia ja Suomen kansan kohtalonhetkiä”[1]. Arkistoon tuotetuissa tausta-artikkeleissa ja mediaklipeissä mennyt kansallinen audiovisuaalinen historia jaetaan kulttuurisena ja historiallisena resurssina suomalaisten muistettavaksi, yhteiseksi perinnöksi. Audiovisuaalisen aineiston arkistoinnin ja rakentamisen kansakunnan perinnöksi voi ymmärtää Benedict Andersonin hengessä kuvitellun yhteisön keksimiseksi.[2] Audiovisuaalista perintöä käytetään kosketuspintana kulttuurisesti erityisiin henkilöihin, tapahtumiin, paikkoihin ja aikoihin arkiston samalla itse osallistuessa erityisyyden määrittelyyn. Kuten kansallis- ja kulttuuriperintönä ymmärretyt luonnonkohteet ja historialliset paikat, niin myös audiovisuaalinen perintö on asetettu osaksi historiaa ja muistia ja sitä toisaalta suojellaan tekijänoikeuksilla ja toisaalta hyödynnetään uusissa yhteyksissä.[3]

Artikkelissa tarkastelemme, keitä henkilöitä, mitä tapahtumia ja paikkoja on nostettu esiin Elävässä arkistossa edustamaan suomalaista audiovisuaalista perintöä. Tutkimusmenetelmänä käytämme nimentunnistukseksi (Named-entity recognition, NER) kutsuttua analyysia, jonka toteutamme FiNER-työkalulla. FiNER kykenee tunnistamaan suuresta tekstimäärästä henkilöiden, paikkojen ja tapahtumien suomenkielisiä nimiä, joille voidaan laskea esiintymisfrekvenssi. Artikkelin tavoitteena on tuottaa digitaalisen menetelmän avulla uutta tietoa Elävän arkiston painotuksista kansallisen audiovisuaalisen perinnön rakentamisessa, mutta koska tämä tieto on vahvasti sidoksissa digitaaliseen menetelmään ja FiNER:in toimintaan, on myös välttämätöntä avata metadata-aineiston ja nimentunnistuksen mahdollisuuksia ja rajoituksia historiallisessa tutkimuksessa. Aineistoanalyysin tuloksia suhteutetaan siis rinnakkain sekä historialliseen että menetelmälliseen kontekstiin. Konteksteja ei ole tässä mahdollista avata laajasti, vaan ne jäävät suuntaviivoiksi jatkotutkimukselle.

Audiovisuaalista perintöä analysoidessamme artikkelimme aineistona on arkiston audiovisuaaliset klipit. Elävä arkisto julkaisee viikoittain karttuvaan nettipalveluun katsottavaa ja kuunneltavaa Ylen arkistoista. Julkaisuperusteina ovat ajankohtaisuus, uudet tekijänoikeusavaukset, Ylen teemalliset ohjelmistot, yleisötoiveet, löytö, outous, lajityyppinsä tai aikakautensa oivallinen tai epätyypillinen edustaja.[4] Arkisto karttuu nykyhetken lähtökohdista, Ylen toimittajat valitsevat ja taustoittavat audiovisuaalista arkistomateriaalia nykyisille käyttäjille. Mediahistorian tutkija Mari Pajala tulkitsee kulttuurisen muistin muotoutuvan nykyisen ja menneen välillä, kun Elävä arkisto pyrkii elävöittämään arkistomateriaalia ja merkityksellistämään se nykyisyydestä käsin.[5] Menneisyyden esitykset kertovat usein enemmän valmistumisajankohdastaan kuin kuvaamastaan ajanjaksosta. Eri aikoina vallinneet menneisyysnarratiivit kertovat siitä, mitkä historian tapahtumat halutaan nostaa muistamisen keskiöön kulloinkin vallinneessa poliittisessa kulttuurissa ja yhteiskunnallisessa ilmapiirissä.[6]

Arkiston perustaminen legitimoi television aseman kulttuurissa; televisio asettuu osaksi kansallista historiaa ja muistia – muistamisen ja juhlimisen kohteeksi. Kuitenkin poiketen tavallisesta arkistosta, digitaalinen audiovisuaalinen arkisto ei vain passiivisesti säilö ja järjestä mennyttä, vaan arkiston toimittajat myös aktiivisesti tulkitsevat ja kehystävät audiovisuaalisia klippejä.[7]  Elävässä arkistossa muistelu tapahtuu toisessa mediumissa, radio ja televisioklipit on irrotettu esitysyhteydestään, usein myös ohjelmakokonaisuudesta ja siirretty verkkoon muodostaen uudenlaisen audiovisuaalisen kokonaisuuden. Kulttuurisen muistin aktiivisessa tuottamisessa tehdään valintoja, joissa tietyt henkilöt ja asiat saavat pysyvän sijan yhteisön kulttuurisen muistin osana. Tätä prosessia kulttuuriantropologi Aleida Assmann kutsuu kanonisaatioksi.[8] Artikkelissa jäljitämme nimentunnistuksen avulla kansallista kaanonia ja reflektoimme sitä, millä tavoin Elävä arkisto valottaa kansallista historiaamme.

Metadata aineistona ja analyysi FiNER:illä

Tutkimme rakennettua ja tallennettua audiovisuaalista perintöä, joten valitsimme tutkimusaineistoksi Ylen Elävän arkiston tausta-artikkeleiden sijaan audiovisuaaliset klipit. Audiovisuaalisia klippejä on arkistossa julkaistu kymmeniä tuhansia vuodesta 2006 vuoden 2018 alkuun, joten laajan media-aineiston analyysiin tarvitaan lähiluvun sijaan tietokoneavusteista menetelmää. Tutkimme klippejä niitä kuvailevan metadatan avulla, koska äänen ja liikkuvan kuvan elementtien koneellinen tunnistaminen ei ole vielä työekonomisesti mahdollista, ja toisaalta tekstimuotoinen metadata antaa melko luotettavan käsityksen aineiston sisällöstä. Metadata on tietoa tiedosta, jonka avulla metadatan kohteena olevalle tiedolle luodaan yhteinen ja keskenään vertailukelpoinen luokittelu- ja kuvailuterminologia. Se voi kuvailla kohteensa keskeisen sisällön asiasanoilla tai se voi sisältää laajempaa tietoa kuin kohteessa kuten tekijätiedot av-klipeissä.[9] Metadata keskittyy nimenomaan nimitietoihin, kuten henkilöihin, tapahtumiin ja paikkoihin.[10]

Tutkimusaineistossamme Ylen Elävän arkiston metadatassa on koottuna arkiston sisältämien mediaklippien tiedot (2006–2018).[11] Mediatiedoista valitsimme sarakkeet, joissa kuvataan median otsikko ja mainosotsikko sekä sisältökuvaus suomeksi (ks. Kuva 1). Näissä sarakkeissa kuvataan mediaklippien sisältöä, eikä yleensä tekijätietoja, jotka halusimme rajata tämän tutkimuksen ulkopuolelle keskittyessämme rakennettuun historiatarinaan ja siinä esiteltyihin henkilöihin. Tutkijan rooli rajata ja valita analyysille oleellinen aineistosta on ratkaisevaa tietokoneavusteisen analyysin tulosten onnistumiselle.

Kuva 1. Esimerkki Ylen Elävän arkiston metatietojen media.csv-tiedostosta.

Metadataa lähdeaineistona käytettäessä oleellinen osa lähdekritiikkiä on selvittää sen luomisessa käytettyä luokittelua ja ohjeistusta. Ylen Elävän arkiston vastaavan tuottajan Elina Yli-Ojanperän mukaan media-aineiston sisältökuvaukset metadatassa ovat tulleet kolmea kautta: ensinnäkin klippien kuvaustiedoissa on käytetty kokonaisten ohjelmien osalta pääsääntöisesti ohjelmien alkuperäistä aihekuvausta tai lehdistötekstiä. Nämä aihe- ja lehdistötekstit on tallennettu ohjelmien yhteyteen Ylen arkistotietokantaan, ja niitä on käytetty aikanaan ohjelman yhteydessä mm. ohjelmatiedoissa. Kuvaukset ovat tehneet alkuperäisen ohjelman tekijät, joskus tietoja on myöhemmin täydennetty Yle Arkistossa tai kanavien toimituksissa ohjelmien uusinnan yhteydessä. Toiseksi mediaotteiden yhteydessä Elävän arkiston toimittaja on kirjoittanut klipin aihe-kenttään lyhyen kuvauksen sisällöstä. Koska tämä kuvauskenttä ei ole Elävän arkiston sivustolla näkynyt loppukäyttäjälle, ei kenttää ole aina täytetty, vaan noin kymmenesosa kuvauskentistä on tyhjiä. Kolmanneksi Elävän arkiston klippien migraatiossa eli siirrossa yhdeltä tekniseltä alustalta toiselle vuonna 2011 ajettiin mediaklippien aihe-kenttään virheellisesti klipin still-kuvan kuvatiedot, jolloin ennen tätä tallennettujen mediatietojen aihe-kentässä lukee kuvan sisältö ja kuvaajatieto. Vain joidenkin klippien kuvaustietojen sisältöä on saatettu muokata ja täydentää tämän jälkeen.[12]

Näin ollen metadatan käyttäminen aineistona on joiltain osin ongelmallista, koska aineisto on epäyhtenäinen, sisältää jonkin verran tuplatietoja ja aukkoja sekä vääriä tietoja. Analyysissa olemme pyrkineet huomioimaan mainitut ongelmakohdat mahdollisuuksien mukaan: henkilöitä analysoitaessa karsimme tuloksista valokuvaajat pois, mutta ylimääräisiä kuvan sisältötietoja emme ole poistaneet. Aineiston suuri koko pienentää vinoumaa, jonka ongelmakohdat tuottavat analyysiin.

Käytimme analyysissamme FiNER-työkalua[13], joka on sääntöpohjainen suomen kielen nimentunnistin, jonka esikuvana on toiminut ruotsin kielen nimentunnistin HFST-SweNER[14]. Toistaiseksi FiNER:iä on hyödynnetty melko vähän analyysivälineenä.[15] HFST-SweNER:in tavoin FiNER hyödyntää Helsingin yliopistossa suomen kielen analyysiin kehitettyä Helsinki Finite State Transducer (HFST) arkkitehtuuria ja erityisesti sen pmatch-ominaisuutta[16], joka mahdollistaa pattern matching -sääntöjen kääntämisen ja soveltamisen laskennallisesti tehokkaina merkkijonopareja sisältävinä tietorakenteina ns. äärellistilaisina transduktoreina. Nimien tunnistamisessa ja luokittelussa hyödynnetään mm. merkkijonon tai lausekkeen rakennetta, esiintymiskonteksteja, sijataivutusta sekä tunnetuista tapauksista valmiiksi koostettuja nimilistoja.[17] NER-työkaluilla voidaan vastata journalismin peruskysymyksiin mitä, missä, koska, kuka ja miksi.[18] FiNER:in avulla saimme kerättyä kaikissa audiovisuaalisissa klipeissä esiintyneistä henkilöistä, tapahtumista, paikoista ja vuosiluvuista jäsennellyt listat; FiNER mahdollisti systemaattisen kokonaiskuvan hahmottamisen arkiston kymmenistä tuhansista klipeistä, mikä ei lähiluvussa tai muilla digitaalisilla menetelmillä olisi ollut mahdollista. Arkiston kokonaisuutta hahmottaessamme emme tässä artikkelissa keskittyneet ajalliseen muutokseen eri aiheiden painotuksissa. FiNER on kielitieteellisenä työkaluna kehitetty keskittymään määrällisten säännönmukaisuuksien tunnistamiseen ja sanalistoista on mahdollista laskea sanojen esiintymisen frekvenssejä, joita hyödynsimme analyysissa.

Metadata on tekstidatana sotkuista ja vaatii siksi esiprosessointia analyysin onnistumiseksi. FiNER hyväksyy syötteeksi kaikenlaista muotoilematonta tekstidataa, mutta se toimii parhaiten syötteellä, joka on suomen oikeinkirjoitussääntöjä noudattavaa juoksevaa tekstiä. Käytimme UNIX-työkaluja eristääksemme datasta halutut sarakkeet metadatasta ja siistiäksemme nimentunnistuksen kannalta tarpeettomat tai haitalliset osat pois, kuten sarake-erottimet ja lainausmerkit. Lisäksi merkitsimme kunkin sarakkeen arvon omaksi lausekkeekseen, jolloin tietue muodostui eheäksi tekstiksi.

Saadaksemme laskettua kunkin tunnistetun nimen frekvenssit FiNER:in tuottamasta sarkainerotellusta taulukkomuotoisesta tulosteesta oli sitä jalostettava eteenpäin niin, että nimet olivat eristettävissä ja palautettavissa perusmuotoon. Tarvitsimme FiNER:in tulosteen sellaisessa muodossa, jossa näkyy sanamuotojen ja nimimerkintöjen lisäksi sanojen perusmuodot ja morfologiset analyysit. Kirjoitimme skriptit pääosin pythonilla, joilla saimme poimittua tunnistetut nimet FiNER-tulosteesta, jossa on mukana morfologiset analyysit. Toiseksi palautimme tarvittavat osat nominatiivimuotoon.[19] Lopuksi listasimme perusmuotoon palautetut nimet ja laskimme niille frekvenssit. Näitä eri kategorioiden frekvenssin mukaan laskevassa järjestyksessä listattuja nimilistoja käytimme analyysin pohjana.

Tarkastelimme FiNER-analyysin eri kategorioiden frekvenssilistauksia työkalun teknisten ominaisuuksien asettamien mahdollisuuksien ja rajojen näkökulmasta. Analyysissa oli tärkeää metadatan lähdekriittinen tarkastelu, minkälaisia aukkoja tai painotuksia ja mahdollisia virheitä metadata aineistona tai FiNER työkaluna tuottaa. Kuten digitaalisia historiantutkimuksen menetelmiä käyttäneet Kimmo Elo ja Olli Kleemola huomauttavat, tutkijan on välttämätöntä ymmärtää, millä tavoin tietokone tuottaa aineistolouhinnan tulokset.[20] Kontekstoimme suurien frekvenssien henkilöitä, tapahtumia, paikkoja ja aikaa myös Elävään arkistoon katsomalla hakutoiminnolla, millaisissa tausta-artikkeleissa niitä käsitellään.

Suurmiehet, toimittajat ja muusikot muistettuina henkilöinä

Perinteisessä ja populaarissa historiakäsityksessä painottuvat tapahtumahistoria, sotahistoria, poliittinen historia sekä niin sanottujen merkittävien yksilöiden rooli. Ylen Elävän arkiston perustaneen ohjelmapäällikkö Reijo Perälän mukaan Suomen historian keskeisimmät tapahtumat ja henkilöt haluttiin kattaa arkistossa, mutta työtä määräsi se, löytyikö aineistoa arkistosta ja oliko siihen oikeuksia. Keskeisillä tapahtumilla Perälä viittasi juuri poliittiseen historiaan, merkittäviin henkilöihin, kuten presidentteihin, ja sotahistoriaan, mutta myös urheilua, musiikkia ja viihdettä haluttiin käsitellä. Esimerkiksi kirjallisuutta lähestyttiin yksittäisten, kuuluisien kirjailijoiden ja teemojen kautta.[21] Henkilöiden merkitys Elävän arkiston kansallisen historian reflektoijina onkin keskeinen. Tunnistimme FiNER:illä mediaklipeissä esiintyneitä henkilöitä lähes 12 000, joista keskityimme eniten mainintoja saaneisiin. NER-työkalut ovat vahvimmillaan henkilöiden nimien tunnistamisessa.[22]

Mainituimpien FiNER:in tunnistamien henkilöiden listassa näkyvät Ylen toimittajat suurena joukkona (ks. Kuvio 1). Metadata-aineistossa toimittajia on mainittu esittelytekstissä monessa yhteydessä: arkiston julkaistulla puolella näkymättömissä olevat esiintyvät metadatassa uutisklippien uutistenlukijoina tai ohjelmiensa tekijöinä. Toimittaja Arto Nyberg tulee esille nimikko-ohjelmassaan vierailleiden kuuluisuuksien klippien kautta, pitkän linjan journalisti Päivi Istala vuosikymmenten kokemuksia esitellään moniosaisen radiosarjan audioklipeillä. Toimittajien tunnistaminen ja erottaminen on tärkeää analyysissa, mutta heidän saamansa maininnat kertovat myös siitä, kuinka audiovisuaalisessa historiassa toimittajat – ja Elävässä arkistossa nimenomaan Ylen toimittajat – ovat keskeisiä toimijoita ja tekijöitä. He ovat myös ikään kuin julkisen tilan portinvartijoita, kuten Arto Nyberg valitessaan kutsumansa ihmiset ohjelmansa vieraiksi.

Kuvio 1: Yli 50 mainintaa saaneet FiNER:in tunnistamat henkilöt Ylen Elävän Arkiston mediatietojen metadatassa (pl. valokuvaajat). Ylen toimittajat erikseen mainittu. Listassa nähdään, että FiNER on poiminut mukaan myös pelkkiä etunimiä ja tulkinnut virheellisesti nimeksi ”Aamun”.

Presidentti Urho Kekkonen dominoi Elävän arkiston aineiston eniten mainittuna henkilönä: FiNER:in listauksessa Kekkos-maininnat jakaantuvat eri versioille nimestä: ”Urho Kekkonen” (177), ”Kekkonen” (176), ”Urho Kaleva Kekkonen” (12), ”presidentti Urho Kekkonen” (12), ”Suomi Kekkonen” (1) (ks. Kuvio 1).[23] Kekkosen suurta roolia arkistoklipeissä korostaa myös se, että toiseksi eniten aineistossa esiintyi Kekkosen luottokuvaaja Kalle Kultala kuvatietojen virheellisen ajon takia. Kekkonen on päähenkilönä monissa tausta-artikkeleissa, joihin on koottu useita video- ja audioklippejä vaalikampanjoinnista messu- ja näyttelyvierailuihin, harrastuksista puheisiin ja ulkomaanvieraista hautajaisiin. Pitkäaikaisena presidenttinä (1956–1982) hän ehti pitää 25 presidentin uuden vuoden puhetta ja isännöidä itsenäisyyspäivän vastaanottoa, jotka molemmat kuuluvat oleellisesti kansalliseen audiovisuaaliseen muistiin vuosittain toistuvina ja katsotuimpien ohjelmien joukossa.  Kekkonen kytkeytyy Yleisradioon monitahoisesti: hänellä oli läheiset henkilökohtaiset suhteet yhtiöön, Kekkosen poliittinen ura rakentui samaan aikaan yleisradiotoiminnan kehittymisen kanssa, hän vetosi kansaan radiopuheillaan radiolupien kasvun aikana – hänen pitkä valtakautensa kytkeytyi Yleisradion monopolikauteen.[24]

Kuva 2. Presidentti Urho Kekkosen uudenvuodenpuheita on tallennettu Elävään arkistoon. Yleisradio aloitti säännölliset televisiolähetykset 1.1.1958. Vuosi käynnistyi juhlavasti presidentti Kekkosen uudenvuodenpuheen televisioinnilla. Sotilassoittokuntaa studiossa johti musiikkimajuri Martti Parantainen (oikealla). Lähde: Yle Elävä arkisto.

Mediatutkijat Lotta Lounasmeri ja Johanna Sumiala arvioivat Kekkosen käyttäneen taitavasti hyväkseen aikansa joukkoviestimiä, kuten sanomalehtiä, radiota ja televisiota. Kekkonen rakensi suvereenia kuvaa itsestään valtiomiehenä ja johtajana ja toisaalta kansanmiehenä kalastamassa, hiihtämässä ja erätulilla, maakuntien emäntiä ja isäntiä tapaamassa tai saunan lauteilla löylyä heittämässä.[25] Lehti- ja televisiokuvat kuvauksellisesta Kekkosesta levisivät joukkoviestimissä, jolloin niistä tuli osa kansakunnan kuvallista tajuntaa ja muistia – Elävä arkisto on koonnut tätä audiovisuaalista muistia talteen. Aikalaisklippien lisäksi Kekkonen näkyy arkistossa dokumenttien, draamasarjojen ja sketsien henkilöinä sekä vertailukohtana muihin myöhempiin poliitikkoihin – Kekkosen varjo on pitkä. Kekkos-kultti elää yhä nostalgiana ja kaipuuna vahvaan johtajuuteen.[26]

Myös marsalkka Carl Gustaf Mannerheimin monet maininnat kertovat suurmiesten suuresta merkityksestä osana kansallista audiovisuaalista muistia. Mannerheim esiintyy arkistossa valokuvissa, filmiklipeissä ja radiopuheissa sekä dokumenteissa. Merkkihenkilöiden elämästä kootaan aineistoa syntymästä kuolemaan, Elävässä arkistossa on videoklippejä leikkikaverin haastattelusta näyttäviin sotilaallisiin hautajaisiin. Lisäksi Mannerheim kuvittaa audiovisuaalisesti Suomen sotahistoriasta kertovia taustajuttuja, kuten ratsastaessaan sisällissodan jälkeisen valkoisen armeijan voitonparaatin kärjessä vuoden 1918 videolla ja talvisodan päätyttyä lukiessaan ylipäällikkö Mannerheimin päiväkäskyä radiossa. Historiantutkija Tuomas Teporan mukaan Mannerheimin hahmon ja henkilön kautta tiedotusvälineissä on käsitelty yhteiskunnallisia murroskausia.[27] Toisaalta suurmieheyden rinnalla Mannerheimin hahmo seikkailee myöhemmin osana populaarikulttuuria esimerkiksi nukkeanimaatiossa ja elokuvissa. Olennainen osa Mannerheim-myyttiä onkin jo sotien väliseltä ajalta saakka ollut tämän suurmieheyttä kyseenalaistavat käsitykset ja mielikuvat.[28] Mannerheim näkyy arkistoaineistossa myös Mannerheim-ristin ritareista ja Mannerheimin lastensuojeluliiton työstä kerrottaessa.

Suurmiesten käsittely havainnollistaa Elävän arkiston historia-ajatusta: arkisto ei pelkästään rakenna erityisesti audiovisuaalista historiaa näkökulmavalinnoillaan, vaan audiovisuaalinen materiaali on myös kuvittamassa kansallista historiakertomusta. Esimerkiksi suomalaiselle kansalliselle kertomukselle ja muistelulle talvi- ja jatkosodan merkitys on keskeinen,[29] ja siten myös Elävässä arkistossa sotiin liittyviä taustajuttuja oli runsaasti mukana heti avauksessa. Av-materiaalin näkökulmasta aiheen käsittelyllä on haasteensa: sotiin liittyvää av-arkistomateriaaleja oli hyvin rajatusti tarjolla, koska Ylellä ei ollut oikeuksia jatkosodan filmiaineistoon.[30] Näin arkiston rakentama kansallinen kaanon vahvistaa myyttisten suurmiesten asemaa kulttuurisessa muistissa. Tosin on huomattava, että suurmiesten näkyvyyttä metadatassa selittää myös arkiston asiasanaston tekemisen käytänteet: Kekkonen tunnistettavana hahmona oli paljon esillä arkistohauissa, jolloin Urho Kekkonen asiasanana tuli liitetyksi moneen ohjelmaan, jossa hän on vain vilahtanut tai ollut esim. pelkästään ohjelman aiheena. Yli-Ojanperän mukaan myös Mannerheimia on asiasanoitettu pieteetillä, kun Yle teki uuden tulkinnan Mannerheimista Keniassa 2012 kuvatussa Suomen Marsalkka -elokuvassa ja lisäksi elokuvaprojektia seurattiin Operaatio Mannerheim -sarjassa. Näiden tuotantoon liittyen historiallinen Mannerheim-aineisto asiasanoitettiin huolellisesti, jotta ne nousisivat esiin keskustelua herättäneen elokuvaprojektin yhteydessä.[31]

Suurmiesten lisäksi miehet dominoivat muutenkin mediaklippien tiedoissa: ensimmäisestä sadasta henkilöstä 72 on miehiä. Mainituista naisista kymmenestä eniten mainintoja saaneesta kahdeksan on Ylen toimittajia; vain laulaja Paula Koivuniemi ja presidentti Tarja Halonen nousevat esiin yhtä lailla. Läntisessä historiografisessa perinteessä naisia ei ole viime vuosiin asti käsitelty aktiivisina toimijoina eikä naisille ole annettu tilaa kansallisessa historiografiassa. Vaikka perinnettä on haastettu jo lähes viidenkymmenen vuoden ajan, naiset ovat edelleen aliedustettuina useimmissa kanonisoiduissa historiallisissa narratiiveissa.[32] Näin myös Elävässä arkistossa, vaikka Ylessä on jo pitkään tehty tasa-arvotyötä. Kyse on myös ammattikuntien naisistumisen historiasta: presidentti Tarja Halonen oli ensimmäinen nainen presidenttinä (2000–2012) ja toimittajakunta naisistui suurissa määrin 1970-luvulta lähtien. Yleisradiossa naistoimittajien osuus oli 35 % vuonna 1972.[33]

Toimittajien ja presidenttien lisäksi audiovisuaalisessa media-aineistossa esiintyvät runsaslukuisasti muusikot: Kirka, Mikko Alatalo, Danny, Paula Koivuniemi, Lasse Mårtenson ja laaja-alainen viihdetaiteilija Vesa-Matti Loiri mahtuvat TOP20:iin. FiNER:in analyysin mukaan arkistossa eniten painoarvoa saavat iskelmälaulajat. Elävä arkisto kuvaakin iskelmää kansallisena musiikkigenrenä esitellen ajatuksen iskelmästä ”kansakunnan salattuna muistina”: ”Iskelmän historia on suomalaisen mentaliteetin, salattujen tunteiden tarina, joka elää meissä kaikissa”[34]. Elävässä arkistossa rakennetaan virallisesti vahvistettua populaarimusiikin perintöä[35], jolloin tavoitellaan kansakunnan tason muistin puhuttelemista, siinä missä epävirallisemmat musiikkia muistelevat verkkoarkistot rakentuvat tarkemmin tietyn ajan, paikan tai faniyhteisön ympärille. Eri yhteisöjen musiikillisen muistin puhuttelussa keskeistä on affektiivinen suhde menneisyyteen, tunteet motivoivat musiikillisen muistin rakentamista.[36] Muusikoita yhdistää suuri suosio ja vuosikymmenien ura ja hitit, mutta heidän saamaansa painoarvoa arkistomateriaalissa selittää myös heidän näkyvyytensä Yleisradion ohjelmissa, esimerkiksi Euroviisuissa ja festivaalitallenteissa. Mikko Alatalon monipuoliset tv-työt Ylen ohjelmissa, kuten musiikkiohjelma Iltatähden (TV2 1973–1983) ja Hittimittarin (TV2 1984–1988) juontajana, nostavat hänet esiin monissa yhteyksissä, koska niitä on tallennettu laajasti Elävään arkistoon. Samoin Lasse Mårtenson nousee esiin Myrskyluodon Maijan musiikin säveltäjänä, kuten kuvaamme myöhemmin. Nostamalla muusikoita kansalliseen kaanoniin suurmiesten rinnalle arkisto puolestaan rakentaa erityistä audiovisuaalista historiaa ja muistelua.

Kansalliset audiovisuaaliset tapahtumat

Muusikoiden lisäksi musiikin iso rooli arkistossa näkyy FiNER:in tapahtumalistauksessa. Musiikkiin liittyvät tapahtumat ovat FiNER:in listauksessa eniten edustettuina (ks. Kuvio 2). Media-aineistossa näkyy musiikkifestivaalien taltiointien suuri rooli audiovisuaalisessa perinnössä, mutta ehdottomasti isoin kansallinen audiovisuaalinen tapahtuma FiNER:in listauksessa on Ylen lähettämä Eurovision laulukilpailut. Elävän arkiston ohjelmapäällikkö Reijo Perälä toteaakin, että Euroviisuista ja Interviisuista julkaistiin kaikki.[37] Pajala on analysoinut euroviisuja kansallisen muistin näkökulmasta ja toteaa, että Eurovision laulukilpailun avulla on tuotettu yhteistä kansallista historiaa. Vuosittain toistuvana ja pitkäikäisenä televisiotapahtumana laulukilpailu on ollut tärkeä populaarikulttuurin ilmiö, jonka ympärillä on käyty mediakeskusteluita ja neuvoteltu kansallisuuden merkityksiä kulttuurisessa muistissa. Historiallisen huono menestys katkesi Lordin voittoon vuonna 2006, pettymysten täyteisten vuosikymmenten negatiiviset kokemukset korvautuivat kansanjuhlassa.[38] Elävässä arkistossa muistellaan sekä menestystä että huonompia sijoituksia ja myös kansallisia Euroviisu-karsintoja, joiden kautta monet artistit saavat sijan audiovisuaalisessa historiassa.

Toinen teema mediaklippien kuvaamissa tapahtumissa ovat suuret urheilukilpailut, kuten yleisurheilun EM- ja MM-kilpailut. Urheilun asema kansakunnan rakentamisessa on ollut tärkeä, urheilun avulla on nostatettu kansallistunnetta ja luotu yhteisöllisyyttä.[39] Radiossa ja televisiossa urheilulähetykset ovat alusta asti olleet merkittäviä suurten yleisöjen kokoajia ja Yleisradiolle strategisesti tärkeitä kansallisesti jaettuina kokemuksina. Elävässä arkistossa urheilua lähestytään eri lajien, keskeisten kisojen ja menestyneiden urheilijoiden kautta. Perälän mukaan arkistoon etsitään ja julkaistaan taustoja aiemmista kisoista, aina kun on tulossa olympialaiset tai MM-kisat.[40] Näin urheilun käsittely keskittyy muistelujen myötä suurten urheilukilpailujen ympärille, joiden välittäminen on ollut ja on edelleen Yleisradiolle suuri taloudellinen panostus ja legitimiteetin kannalta keskeistä.

Tapahtumien kolmantena teemana FiNER:in listauksessa näkyvät sodat, erityisesti talvi- ja jatkosota. Ne ovat merkittäviä kansallisia murroksia ja tärkeä osa kansallista kertomusta ja selviytyjämyyttiä, joita rakennetaan kansallisessa julkisuudessa ja esimerkiksi koulukirjoissa.[41] Historiantutkija Tuomas Teporan mukaan sota-ajat toimivat yleisinä kollektiivisen muistamisen kiinnekohtina. Ne ovat traumaattisia muistoja, mutta myös sotien muisteluun liittyy usein talvisotamainen yhteenkuuluvuus. Elävässä arkistossa ylläpidetään sotien muistelua erilaisten vuosipäivien yhteydessä, jolloin se puhuttelee Teporan sota-aikojen muistamiselle ominaisena pitämää yhteiskunnan pitkäkestoista kulttuurista muistia.[42]

Kaikkiin Elävässä arkistossa painottuviin tapahtumiin liittyy muistelun toisteisuus: kansalliset audiovisuaalisesti jaetut merkkihetket kasaantuvat syklisesti arkistoon toistuvien muistelujen kautta. Näin audiovisuaalinen perintö rakentuu prosessina, jossa toisto, kierrätys ja yhden mediumin remedioiminen toiseen mediumiin korostuu.[43] Toisteisuus kuuluu jo televisioon televisiovuosien noudattaessa tiettyä kalenteria, tämä toisteisuus remedioituu televisiosta digitaaliseen arkistoon. Pajalan mukaan huomattavan monet televisiovuoden perinteisistä merkkihetkistä liittyvät eksplisiittisesti kansallisuuteen: Euroviisut ja urheilutapahtumat yhdistävät kansallisen yleisön jännittämään oman maan edustajien esiintymistä, presidentin itsenäisyyspäivän vastaanotolla ja sotia muistelevalla ohjelmistolla juhlitaan valtiollista itsenäisyyttä.[44] Kansallisesti merkittävät televisiovuoden tapahtumat toistuvat syklisesti myös Elävässä arkistossa

Kuvio 2. Ylen Elävän Arkiston mediatietojen metadatasta FiNER:in tunnistamat tapahtumat ryhmiteltynä.

Tapahtumia analysoitaessa on huomioitava FiNER:in kategorian määrittely. FiNER listaa tapahtumien kategoriaan esimerkiksi taidenäyttelyitä, messuja, festivaaleja, konsertteja, konferensseja, sotia ja konflikteja.[45] Esimerkiksi itsenäisyyspäivän vastaanotto tai Linnan juhlat eivät tulleet FiNER:in listaukseen, vaikka ne esiintyvät monissa mediaklipeissä. Sen sijaan sodat ja FiNER:in tunnistamat poliittiset konfliktit listautuvat musiikin, urheilun, taiteen ja viihteen ohella tapahtumiksi – luokittelutapa rinnastaa hyvin eritasoisia asioita yhteiseen tapahtumien kategoriaan, mikä on analyysin kannalta haastavaa.

Helsinkiläinen perintö?

FiNER listaa paikka-kategoriassa monia erilaisia paikkoja maantieteellisistä poliittisiin ja tähtitieteellisistä katuihin, teihin ja toreihin. Käytimme analyysissa poliittisten ja hallinnollisten paikkojen listausta, jossa on valtioita, osavaltioita, läänejä, kaupunkeja, kyliä ja kaupunginosia. Maita ja kaupunkeja esiintyi 50:ssä eniten mainintoja saaneissa yhtä lailla, ulkomaisia paikkoja mainittiin kotimaisia enemmän (ks. Kuvio 3).

Kuvio 3. Eniten mainintoja saaneet paikat Ylen Elävän Arkiston metadatassa. FiNER tunnistaa samassa kategoriassa valtioita, osavaltioita, läänejä, kaupunkeja, kyliä ja kaupunginosia.

Paikka-kategoriaa analysoitaessa haasteellista on se, että metadata-aineistossa paikkojen nimet saattavat esiintyä monessa yhteydessä, kuten mediaklipin tapahtumapaikkana, ohjelman aiheena, uutisotsikoissa tai urheilukilpailujen maajoukkueita mainittaessa. Näin tunnistetut paikat eivät ole yhtenäinen vertailukategoria. Mainituimmissa maissa painottuvat Suomen ohella naapurimaat Ruotsi ja Neuvostoliitto/Venäjä, mutta myös Yhdysvallat (USA) on keskeinen viittauskohde audiovisuaalisissa lähteissä. Voisi ajatella, että Suomen geopoliittista asemaa idän ja lännen välissä rakennetaan näkyviin Elävässä arkistossa.

Helsinki on ylivoimaisesti mainituin kaupunki, mutta Helsinki-keskeisyys tulee aineistossa esiin myös monissa muissa kategorioissa: oppilaitosten listauksessa Helsingin yliopisto on mainituin, medioista Helsingin Sanomat yleisin Ylen omien medioiden seassa, kadunnimissä Helsingin kadut dominoivat samoin kuin rakennusten listauksessa. Selityksenä Helsinki-keskeisyydelle voi hakea siitä, että pääkaupunkina monet tapahtumat sijoittuvat Helsinkiin ja myös Yleisradion studiot ja toiminta on keskittynyt sinne TV2:sta lukuun ottamatta. Kiinnostavaa kansallisen audiovisuaalisen perinnön näkökulmasta on kuitenkin pohtia sitä, kuinka dominoiva rooli Helsingillä on suhteessa muihin paikkoihin ja millainen vaikutus sillä on perinnön omaksi kokemiseen muualla maassa.

Yleisradion välittämä historiallinen aika

Elävässä arkistossa on audiovisuaalisia tallenteita jo 1900-luvun alkuvuosikymmeniltä asti ennen Yleisradion perustamista vuonna 1926. Suurin osa arkiston mediaklipeistä on saanut ensiesityksensä 1970-luvulta lähtien (ks. Kuvio 4). Suurin osa Ylen ohjelmista onkin säilynyt vasta viimeisiltä kahdelta vuosikymmeneltä. Artikkelissa käytimme FiNER:in analyysissa mediaklippien otsikon ja sisällön tietoja, joista poimimme FiNER:illä vuodet. Näin vuosien analyysi oli verrannollinen henkilöiden, tapahtumien ja paikkojen kanssa, joita analysoitiin samojen sarakkeiden tiedosta eli keskityimme klipin kuvaukseen, emme varsinaiseksi ensiesityspäiväksi merkittyyn aikaan, jonka tarkkuus vaihteli vuosikymmenestä tarkkaan päivämäärään. Vertasimme kuitenkin analysoituja vuosilukuja ensiesityspäivien vuosiin. Vuosien esiintymismäärässä on eroja, ensiesityspäivien mukaan eniten av-klippejä on arkiston ensimmäiseltä viideltä vuodelta 2006–2010. Tätä kuitenkin selittää se, että klippien silloisessa migraatiossa on tallentunut klippien julkaisupäivät Elävään arkistoon, jolloin ne ovat metadatassa rinnastuneet alkuperäisten ohjelmien ensijulkaisupäivien kanssa.[46] Tämä aiheuttaa vääristymää analyysiin, minkä vuoksi keskitymme mediaklippien otsikon ja sisällön kuvauskenttien tietoihin.

Kuvauskenttien FiNER-analyysissa tasavuosikymmenet erottuvat laskuina, koska FiNER ei välttämättä tunnista yksinään esiintyviä tasavuosikymmeniä vuosiluvuiksi ilman kontekstista saatuja vihjeitä, vaan tulkitsee ne tavallisiksi lukusanoiksi (ks. kuvio 5). Kolme vuotta nousee FiNER:in frekvenssilistauksessa huippuina esiin: 1976, 1995 ja 2008. Näihin vuosiin voi tulkita kasautuvan useita audiovisuaalisen perinnön avainkokemusten hetkiä, joita jäljitämme aineistosta. Avainkokemukset muodostuvat historiallisessa arviossa tärkeiksi historiallisiksi tapahtumiksi, joita muistellaan kollektiivisesti ja joille annetaan keskeinen merkitys menneisyyttä määrittävinä. [47]

Kuvio 4. Elävän arkiston metadatan medioiden ensijulkaisupäivien vuodet. Kesästä 2015 Elävän arkiston kokonaiset ohjelmat on julkaistu uudella prosessilla Areena-alustalle, joten ne eivät enää näy metadatassa, mikä näkyy rajuna laskuna. [48]
Kuvio 5. Vuosilukujen 1917–2017 esiintymisfrekvenssit FiNER:in tunnistamissa ajanilmauksissa. Huippuvuodet 1976, 1995 ja 2008 on ympyröity.

Vuoden 1976 mediaklipeissä avainkokemuksina nousevat esiin kestävyysjuoksija Lasse Virénin voitot 5 000 ja 10 000 metrin juoksussa Montrealin olympialaisissa sekä etenkin draamasarja Myrskyluodon Maija (TV1, YLE 1976). Myrskyluodon Maija on kirjailija Anni Blomqvistin kirjoittamasta viisiosaisesta Myrskyluoto-romaanisarjasta dramatisoitu kuusiosainen suomalainen televisiosarja 1800-luvun saaristolaiselämästä. Yleisradion tuottaman sarjan ohjasi Åke Lindman, dramatisoi Benedict Zilliacus, ja musiikin sävelsi Lasse Mårtenson, joka myös nousi esiin korkealla FiNER:in henkilölistauksessa. Myrskyluodon Maijaa luonnehditaan unohtumattomaksi etenkin sen musiikin ansiosta, kuten Elävän arkiston kooste havainnollistaa: Koosteeseen on kerätty “15 versiota rakastetusta nimisävellyksestä, eri esittäjiltä, eri ohjelmista”, muun muassa Maria Ylipään ja Waltteri Torikan kaksikielinen duo-esitys vuoden 2013 itsenäisyyspäivän juhlavastaanotolta ja Yleisradion 90-vuotisjuhlasta oopperalaulaja Karita Mattilan, metalliyhtye Apocalyptican sekä Radion Sinfoniaorkesterin esittämänä syksyltä 2016.[49] Lukuisten mediaversioiden ohella tunnussävelmän pianosovitus on kaikkien aikojen myydyin suomalainen nuottijulkaisu.[50] Haikea tunnussävel on onnistunut tulkitsemaan suomalaista mielenmaisemaa monia koskettavalla tavalla, jolloin se on rakentunut audiovisuaaliseksi perinnöksi yhä uusina tulkintoina.

Vuoden 1995 avainkokemukseksi nousee ennen kaikkea Euroopan Unioniin liittyminen. Yhteiskunnallista aihetta on käsitelty audiovisuaalisesti erilaisissa uutis- ja ajankohtaisohjelmissa sekä sketseissä, joista Elävä arkisto on koostanut taustajuttuja teemaan liittyen. Lisäksi urheilun huippuhetket, etenkin jääkiekon MM-kullan voittaminen, nousevat esiin. Jääkiekko nähdään kansallislajina Suomessa ja pitkään odotettua voittoa vuoden 1995 maailmanmestaruuskisoissa kuvattiin kansallisen itsetunnon kohottajana.[51] Jääkiekko on medianäkyvyydeltään Suomen suurin urheilulaji, joka liittyy vuodenkiertoon temmaten keväisin suuren joukon katsojia seuraamaan kisoja ja myös Elävän Areenan muistelemaan toistuvasti voitokkaita vuoden 1995 MM-kisoja. Kulttuurihistorioitsija Hannu Salmi kytkee kiekkohuuman synnyn mediakulttuuriseen muutokseen, jossa jääkiekko sai säännöllisesti näkyvyyttä mediassa ja maailmanmestaruuskilpailujen televisioinneista käytiin kamppailua Yleisradion ja kaupallisten kanavien välillä jääkiekkomaajoukkueen saavuttaessa arvokisamenestystä 1980-luvun lopulta alkaen ja lajin yleisösuosion kasvaessa. Vuoden 1995 voitokasta loppuottelua seurasi jo 46 % suomalaisista ja Ylen televisioimat mestaruusjuhlat kokosivat kansanjoukot Helsingin kauppatorille.[52]

Vuoden 2008 avainkokemuksina media-aineistossa puolestaan ovat paljon mediassa seuratut vaalit kyseisenä vuonna: kotimaassa kunnallisvaalit, joissa Perussuomalaiset menestyivät äänimääränsä moninkertaistaen, ja ulkomailla Barack Obaman voitto Yhdysvaltojen presidentinvaaleissa. Eniten mediaklippejä on kuitenkin kertynyt Kauhajoen kouluampumisen käsittelyyn. Jokelan kouluampumisen jälkeen Kauhajokea ei voitu käsitellä yksittäistapauksena, vaan tapahtumaa pyrittiin selittämään ensitunneista alkaen muun muassa aselakeihin liittyvillä kysymyksillä.[53] Myös Elävä arkisto käsitteli kouluampumisia tuoreeltaan. Nämä yhteiskunnalliset tapahtumat rakentuvat kansallisiksi audiovisuaalisiksi avainkokemuksiksi Elävässä arkistossa rinnakkain saman vuoden aineistosta yhtä lailla erottuvan Provinssirockin 30-vuotisjuhlavuoden YleX Stagen konserttitaltiointien kanssa.

Audiovisuaaliset avainkokemukset liittyvät Suomen tai maailman historian yhteiskunnallisesti puhuttaneisiin tapahtumiin, mutta näiden lisäksi aineistossa näkyvät erityisesti audiovisuaaliset tapahtumat. Audiovisuaalisissa tapahtumissa painottuu Yleisradion rooli – Myrskyluodon Maija, Euroviisut, urheilukilpailut ja Provinssirockin YleX Stagen taltioinnit ovat osa Yleisradion itse tuottamaa ja taltioimaa kansallista audiovisuaalista perintöä, jota Elävässä arkistossa runsaasti esitellään. Kansallinen audiovisuaalinen historia on vain Yleisradion historiaa, koska arkisto-aineisto esittelee Yleisradion materiaaleja. Yle omistaakin suuren osan suomalaisesta audiovisuaalisesta perinnöstä; kaupallisilla toimijoilla ei ole vastaavia arkistoja eikä niiden ohjelmia ole juuri tallessa alkuvuosikymmeniltä. Television alkuvuosien niukkuuden ajan televisio-ohjelmat saavuttivat suuria yleisöjä, jolloin ohjelmien kautta on mahdollista luoda ikonisia kuvia yhteisesti jaetuksi kansalliseksi julkiseksi muistiksi.[54] Kaupallinen televisio ja radio jäävät sivuun, pelkästään taustajuttujen maininnoiksi ja sketsien aiheiksi. Elävä arkisto on julkisen palvelun yhtiö Ylelle tärkeä resurssi medioiden välisessä kamppailussa legitimoimaan sen kulttuurista asemaa.

Lopuksi – tulkinnan rajat ja mahdollisuudet

Digitaaliset arkistot ovat jatkuvassa liikkeessä niiden kasvaessa ja muuttaessa muotoaan.[55] Myös Ylen Elävän arkiston strategiana on karttua jatkuvasti, mikä rakentaa audiovisuaalisesta perinnöstä syklistä. Vuosittain toistuvat tapahtumat, jotka liittyvät audiovisuaaliseen kulttuuriin, kerryttävät arkiston aineistoa vuosien saatossa. Näin Yle osaltaan rakentaa kansallista audiovisuaalista vuosisykliä merkittävien hetkien muistelulle. Toinen Ylen strategia, ajankohtaisiin aiheisiin tarttuminen, puolestaan sitoo mennyttä tähän hetkeen. Elävä arkisto on haluttu rakentaa osaksi arkea ja nykypäivää. Derek Kompare on tehnyt vastaavan huomion amerikkalaisesta kontekstista, kuinka elokuvista poiketen radion ja television audiovisuaalisesta perinnöstä ei ole rakennettu arjesta irrallista kaanonia, vaan osa elettyä ja koettua historiaa.[56] Molemmat Ylen strategiat ovat onnistuneet tuottamaan arkiston suosituimpia sisältöjä, kuten reagointeja ajankohtaisiin aiheisiin ja tunnettujen henkilöiden kuolinuutisiin.[57]

Pohdittaessa mitä osaa kansallisesta historiastamme Elävä arkisto valottaa, ja millä tavoin se tätä tekee, on syytä huomioida strategioiden lisäksi rajoitukset, jotka ohjaavat arkiston toimintaa. Aineistovalintoja rajoittavat merkittävällä tavalla tekijänoikeudelliset sopimukset, kaikkea Ylen arkistoista ei voida julkaista. Alkuun arkistossa julkaistiin vain Ylen omatuotantoisia journalistisia ohjelmia ja Ylen vanhoilta filmiyhtiöiltä lunastamaa materiaalia. Kaikki julkaistu musiikki on raportoitava, mutta vuodesta 2015 alkaen erillissopimuksen ansiosta on julkaistu paljon vanhoja kokonaisia musiikkiohjelmia, esimerkiksi Euroviisujen Suomen karsintoja ja Hittimittareita. Vuoden 2016 draamasopimus on mahdollistanut Ylen tuottamien draamasarjojen ja elokuvien julkaisun pitkillä julkaisuoikeuksilla. Sen lisäksi kaikkea ohjelmamateriaalia ei ole tallella, sillä aikoinaan kalliita kuvanauhoja käytettiin uusien ohjelmien kuvaamiseen.  Vasta vuodesta 1984 lähtien kaikki omatuotantoinen tv-aineisto on arkistoitu. Vanhan aineiston hyödyntämistä haittaa kuitenkin se, että vanhoihin ohjelmiin on saatettu kirjata hyvin vajavaiset metatiedot, jolloin ne eivät löydy sanahauissa.[58]

Elävässä arkistossa julkaistujen mediaklippien valinnat ja niiden esittelytavat ovat kuitenkin myös poliittisia valintoja, jotka jäävät arkiston käyttäjiltä näkymättömiin.[59] Kuten Pajala huomauttaa, arkistolla on rajalliset mahdollisuudet julkaista mitään sellaista, mitä julkisen palvelun televisio ei ole näyttänyt. Tämän seurauksena menneen lainsäädäntö ja kulttuuriset normit rajoittavat edelleen tämän päivän keskustelua aiheista audiovisuaalisessa arkistossa.[60]

Aineistovalintojen rajausten lisäksi analyysissa on huomioitava FiNER:in rajat digitaalisena työkaluna. Ne ovat samankaltaiset kuin muillakin sääntöpohjaisilla NER-järjestelmillä: puutteet säännöissä ja nimilistoissa johtavat nimien virheelliseen luokitteluun, ja jos mikään sääntö tai nimilista ei päde tiettyyn nimeen, se jää kokonaan tunnistamatta. Erityisesti organisaatioiden ja tapahtumien nimet ovat sellaisia, joita ilman kontekstiin tai nimen rakenteeseen liittyviä vihjeitä voi olla vaikeaa tai mahdotonta tunnistaa. Näin käy etenkin lyhyissä teksteissä, kuten metadatassa olevissa kuvauksissa, joiden kirjoittaja olettaa lukijan tunnistavan ennalta nimen ja sen referentin. Nimilistoihin turvautuessaan FiNER myös tekee samanlaisia ratkaisuja kuin listojen laatija, jolloin tuloksissa toistuvat nimilistojen koostajan unohdukset ja päähänpistot.

Sekä metadata-aineisto että FiNER pohjautuvat tietojen luokittelulle. Analyysissa onkin siksi tärkeää pohtia tällaisen tiedon ontologiaa. Digitaalisen historian tutkija Michael J. Kramer pohdiskelee historioitsijoiden ja digitaalisten arkistojen suhdetta ja kuvailee historiaa ikään kuin meta-metatiedon lisäämiseksi.[61] Tämä viittaa tulkintakehysten monikerroksisuuteen. Metadata aineistona on luonteeltaan tulkintaa tiedosta, joka tulkitaan tietokoneavusteisesti, tietokoneeseen ohjelmoidun tiedon mukaisesti. Elävän arkiston mediaklippien metadataa FiNER:illä tulkitessamme saamme tulokseksi nimien esiintymistiheyksiä. Nämä esiintymistiheydet eivät ole suorassa yhteydessä media-aineistoon, vaan metadatan tuottamisessa ja FiNER:in analyysissä on rakentunut mutkia, jotka on huomioitava tulkinnassa. Näistä mutkista selviämiseen tarvittaisiin myös yhteistyötä arkistoijien ja historioitsijoiden välillä, jotta metadatan kirjoittamisen ohjeet ja tavat tulevat julki. Hedelmällisintä olisi yhteistyö, jossa molemmat tahot jo yhdessä neuvottelisivat, miten metadata palvelisi molempia osapuolia parhaalla tavalla. Historioitsijan on oltava selvillä myös digitaalisen työkalun toimintalogiikasta, jotta hän ei tule vetäneeksi mutkia suoriksi.

Digitaalinen aineisto, kuten käyttämämme Ylen metadata, on usein sotkuista ja vaatii paljon valikointia ja ennakkokäsittelyä. Lisäksi metadata-aineistolla on kuvaamiamme rajoituksia, samoin kuin digitaalisilla työkaluilla.[62] Näitä rajoituksia paikkaa kuitenkin aineiston laajuus ja mahdollisuus analysoida suurta tietomäärää systemaattisesti digitaalisten työkalujen avulla. Kyseessä on murros lähiluvusta kaukoluentaan, jossa muutamien valittujen tekstien analyysistä voidaan siirtyä kokonaisten kokoelmien analyysiin.[63] Kontekstoivalla tulkinnalla ja kaukoluennan osoittamien merkittävien aineistokohtien tarkemmalla lähiluvulla on kuitenkin edelleen tärkeä rooli analyysissa, jotta sanalistat heräävät elämään.

Nimentunnistuksen avulla saimme selville kiinnostavia painotuksia etenkin henkilöistä, tapahtumista ja vuosista Elävän arkiston rakentamassa audiovisuaalisessa perinnössä, mutta FiNER:illä emme päässeet käsiksi arkiston teemoihin tai puhetapoihin. Analyysiprosessissa hahmottui kuitenkin perinnön rajoja, miksi perintö rakentuu tietyllä tavalla. Elävä arkisto toisaalta reflektoi perinteistä Suomen historian narratiivia, johon kuuluu kertoa keskeisistä poliittisista ja yhteiskunnallista tapahtumista ja henkilöstä, kuten presidenteistä, poliittisista vaaleista, sodista ja kriiseistä. Toisaalta arkistossa rakennetaan kansallista perintöä erityisesti audiovisuaalisista lähtökohdista. Tällöin populaarikulttuuri ja radion ja television välittämät tapahtumat tulevat keskeiseksi osaksi kansallista audiovisuaalista perintöä ja sen narratiivia. Yhteistä molemmille historianarratiiveille on kansallisen yhtenäisyyden korostus, muistelu kohdentuu suurmiehiin ja audiovisuaalisesti yhdistäviin tapahtumiin suurista urheilutapahtumista Euroviisuihin ja Linnan juhliin. Suuren kansallisen yleisön tavoittaminen onkin ollut juuri radion ja television vahvuuksia mediumeina, ja audiovisuaalista perintöä on rakennettu samalle kansallisen yhtenäisyyden ajatukselle.

Maiju Kannisto on kulttuurihistorioitsija, joka työskentelee tutkijatohtorina Turun yliopiston Pohjois-Amerikan tutkimuksen John Morton -keskuksessa. Hänen tutkimusalueisiinsa kuuluvat mm. mediahistorian ja -teollisuuden tutkimus, journalismin etiikka ja digitaaliset menetelmät.

Pekka Kauppinen on tutkinut sääntöpohjaista nimentunnistusta (NER) osana FIN-CLARIN-projektia Helsingin yliopiston Digitaalisten ihmistieteiden osastolla.

Kiitokset Digital History Finland –työpajan järjestäneelle Koneen Säätiön rahoittamalle From Roadmap to Roadshow –tutkimushankkeelle. Lisäksi kiitos nimettömille refereille artikkelia kehittäneistä kommenteista sekä Jaakko Hirviojalle täydentävästä teknisestä avusta.

Lähteet

Haastattelut:

Perälä, Reijo, Ylen Elävän arkiston perustanut ohjelmapäällikkö. Sähköpostihaastattelu, Maiju Kannisto 10.6.2019. Haastattelu tekijän hallussa.

Yli-Ojanperä, Elina, vastaava tuottaja, Yle Elävä arkisto. Sähköpostihaastattelu. Maiju Kannisto 23.5.2018 ja 20.6.2019. Haastattelu tekijän hallussa.

Kirjallisuus:

Ahonen, Sirkka. Suomalaisuuden monet myytit. Kansallinen katse historian kirjoissa. Gaudeamus, Helsinki 2017.

Anderson, Benedict. Kuvitellut yhteisöt. Nationalismin alkuperän ja leviämisen tarkastelua. Vastapaino, Tampere 2007/1983.

Assmann, Aleida. Canon and Archive. Teoksessa Astrid Erll & Ansgar Nünning (toim.) Cultural Memory Studies. An International and Interdisciplinary Handbook. Walter de Gruyter, Berlin & New York 2008, 97–107.

Benton, Tim. Introduction. Teoksessa Tim Benton (toim.) Understanding Heritage and Memory. Manchester University Press, Manchester 2010, 1–5.

Elo, Kimmo. Satavuotias Suomi katsoi peiliin ja menneisyyteensä. Ennen ja nyt, 2 (2018). DOI: http://www.ennenjanyt.net/2018/09/satavuotias-suomi-katsoi-peiliin-ja-menneisyyteensa/

Elo, Kimmo & Kleemola, Olli. SA-kuva-arkistoa louhimassa. Digitaaliset tutkimusmenetelmät valokuvatutkimuksen tukena. Teoksessa Kimmo Elo (toim.) Digitaalinen humanismi ja historiatieteet. Historia mirabilis 12. Turun Historiallinen Yhdistys, Turku 2016, 151–190.

Halldórsdóttir, Erla Hulda, Kinnunen, Tiina & Leskelä-Kärki, Maarit. Doing biography. Teoksessa Erla Hulda Halldórsdóttir, Tiina Kinnunen, Maarit Leskelä-Kärki & Birgitte Possing (toim.) Biography, Gender and History: Nordic Perspectives. K&h, kulttuurihistoria, Turun yliopisto, Turku 2016, 7–34.

Helsingius, Barbara. Mårtenson, Lasse. Kääntänyt Markus Lång. Kansallisbiografia-verkkojulkaisu. Studia Biographica 4. Suomalaisen Kirjallisuuden Seura, Helsinki 2010, https://kansallisbiografia.fi/kansallisbiografia/henkilo/1095 (15.8.2018).

Husevåg, Anne-Stine Ruud. Named Entities in Indexing: A Case Study of TV Subtitles and Metadata Records. NKOS@TPDL, 2016.

Jarlbrink, Johan & Snickars, Pelle. Cultural heritage as digital noise: nineteenth century newspapers in the digital archive. Journal of Documentation 73:6 (2017), 1228–1243. DOI: https://doi.org/10.1108/JD-09-2016-0106.

Kallioniemi, Kari, Kärki, Kimi & Mähkä, Rami. Kekkonen ja rock’n’roll. Teoksessa Marjo Kaartinen, Hannu Salmi & Marja Tuominen (toim.) Maamme – itsenäisen Suomen kulttuurihistoria. Suomalaisen Kirjallisuuden Seura, Helsinki 2016, 395–414.

Kannisto, Maiju. Sankarit kultajuhlissa. Teoksessa Benita Heiskanen & Hannu Salmi (toim.) Kiekkokansa. Teos, Helsinki 2015, 72–101.

Kannisto, Maiju. Uusi, ehompi, paras? Digitaaliset tekstilouhinnan työkalut televisiotutkimuksessa. Lähikuva 29:1 (2016), 62–70. DOI: https://journal.fi/lahikuva/article/view/56578.

Karttunen, Lauri. Beyond morphology: Pattern matching with FST. Cerstin Mahlow & Michael Piotrowski (toim.) Systems and Frameworks for Computational Morphology, volume 100 of Communications in Computer and Information Science. Springer, Berlin & Heidelberg 2011, 1–13.

Keskinen, Lauri. Urheilukansan synty. Teoksessa Marjo Kaartinen, Hannu Salmi & Marja Tuominen (toim.) Maamme – itsenäisen Suomen kulttuurihistoria. Suomalaisen Kirjallisuuden Seura, Helsinki 2016, 123–146.

Kettunen, Kimmo, Mäkelä, Eetu, Ruokolainen, Teemu, Kuokkala, Juha & Löfberg, Laura. Old Content and Modern Tools: Searching Named Entities in a Finnish OCRed Historical Newspaper Collection 1771–1910. Digital Humanities Quarterly 11:3 (2017). DOI: http://www.digitalhumanities.org/dhq/vol/11/3/000333/000333.html.

Kokkinakis, Dimitrios, Niemi, Jyrki, Hardwick, Sam, Lindén, Krister & Borin, Lars. HFST-SweNER – A New NER Resource for Swedish. Teoksessa Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Asuncion Moreno, Jan Odijk & Stelios Piperidis (toim.) Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14). European Language Resources Association (ELRA). Reykjavik, Iceland 2014.

Kompare, Derek. Rerun Nation: How Repeats Invented American Television. Routledge, New York & Oxon 2005.

Kramer, Michael J. Going Meta on Metadata. Journal of Digital Humanities, 3:2 (2014). DOI: http://journalofdigitalhumanities.org/3-2/going-meta-on-metadata/.

Kunnas-Pusa, Liisa. Kivikauden kuvia – Kaukaisimman menneisyyden representaatiot Suomi-kuvaa rakentamassa. Ennen ja nyt, 3 (2018). DOI: http://www.ennenjanyt.net/2018/10/kivikauden-kuvia-kaukaisimman-menneisyyden-representaatiot-suomi-kuvaa-rakentamassa/.

Kurvinen, Heidi. ”En mä oo mies enkä nainen. Mä oon toimittaja”. Sukupuoli ja suomalainen toimittajakunta 1960- ja 1970-luvulla. Acta Universitatis Ouluensis B Humaniora 113. Oulun yliopisto, Oulu 2013.

Long, Paul & Collins, Jez. Affective Memories of Music in Online Heritage Practice. Teoksessa Johannes Brusila, Bruce Johnson & John Richardson (toim.) Memory, Space, Sound. Intellect, Bristol & Chicago 2016, 85–101.

Lounasmeri, Lotta & Sumiala, Johanna. Promootiokulttuurin kuningas Kekkonen. Lähikuva 29:2 (2016), 3–5. DOI: https://journal.fi/lahikuva/issue/view/3995.

Marrero, Mónica, Urbano, Julián, Sánchez-Cuadrado, Sonia, Morato, Jorge & Gómez-Berbís,Juan Miguel. Named Entity Recognition: Fallacies, challenges and opportunities. Computer Standards & Interfaces 35:5 (2013), 482-489. https://doi.org/10.1016/j.csi.2012.09.004.

Pajala, Mari. Erot järjestykseen! Eurovision laulukilpailu, kansallisuus ja televisiohistoria. Nykykulttuurin tutkimuskeskuksen tutkimuksia 88. Jyväskylän yliopisto, Jyväskylä 2006.

Pajala, Mari. Cultural Memory and its Limits on the Finnish Public Service Broadcaster’s Online Archive. Critical Studies in Television 5:2 (2010), 133–145.

Pajala, Mari. Televisio kulttuurisen muistin mediana. Miten itsenäisyyspäivä alkoi merkitä sotamuistelua? Teoksessa Erkka Railo & Paavo Oinonen (toim.) Media historiassa. Historia mirabilis 9. Turun historiallinen yhdistys ry, Turku 2012, 127–150.

Perälä, Reijo. Kymmenen vuotta täyttävä Yle Elävä arkisto on nettipalvelujen pioneeri. Elävän arkiston blogi (07.09.2016/20.03.2019), https://yle.fi/aihe/artikkeli/2016/09/07/kymmenen-vuotta-tayttava-yle-elava-arkisto-nettipalvelujen-pioneeri (10.6.2019).

Puro, Jukka-Pekka. Puhumalla hallitseminen. Vahvan johtajuuden ilmentyminen Kekkosen radiopuheissa vuosina 1937–1967. Lähikuva 29:2 (2016), 22–42. DOI: https://journal.fi/lahikuva/issue/view/3995.

Raittila, Pentti, Haara, Paula, Kangasluoma, Laura, Koljonen, Kari, Kumpu, Ville & Väliverronen, Jari. Kauhajoen koulusurmat mediassa. Journalismin tutkimusyksikkö, Tampereen yliopisto, Tampere 2009. DOI: http://tampub.uta.fi/bitstream/handle/10024/65360/978-951-44-7654-9.pdf.

Roberts, Les & Cohen, Sara. Unauthorising popular music heritage: outline of a critical framework. International Journal of Heritage Studies vol. 20:3 (2013), 241–261.

Salmi, Hannu. Kiekkokansa ryhmäkuvassa. Teoksessa Benita Heiskanen & Hannu Salmi (toim.) Kiekkokansa. Teos, Helsinki 2015, 13–46.

Schöch, Christof. “Big? Smart? Clean? Messy? Data in the Humanities”. Journal of Digital Humanities 2:3 (2013). DOI: http://journalofdigitalhumanities.org/2-3/big-smart-clean-messy-data-in-the-humanities/

Sumiala-Seppänen, Johanna. ”Joku raja ja loppu se on saatava tällaisille keskusteluille!” Jatkoaika ja kansallisten kertomusten konflikti 60-luvun suomalaisessa televisiossa. Teoksessa Juhani Wiio (toim.) Television viisi vuosikymmentä. Suomalainen televisio ja sen ohjelmat 1950-luvulta digiaikaan. Suomalaisen Kirjallisuuden Seura, Helsinki 2007, 280–291.

Tepora, Tuomas. Mikä tekee ”sota-ajasta” muistettavan? Sota ja kollektiivinen muistaminen. Ennen ja nyt 2 (2015a), DOI: http://www.ennenjanyt.net/2015/08/mika-tekee-sota-ajasta-muistettavan-sota-ja-kollektiivinen-muistaminen/

Tepora, Tuomas. Sota, Tuntematon Ja Mannerheim. Futura 34:3 (2015b): 5-11.

Torsti, Pilvi. Suomalaiset ja historia. Gaudeamus, Helsinki 2012.

van Hooland, Seth & De Wilde, Max & Verborgh, Ruben & Steiner, Thomas & Van de Walle, Rik. Exploring Entity Recognition and Disambiguation for Cultural Heritage Collections. Literary and Linguistic Computing Vol. 30:2 (2015), 262–279, https://doi.org/10.1093/llc/fqt067.

Yle Elävä arkisto, Iskelmä-Suomen tarina on salattujen tunteiden historiaa, https://yle.fi/aihe/kategoria/elava-arkisto/iskelma-suomen-tarina-salattujen-tunteiden-historiaa (10.6.2019).

Yle Elävä arkisto 2015. Myrskyluodon Maija monella tavalla, https://yle.fi/aihe/artikkeli/2015/07/30/myrskyluodon-maija-monella-tavalla (10.8.2018).

Yli-Ojanperä, Elina. Yle Elävä arkisto. Avoin digitaalinen kulttuuriperintö -kurssi, esittelydiat. Yle 2018.

Tietojärjestelmät:

FiNER: http://urn.fi/urn:nbn:fi:lb-2018091301

Tools for processing FiNER output: https://github.com/pkauppin/finer-utilities

Ylen Elävän arkiston metadata:

media.csv http://elavaarkisto.kokeile.yle.fi/data/#media.csv (30.5.2018)


[1] Tv-uutiset 8.9.2006, Yle TV1.

[2] Anderson 2007 (1983).

[3] Kompare 2005, 102–103.

[4] Yli-Ojanperä 2018.

[5] Pajala 2010, 134.

[6] Elo 2018; Kunnas-Pusa 2018.

[7] Vrt. Assmann 2008, 103.

[8] Assmann 2008, 100.

[9] Vrt. Elo & Kleemola 2016, 157, 160.

[10] Husevåg 2016, 8.

[11] Yle on julkaissut aineiston 3.1.2018 CSV-tiedostona, joka on kooltaan 18 megatavua ja sisältää 34 816 entiteettiä.

[12] Elina Yli-Ojanperän haastattelu 23.5.2018.

[13] FiNER – Finnish Named-Entity Recognizer. FiNER on kehitetty Helsingin yliopistossa osana FIN-CLARIN-hanketta. Artikkelissa on käytössä kahden julkaisun välissä oleva työversio, joka on kuitenkin lähellä vuoden 2018 lopussa julkaistua versiota, ks. URN: http://urn.fi/urn:nbn:fi:lb-2018091301.

[14] Kokkinakis et al. 2014.

[15] Ks. kuitenkin Kettunen et al. 2017.

[16] Karttunen, 2011.

[17] FiNER:In kehittämisessä on koottu listoja useista lähteistä, mm. Wikipediasta ja käsin annotoiduista aineistoista. Kaikkia käytettyjä listoja ei ole dokumentoitu.

[18] Marrero et al. 2013, 484.

[19] Ks. skriptit perusmuotoistukseen https://github.com/pkauppin/finer-utilities.

[20] Elo & Kleemola 2016, 154.

[21] Reijo Perälän haastattelu 10.6.2019.

[22] van Hooland et al. 2015, 13.

[23] Erikseen listautuvat vielä Vieno Kekkonen ja Sylvi Kekkonen.

[24] Puro 2016, 23–24.

[25] Lounasmeri & Sumiala 2016, 3–4.

[26] Kekkos-kultista ja Kekkosen vaikutuksesta populaarikulttuuriin ks. Kallioniemi, Kärki & Mähkä 2016.

[27] Tepora 2015b.

[28] Tepora 2015b, 8-11.

[29] Pajala 2012, Tepora 2015ab.

[30] Reijo Perälän haastattelu 10.6.2019.

[31] Elina Yli-Ojanperän haastattelu 20.6.2019.

[32] Halldórsdóttir, Kinnunen & Leskelä-Kärki 2016, 19.

[33] Kurvinen 2013, 68.

[34] Yle Elävä arkisto, Iskelmä-Suomen tarina on salattujen tunteiden historiaa.

[35] Virallisesti vahvistetusta populaarimusiikin perinnöstä ks. Roberts & Cohen 2013, 244.

[36] Long & Collins 2016, 93.

[37] Reijo Perälän haastattelu 10.6.2019.

[38] Pajala 2006, 351–368.

[39] Keskinen 2016.

[40] Reijo Perälän haastattelu 10.6.2019.

[41] Ahonen 2017, 10–11, 92–95; Torsti 2012, 135–155.

[42] Tepora 2015a.

[43] Kulttuurisesta muistista prosessina ks. Pajala 2012, 135.

[44] Pajala 2006, 24; Pajala 2012.

[45] Ks. URN: http://urn.fi/urn:nbn:fi:lb-2018091301.

[46] Elina Yli-Ojanperän haastattelu 20.6.2019.

[47] Vrt. Elo 2018; Sumiala-Seppänen 2007, 283; Torsti 2012, 63–73. Kollektiivisesta muistista ks. Benton 2010, 1, 5.

[48] Elina Yli-Ojanperän haastattelu 20.6.2019.

[49] Yle Elävä arkisto 2015, Myrskyluodon Maija monella tavalla.

[50] Helsingius 2010.

[51] Kannisto 2015, 95–96.

[52] Salmi 2015, 13, 32–46.

[53] Raittila et al. 2009, 112.

[54] Pajala 2010, 135.

[55] Ks. myös Jarlbrink & Snickars 2017, 1240.

[56] Kompare 2005, 102–104.

[57] Yli-Ojanperä 2018.

[58] Yli-Ojanperä 2018.

[59] Ks. myös Jarlbrink & Snickars 2017, 1229.

[60] Pajala 2010, 140.

[61] Kramer 2014.

[62] Ks. myös Kannisto 2016.

[63] Schöch 2013.