Pohjoismainen digitaalisten ihmistieteiden konferenssi DHN 2019 (Digital Humanities in the Nordic countries) järjestettiin tänä vuonna Kööpenhaminassa. Maaliskuun alun kokoontuminen oli järjestyksessään neljäs ja se toi yhteen 210 osallistujaa pääosin Pohjoismaista mutta myös muualta Euroopasta ja Yhdysvalloista. Digitaaliset ihmistieteet on laaja kattokäsite tai monitieteinen tila, joka kokoaa digitaalista teknologiaa ja aineistoja hyödyntävää humanistista ja yhteiskuntatieteellistä tutkimusta.[1] Konferenssi tarjoaakin mielenkiintoisia näkökulmia tutkimusaloihin, jotka eivät välttämättä muuten kohtaisi tutkijoiden kokoontumisissa.[2]DHN2019 ei tehnyt tähän poikkeusta ja toi omalla pohjoismaisella otteellaan esiin digihumanismin tuoreinta tutkimusta.[3] Näkökulmien kirjoa kuvasivat konferenssin pääpuhujien esitelmät, jotka käsittelivät digitaalisten ihmistieteiden opettamista, historiantutkimuksen lähteitä ja työkaluja sekä ihmisääntä, kuvia ja multimodaalisuutta. Esittelen tässä raportissa DHN 2019:n antia esitelmien teemojen kautta.
Ensimmäinen pääpuhuja Catherine DeRose (Yalen yliopiston kirjaston DH Lab) pohti, kuinka tulevia digitaalisten ihmistieteiden opettajia tulisi kouluttaa. DeRose esitteli Yalen DH Teaching fellows -ohjelmaa, jossa väitöstutkijoita on palkattu tutkinto-opiskelijoiden kursseille vahvistamaan digitaalisten ihmistieteiden roolia kurssityöskentelyssä. Tämä käytännönläheinen ja yhteistyötä painottava lähestymistapa vaikutti tuottaneen hyviä tuloksia, sillä digitaalinen teknologia tarjoaa työkaluja opetuksen ja tutkimuksen eri työvaiheisiin. Samanlaisia ajatuksia nosti esiin konferenssiesitelmässään myös Emily Öhman (Helsingin yliopisto), joka puhui tietojenkäsittelytieteen työkalujen opetuksesta humanistiopiskelijoille kieliteknologian alalla. Öhman toi esiin, kuinka vahvat tietotekniset taidot hyödyttävät opiskelijoita, jotka usein harmittelevat tietoteknisen osaamisensa kapeutta opintojensa loppuvaiheessa. Öhman myös kertoi, kuinka käytännön (ohjelmointi)harjoitusten painottaminen perinteisen lukumateriaaliopetuksen sijaan on parantanut oppimistuloksia kursseilla. Opetusta, verkkokursseja ja käytänteitä eri maissa esiteltiin myös konferenssia edeltävässä ”digitaalisten ihmistieteiden korkeakouluohjelmat”-työpajassa, jonka tuloksiin voi tutustua konferenssin verkkosivuilla.
Toinen pääpuhuja Maud Ehrmann (Lausannen Teknillisen korkeakoulun DH Lab) käsitteli esitelmässään historiallisten sanomalehtiaineistojen käyttöä ja sitä, kuinka pääsemme aineistojen käyttöliittymissä tavallisten avainsanahakujen tuolle puolen. Ehrmann puhui aiheesta Impresso-sanomalehtihankkeen näkökulmasta. Hän toi esiin haasteita, jotka liittyvät yleisesti digitaalisen kulttuuriperinnön hyödyntämiseen: digitoinnin maantieteellisen ja ajallisen painotuksen ongelmat (”digitaaliset siilot”), datan epätäydellisyydet (aukot, jotka on nimenomaan tärkeä kuvata metatiedoissa!) ja toisaalta aineiston sotkuisuus.[4] Varsinaisia käyttöliittymiä olisi parannettava sisältöä tulkitsevilla työkaluilla, sillä käyttäjät toivovat toimintoja, joilla haetaan henkilöitä tai paikkoja (named entities) tai etsitään samankaltaisia dokumentteja. Ehrmann toi esiin, että niin käyttöliittymien kehittäminen kuin läpinäkyvyyden lisääminen metodeja ja datan aukkoja koskien tulisi tapahtua yhteistyössä ja yhdessä suunnitellen, mitä varten Impresso-hankkeessa on kokeiltu erilaisia ryhmätyöskentelyn muotoja. Yhteistyön merkitystä käsiteltiin myös konferenssia edeltävässä ”Twin talks”-työpajassa, jonka esitelmät ovat saatavilla omana konferenssijulkaisunaan.
Historiantutkimus ja historialliset aineistot olivat konferenssissa keskeisessä roolissa. Esitelmissä tuotiin monipuolisesti esiin tutkimusprosessin eri vaiheisiin liittyviä kysymyksiä ja havainnollistettiin yhteistyön eri tapoja. Mark Hill (Helsingin yliopisto, ym.) kertoi 1700-luvun aatehistoriallisia verkostoja käsittelevässä esitelmässään COMHIS-tutkimusryhmän laajasta datatyöstä. Tämä tutkimusta edeltävä tärkeä vaihe jää usein näkymättömäksi ja onkin kuvaavaa, että ryhmälle myönnettiin parhaan konferenssiesitelmän palkinto. Useat esitelmänpitäjät puhuivat myös osallistavasta datatyöstä. Jenny Bergenmar (Göteborgin yliopisto) kertoi pienimuotoisesta yleisöhankkeesta, jossa kerättiin ja digitoitiin Selma Lagerlöfin kirjeitä, kun taas Anna Wessman (Helsingin yliopisto, ym.) esitteli laajaa (ml. Aalto-yliopisto, Museovirasto), harrastajia osallistavaa arkeologisten löytöjen tietokantahanketta SuALT:ia. Esitelmissä kuvattiin avoimen, digitaalisen tiedon ja tietokantojen haasteita, jotka liittyvät niin yleisön yksityisiin intresseihin kuin kansainvälisen yhteistyön ja tiedon yhteensopivuuden kysymyksiin. Historia-alan näkökulmasta on myös mielekästä mainita, että kokoukseen sai tarjota erilaajuisia esitelmäehdotuksia, mikä mahdollistaa eri vaiheissa olevan tutkimuksen esittelyn. Jo pelkät abstraktit vertaisarvioitiin kokousta varten, ja esitelmistä yli puolet julkaistiin konferenssijulkaisussa lyhyinä tai pitkinä artikkeleina.[5]
Koska digitaalisen datan keräämisen ja aineiston laadun kuvaaminen on tärkeää, tarkastelivat esitelmät myös digitaalisten menetelmien potentiaalia lähteiden alkuperän tunnistamisessa tai sirpaleisen aineiston rekonstruoinnissa. Kristoffer Nielbo (Etelä-Tanskan yliopisto, ym.) kertoi keskiaikaisen Gesta Danorum -tekstin digitaalisesta muotoanalyysistä. Huomattavaa on, että nimenomaan aihemallinnustyökalut suoriutuivat tästä tehtävästä hyvin. Marjo Kaartinen (Turun yliopisto, ym.) esitteli julistetilaisuudessa PROPREAU-hanketta, jossa on tutkittu klassisten ja keskiaikaisten tekstien kirjoittajien tunnistusta koneoppimiseen perustuvien menetelmien avulla. Sidsel Boldsen (Kööpenhaminan yliopisto, ym.) taas kertoi keskiaikaisten tekstien automaattisesta ajoittamisesta. Työkalun tarkkuutta verrattiin filologien käsin tekemän työn tarkkuushaarukkaan, joka on 25 vuotta suuntaan tai toiseen. Automatisoinnin tulokset saattavat joskus tuntua heikoilta, mutta keskeistä onkin juuri vertailu ihmisen tekemän tulkinnan laatuun.
Kolmas pääpuhuja Marianne Gullberg (Lundin yliopiston Humanities Lab) puhui kielen käytön moniulotteisuudesta (multimodaalisuus) ja monikielisyydestä. Gullberg kertoi, kuinka puhumisessa käytetyt ilmeet ja eleet ovat keskeisessä roolissa äidinkielessämme ja kuinka ne vaikuttavat myös vieraiden kielten puhumiseen ja oppimiseen. Mielenkiintoinen esimerkki olivat erilaiset kädenliikkeet kielissä, joissa puhutaan pelkästä asettamisesta (put/mettre) ja joissa käytetään tarkempia asentoa kuvaavia ilmauksia (ställa vs. lägga). Multimodaalisuus oli yksi konferenssin teemoista, ja se voidaan nähdä laajempana kutsuna monia lähteitä ja lähestymistapoja yhdistävään tutkimukseen: monet esitelmät hyödynsivätkin kuvia, videoita ja ääntä lähteenään. Mads Perner (Tanskan kuninkaallinen kirjasto) esitteli historiallista maatilojen maantiedettä tarkastelevaa hanketta, jossa ajatuksena oli hyödyntää myös kaupallisten lentokuvayritysten maatilojen omistajille itselleen kauppaamia ilmakuvia. Steven Coats (Oulun yliopisto) piti yhden mielenkiintoisista digitoitua ääntä hyödyntävistä esitelmistä. Coats oli muodostanut laajan puhutun englannin korpuksen poimimalla yhdysvaltalaisista paikallishallinnon ja -viranomaisten Youtube-videoista niiden automaattisesti luodut tekstitykset. Korpuksen avulla Coats tarkasteli puhutun kielen alueellisia eroja.
Vahva tieteidenvälisyys ja eri alojen tutkimuskäytänteiden kohtaaminen ovat digitaalisille ihmistieteille tyypillistä. DHN konferenssit ovat myös osaltaan synnyttäneet ja vakiinnuttaneet digitaalisten ihmistieteiden käytänteitä ja tässä prosessissa historiantutkimuksen ryhmät ovat olleet vahvasti mukana. Siinä missä vuoden 2017 DHN-konferenssiraportin otsikossa puhuttiin työkaluista historioitsijoille[6], voidaan Kööpenhaminan kokouksen näkökulmasta alleviivata historioitsijan aktiivista osallistumista digitaalisen tutkimustyön eri vaiheisiin. Kuten todettua, myös varsinaisen historiantutkimuksen haasteet ovat muuttuneet esimerkiksi tutkimusaineistojen digitoinnin myötä. Yhden vastauksen haasteisiin tarjosi julistetilaisuudessa Ranke.2-hanke (C2DH, Luxemburgin yliopisto)[7], jonka posterissa esiteltiin digitaalisen lähdekritiikin opetusta.
Suomessa toimivat tutkimusryhmät ovat olleet vahvasti mukana digitaalisten ihmistieteiden nuorella alalla.[8] Suomen Akatemian digitaalisten ihmistieteiden DIGIHUM-ohjelmassa kypsyneet hedelmät näkyivät Kööpenhaminassa. Nyt kun ohjelma on saanut jatkoa ja hakuprosessi on käynnissä, voimme odottaa mielenkiinnolla, mistä uusista avauksista kuullaan DHN2020-kokouksessa Riiassa. Konferenssi järjestetään ensimmäistä kertaa Pohjoismaiden ulkopuolella, ja järjestäjinä toimivat Latvian kansalliskirjasto ja Latvian yliopiston Kirjallisuuden, kansatieteen ja taiteen instituutti ILFA sekä koneoppimiseen ja kielentutkimukseen suuntautunut AiLab (Matematiikan ja tietojenkäsittelytieteen instituutti).
Matti La Mela työskentelee tutkijatohtorina Aalto-yliopistolla Semanttisen laskennan tutkimusryhmässä (SeCo).
Lähteet
Mäkelä, E. & Tolonen, M. DHN2018 – an Analysis of a Digital Humanities Conference. Teoksessa Mäkelä, E., Tolonen, M. & Tuominen, J. (toim.) Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference Helsinki, Finland, March 7-9, 2018. CEUR Workshop Proceedings 2084. Helsinki 2018, 1-9. http://ceur-ws.org/Vol-2084/preface.pdf
Navarretta, C., Agirrezabal, M. & Maegaard, B. The fourth Digital Humanities Conference, DHN2019. Teoksessa Navarretta, C, Agirrezabal, M. & Maegaard, B. (toim.) Proceedings of the Digital Humanities in the Nordic Countries 4th Conference, March 5-8, 2019. CEUR Workshop Proceedings 2364. Copenhagen 2019, 1-8. http://ceur-ws.org/Vol-2364/0_DHN2019_preface.pdf
Paju, P. Tarjolla digitaalisia työvälineitä humanisteille. Historiallinen Aikakauskirja 115:3 (2017), 389-390.
Robertson,
S. The Differences between Digital Humanities and Digital History. Teoksessa Matt
Gold and Lauren Klein (eds.) Debates in
the Digital Humanities 2016. University of Minnesota Press, Minneapolis
2016. http://dhdebates.gc.cuny.edu/debates/text/76
1 Esim. Robertson 2016.
2 Mäkelä & Tolonen 2018.
3 Konferenssiin lähetetyt esitelmäehdotukset tulikin sijoittaa vähintään yhteen humanistiseen alaan ja yhteen digitaaliseen teemaan. Yleisimmät humanistiset alat olivat historiantutkimus, kielitiede, kirjallisuustiede ja kirjasto- ja informaatiotieteet, kun taas yleisin digiaihe koski kulttuuriperintökokoelmia. Seuraavaksi yleisimmät digiteemat olivat digitaalisten aineistojen tuottaminen, datan/tekstin louhinta, tieteidenvälinen yhteistyö ja luonnollisen kielen käsittely (NLP). Navarretta, Agirrezabal & Maegaard 2019.
4 Alahuomautuksena lisään, että konferenssissa puhuttiin useaan otteeseen Transkribus-työkalun erinomaisesta tunnistuslaadusta, joka päihittää painetun tekstin osalta myös varsinaiset OCR-työkalut.
5 Navarretta, Agirrezabal & Maegaard 2019.
6 Paju 2017.
7 https://ranke2.uni.lu/
8 Mäkelä & Tolonen 2018.