”Big datan” haaste ja uudet laskennalliset tekstiaineistojen analyysimenetelmät

Esimerkkitapauksena aihemallianalyysi tasavallan presidenttien uudenvuodenpuheista 1935-2015

Kirjoittajat

  • Semi Purhonen
  • Arho Toikka

Avainsanat:

aihemallit, big data, digitaaliset ihmistieteet, laskennallinen sosiologia, Suomi, tasavallan presidentin uudenvuodenpuheet, tekstiaineistot

Abstrakti

Artikkeli on keskusteluavaus, jossa pohditaan digitalisoitumisen, ”big datan” ja uusien laskennallisten analyysimenetelmien merkitystä ja antia sosiologialle. Lähtökohtana on, että vaikka usein esitetty väite big datasta rinnakkaisilmiöineen sosiaalitutkimuksen kannalta jopa vallankumouksellisena voi olla liioiteltu, big datan haaste ja mahdollisuudet tulee ottaa vakavasti. Toisaalta, vaikka yleinen keskustelu big datan kokonaismerkityksestä sosiologialle on sinänsä tärkeää, keskustelu merkityksestä on hedelmällisempää, kun ilmiökenttää arvioidaan rajatummin. Lähempään tarkasteluun on artikkelissa valittu uudet laskennalliset tekstiaineistojen analyysimenetelmät ja esimerkkinä niistä aihemallit (topic models), jotka nähdään sosiologisen tutkimuksen kannalta lupaavina uusina välineinä monenlaisten ja -kokoisten tekstiaineistojen analysoimiseksi. Artikkeli esittelee aihemallit menetelmänä ja osoittaa Suomen presidenttien uudenvuodenpuheaineistoa koskevalla aihemallisovelluksella, että menetel- mää voidaan hyödyntää melko rajattujenkin tekstiaineistojen analysoimisessa. Uudet laskennalliset tekstidatan analyysimenetelmät eivät lähtökohtaisesti korvaa vaan täydentävät perinteistä ”kvalitatii- vista” luku- ja tulkintatapaa. Big data ja uudet laskennalliset menetelmät ovat silti enenevässä määrin relevantteja myös aivan ”tavallisen” kokoisia ja kvalitatiivisiksi perinteisesti miellettyjä aineistoja analysoivien sosiologien kannalta.

Tiedostolataukset

Osasto
Artikkelit

Julkaistu

2016-01-01

Viittaaminen

Purhonen, S., & Toikka, A. (2016). ”Big datan” haaste ja uudet laskennalliset tekstiaineistojen analyysimenetelmät: Esimerkkitapauksena aihemallianalyysi tasavallan presidenttien uudenvuodenpuheista 1935-2015. Sosiologia, 53(1), 6–27. Noudettu osoitteesta https://journal.fi/sosiologia/article/view/124222