Eduskunnan täysistunnon puheenaiheet 1999–2014

Miten käsitellä LDA-aihemalleja?

Författare

Nyckelord:

LDA, aihemalli, eduskunta, täysistuntokeskustelut, korrelaatioanalyysi

Abstract

Latent Dirichlet Allocation (LDA) on yksi käytetyimmistä laskennallisista tekoälypohjaisista metodeista, joita kutsutaan aihemalleiksi (topic models). Esitämme ja analysoimme eduskunnan täysistuntokeskusteluista laskemiamme LDA-malleja ja arvioimme, mikä aihemäärä olisi mielekäs puheiden sisällön eksploratiiviseen analyysiin. Uutena metodisena sovelluksena analysoimme LDA-aiheiden samanaikaista esiintymistä eri puheissa osuuskorrelaatiokertoimilla. Niiden avulla LDA-mallin tuottamia aiheita voidaan käsitellä samaan tapaan kuin kahdessa saman kaltaisessa metodissa, dynaamisissa aihemalleissa ja korreloituneissa aihemalleissa (correlated topic models ja dynamic topic models), kun aineistoon sisältyy tieto puheiden ajankohdasta ja voidaan olettaa, että sanasto on pysynyt pääpiirteissään muuttumattomana analysoitavalla ajanjaksolla. Lisäksi esitämme luokituksen, jonka avulla ihmisarvioijat voivat analysoida LDA:n tuottamien aiheiden laatua. Tapausesimerkkinä esitämme korrelaatioanalyysin kuntien ja valtion suhdetta käsittelevän aiheen sekä demokratia-aiheen ja budjetti-aiheen yhteyksistä. Täysistuntokeskusteluissa on havaittavissa huomattava muutos ennen ja jälkeen vuoden 2011 eduskuntavaaleja: aiemmin keskustelu käsitteli rahaa ja valtionosuuksia, kun taas Kataisen hallituksen kuntauudistushankkeen aikana debatti käsitteli demokratiaa.

Nedladdningar

Nedladdningsdata är inte tillgängliga än.
Sektion
Artiklar

Publicerad

2019-07-01

Referera så här

Makkonen, K., & Loukasmäki, P. (2019). Eduskunnan täysistunnon puheenaiheet 1999–2014: Miten käsitellä LDA-aihemalleja?. Politiikka, 61(2), 127–159. Hämtad från https://journal.fi/politiikka/article/view/77163