Kansalliskirjaston historialliset sanoma- ja aikakauslehdet avoimena digitaalisena datana: datapaketteja, rajapintoja, käyttäjiä ja tutkimusongelmia

Avainsanat: historialliset sanomalehdet, digitoidut tekstiaineistot, avoin tiede

Abstrakti

Tässä artikkelissa luodaan katsaus Kansalliskirjaston digitoitujen lehtiaineistojen avoimen datan tutkimuskäyttöön. Lehtiaineistoista julkaistiin vuonna 2017 vuodet 1771–1910 kattava datapaketti, ja sen tutkimuskäytöstä on kertynyt tähän mennessä hiukan yli vuoden kokemus. Sivuamme katsauksessa myös aineiston verkkokäyttöä tutkimuksessa. Esittelemme lisäksi myös ohjelmistorajapintoja, joiden kautta aineistoihin pääsee käsiksi.

Lähdeviitteet

Anderson, S. (2013). What are research infrastructures? International Journal of Humanities and Arts Computing, 7(1-2), 4–23. https://doi.org/10.3366/ijhac.2013.0078
Beals, M. H., Russell, I. G., Nyhan, J., Priani, E., Priewe, M., Salmi, H., ... Hauswedell, T. (2017). Oceanic exchanges: tracing global information networks in historical newspaper repositories, 1840–1914. https://doi.org/10.17605/OSF.IO/WA94S
Cordell, R. (2017). ”Q I-JTB THE RAVEN”. Taking dirty OCR seriously. Book History, 20(1), 188–225. https://doi.org/http://doi.org/10.1353/bh.2017.0006
Dunning, A. (2012). European Newspaper Survey Report. http://www.europeana-newspapers.eu/wp-content/uploads/2012/04/D4.1-Europeana-newspapers-survey-report.pdf
Ginter, F., Kanner, A., Lahti, L., Marjanen, J., Mäkelä, E., Nivala, A., ... Vesanto, A. (2018). Metadata analysis and text reuse detection: reassessing public discourse in Finland through newspapers and journals 1771–1917. Teoksessa DHN2018. https://www.helsinki.fi/sites/default/files/atoms/files/dhn2018-book-of-abstracts.pdf
Gooding, P. (2017). Historic Newspapers in the Digital Age. ”Search All About It!”. Routledge.
Hitchcock, T. (2013). Confronting the Digital. Cultural and Social History, 10(1), 9–23. https://doi.org/10.2752/147800413X13515292098070
Hölttä, T. (2016). Digitoitujen kulttuuriperintöaineistojen tutkimuskäyttö ja tutkijat (tohtorinväitöskirja). http://urn.fi/URN:NBN:fi:uta-201603171337
Hungenaert, J., & Gillet, F. (2017). Studying user’s digital practices and needs in Archives and Libraries. Final Report of the MADDLAIN project. http://www.cegesoma.be/docs/images/stories/ceges/Recherche/MADDLAIN_grand_public_ENG_48p_.pdf
Jarlbrink, J., & Snickars, P. (2017). Cultural heritage as digital noise: nineteenth century newspapers in the digital archive. Journal of Documentation, 73(6), 1228–1243. https://doi.org/10.1108/JD-09-2016-0106
Koistinen, M., Kettunen, K., & Pääkkönen, T. (2017). Improving optical character recognition of Finnish historical newspapers with a combination of Fraktur & Antiqua Models and image preprocessing. Teoksessa Proceedings of the 21st Nordic Conference on Computational Linguistics, NoDaLiDa, 22-24 May 2017, Gothenburg, Sweden (ss. 277–283). Linköping University Electronic Press, Linköpings universitet / National Library of Finland, The Centre for Preservation and Digitisation, Finland.
Kokko, H. (2016). Kuviteltu minuus: ihmiskäsityksen murros suomenkielisen kansanosan kulttuurissa 1800-luvun puolivälissä (tohtorinväitöskirja). Tampereen yliopisto. http://urn.fi/URN:ISBN:978-952-03-0282-5
Kumpulainen, S., & Keskustalo, H. (2017). Supporting evolving search tasks in digital environments via fuzzy string matching. Teoksessa Heldig Summit. http://static.seco.cs.aalto.fi/events/2017/heldig-summit/abstracts/kumpulainen-keskustalo.pdf
La Mela, M. (2016).The politics of property in a European periphery : the ownership of books, berries, and patents in the Grand Duchy of Finland 1850-1910 (Thesis). European University Institute, Florence, Italy. https://doi.org/10.2870/604750
La Mela, M. (2018). Digitised newspapers and the geography of the nineteenth-century ”lingonberry rush” in Finland. Teoksessa DHN2018. https://www.helsinki.fi/sites/default/files/atoms/files/dhn2018-book-of-abstracts.pdf
Pääkkönen, T., & Kervinen, J. (2016). Historiallisten digitoitujen sanoma- ja aikakauslehtien avaaminen avoimena datana tutkijoille. Informaatiotutkimus, 35(3), 67–68. https://journal.fi/inf/article/view/59442
Pääkkönen, T., Kervinen, J., Nivala, A., Kettunen, K., & Mäkelä, E. (2016). Exporting Finnish Digitized Historical Newspaper Contents for Offline Use. D-Lib Magazine, 22(7/8). https://doi.org/10.1045/july2016-paakkonen
Pääkkönen, T., Rautiainen, J., Ryynänen, T., & Uusitalo, E. (2018). Open, extended, closed or hidden data of cultural heritage. Teoksessa Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference. Helsinki. http://ceur-ws.org/Vol-2084/
Pekonen, O. (2014). Debating ”the ABCs of parliamentary life” : the learning of parliamentary rules and practices in the late nineteenth-century Finnish Diet and the early Eduskunta (tohtorinväitöskirja). University of Jyväskylä. http://urn.fi/URN:ISBN:978-951-39-5843-5
Pletschacher, S., Clausner, C., & Antonacopoulos, A. (2015). Europeana Newspapers OCR Workflow Evaluation. Teoksessa Proceedings of the 3rd International Workshop on Historical Document Imaging and Processing (ss. 39–46). New York, NY, USA: ACM. https://doi.org/10.1145/2809544.2809554
Ruokolainen, T., & Kettunen, K. (2018). À la recherche du nom perdu – searching for named entities with Stanford NER in a Finnish historical newspaper and journal collection. Teoksessa DAS2018, 13th IAPR International Workshop on Document Analysis Systems. Short papers booklet. https://das2018.cvl.tuwien.ac.at/media/filer_public/85/fd/85fd4698-040f-45f4-8fcc-56d66533b82d/das2018_short_papers.pdf
Salmi, J. (ei pvm.). Study on Open Science: Impact, Implications and Policy Options (Vol. 2015). European Commission Directorate-General for Research and Innovation Directorate RTD. https://ec.europa.eu/research/innovation-union/pdf/expert-groups/rise/study_on_open_science-impact_implications_and_policy_options-salmi_072015.pdf
Sinn, D., & Soares, N. (2014). Historians’ use of digital archival collections: The web, historical scholarship, and archival research. Journal of the Association for Information Science and Technology, 65(9), 1794–1809. https://doi.org/10.1002/asi.23091
Stroeker, N., & Vogels, R. (2012). Survey report on digitisation in European cultural heritage institutions 2012. ENUMERATE Thematic Network. https://www.egmus.eu/fileadmin/ENUMERATE/documents/ENUMERATE-Digitisation-Survey-2012.pdf
Terras, M. (2015). Opening Access to collections: the making and using of open digitised cultural content. Online Information Review, 39(5), 733–752. https://doi.org/10.1108/OIR-06-2015-0193
Tolonen, M., & Lahti, L. (2015). Aatehistoria ja digitaalisten aineistojen mahdollisuudet. Ennen ja nyt: historian tietosanomat. http://www.ennenjanyt.net/2015/08/aatehistoria-ja-digitaalisten-aineistojen-mahdollisuudet/
Tolonen, M., Marjanen, J., Roivainen, H., & Lahti, L. (2017). Patterns of public discourse in Finland: combining meta-data from library catalogues and the Finnish historical newspaper library. Teoksessa DHN 2017 Digital humaniora i Norden/Digital Humanities in the Nordic Countries. http://dhn2017.eu/wp-content/uploads/2017/03/DHN2017_Book_of_Abstracts_20170313.pdf
Traub, M. C., Ossenbruggen, J. van, & Hardman, L. (2015). Impact analysis of OCR quality on research tasks in digital archives. Teoksessa S. Kapidakis, C. Mazurek, & M. Werla (toim.), Research and Advanced Technology for Digital Libraries (Vsk. 9316, ss. 252–263). Springer International Publishing. https://doi.org/10.1007/978-3-319-24592-8_19
Tuori, H.-K. (2016). Tehtävät ja strategia. Kansalliskirjasto. Text. https://www.kansalliskirjasto.fi/fi/tehtavat-ja-strategia
Turunen, R. (2018). Sculpting time: temporality in the language of Finnish socialism, 1895–1917. Teoksessa DHN2018. https://www.helsinki.fi/sites/default/files/atoms/files/dhn2018-book-of- abstracts.pdf
Vesanto, A., Nivala, A., Rantala, H., Salakoski, T., Salmi, H., & Ginter, F. (2017). Applying BLAST to text reuse detection in Finnish newspapers and journals, 1771(–1910. Teoksessa Proceedings of the 21st Nordic Conference of Computational Linguistics. Gothenburg, Sweden, 23-24 May 2017 (ss. 54–58). Linköping. http://www.ep.liu.se/ecp/133/010/ecp17133010.pdf
Vesanto, A., Nivala, A., Salakoski, T., Salmi, H., & Ginter, F. (2017). A system for identifying and exploring text repetition in large historical document corpora. Teoksessa Proceedings of the 21st Nordic Conference of Computational Linguistics. Gothenburg, Sweden, 23-24 May 2017 (ss. 330–333). Linköping. http://www.ep.liu.se/ecp/131/049/ecp17131049.pdf
Julkaistu
2018-12-31
Viittaaminen
Kettunen, K., & Pääkkönen, T. (2018). Kansalliskirjaston historialliset sanoma- ja aikakauslehdet avoimena digitaalisena datana: datapaketteja, rajapintoja, käyttäjiä ja tutkimusongelmia. Informaatiotutkimus, 37(4). https://doi.org/10.23978/inf.77412
Osasto
Katsaukset