Aineistopaketit ja rajapinnat tutkijoiden työkaluna Kansalliskirjastossa: mahdollisuudet ja rajoitteet

Kirjoittajat

DOI:

https://doi.org/10.23978/inf.107887

Avainsanat:

digitaaliset ihmistieteet [http://www.yso.fi/onto/yso/p28220], sähköinen aineisto [http://www.yso.fi/onto/yso/p25653], rajapinnat (tietokoneohjelmat) [http://www.yso.fi/onto/yso/p27641], dokumentointi [http://www.yso.fi/onto/yso/p16361], tutkijat [http://www.yso.fi/onto/yso/p4523], benchmarking [http://www.yso.fi/onto/yso/p9747], digitaalisten aineistojen tutkimuskäyttö, digitaalisten aineistojen kehitys, tutkijapalveluiden kehitys

Abstrakti

Artikkelissamme tarkastelemme Kansalliskirjaston datapakettien ja rajapintojen tutkijakäytön mahdollisuuksia ja rajoitteita vertailemalla niitä muiden kirjastojen tekemiin ratkaisuihin. Tutkijoiden digitaalisten aineistojen käyttötarpeet ovat erilaisia riippuen tutkimusasetelmasta, tutkimusalasta, käytettävistä menetelmistä ja kunkin teknisestä osaamisesta. Tutkijat lähestyvät Kansalliskirjaston aineistoja ja dataa tutkimustarpeidensa ohjaamina. He toivovat saavansa Kansalliskirjastosta tutkimuskirjallisuutta ja lähdeaineistoja. Kansalliskirjasto puolestaan tarjoaa tutkijoille aineistoa ja dataa kirjaston kokoelmista, joita on digitoitu valikoiden ja muunnettu datapaketeiksi tutkijoiden käyttötarpeiden ja -pyyntöjen perusteella sekä muiden kriteerien perusteella. Lisäksi data on tarjolla avointen ohjelmistorajapintojen kautta. Tässä artikkelissa datapaketilla tarkoitetaan digitoiduista aineistoista tiettyjen periaatteiden mukaan suuriksi valmiiksi datakokonaisuuksiksi luotuja sisältöjä, jotka ovat avoimesti saatavilla.

Datapaketit ja rajapinnat soveltuvat käytettäviksi esimerkiksi digitaalisiin ihmistieteisiin, joissa pyritään kehittämään uusia menetelmiä ja tekniikoita. Nykykäytössä datapaketit ja rajapinnat ovat kuitenkin Kansalliskirjaston keräämän aineiston mukaan vielä alikäytettyjä, ja ne näyttäytyvät perinteiselle humanistitutkijalle vaikeasti lähestyttävinä. Sekä tutkijoiden omat taidot, asenteet ja ymmärrys rajapinnoista että rajapintojen käyttöön liittyvät ongelmat ovat niiden käyttöä rajoittavia tekijöitä. Esimerkiksi rajapintojen dokumentaation taso, dokumentaation sisältämät esimerkit ja dokumentaation näkyvyys verkkosivuilla, eivät välttämättä vastaa tutkijoiden odotuksia. Eri maiden kansalliskirjastoissa on toteutettu työkaluja, joiden avulla rajapintojen käyttöä on pyritty opastamaan ja helpottamaan.

Lähdeviitteet

Ames, S. (2021). Transparency, provenance and collections as data: the National Library of Scotland’s Data Foundry. Liber Quartely, 31(1), 1–13. http://doi.org/10.18352/lq.10371

Bhutta, K. S., & Huq, F. (1999). Benchmarking – best practices: an integrated approach. Benchmarking: An International Journal, 6(3), 254-268. https://doi.org/10.1108/14635779910289261

Borgman, C. (2020). Whose text, whose mining, and to whose benefit? Quantitative Science Studies, 1(3), 993–1000. https://doi.org/10.1162/qss_a_00053

Candela, G., Dolores Sáez, M., Escobar Esteban, M., & Marco-Such, M. (2020). Reusing digital collections from GLAM institutions. Journal of Information Science, 46(5), 1–17. https://doi.org/10.1177/0165551520950246

Edmond, J., & Garnett, V. (2015). APIs and Researchers: The Emperor's New Clothes? International Journal of Digital Curation, 10(1), 287–297. https://doi.org/10.2218/ijdc.v10i1.369

EU-neuvoston linjaus (2016). https://data.consilium.europa.eu/doc/document/ST-9526-2016-INIT/en/pdf. Viitattu 19.3.2021.

FAIR-periaatteet https://www.fairdata.fi/tietoa-fairdatasta/fair-periaatteet/. Viitattu 29.4.2021.

Freire, N., Robson, G., Howard, J. B., Manguinhas, H., & Isaac, A. (2017). Metadata Aggregation: Assessing the Application of IIIF and Sitemaps Within Cultural Heritage. Teoksessa J. Kamps, G. Tsakonas, Y. Manolopoulos, L. Iliadis, & I. Karydis (toim.), Research and Advanced Technology for Digital Libraries (ss. 220-232). Springer. http://doi.org/10.1007/978-3-319-67008-9_18

Gagnon, Y. (2010). The Case Study as Research Method. Presses de l'Universite du Quebec.

Gebru, T., Morgenstern, J., Vecchione, B., Vaughan, J. W., Wallach, H., Daumé, H., & Crawford, K. (2018). Datasheets for Datasets. ArXiv, abs/1803.09010.

Ghazawneh, A., & Henfridsson, O. (2013). Balancing platform control and external contribution in third-party development: the boundary resources model. Information Systems Journal, 23(2), 173–192. https://doi.org/10.1111/j.1365-2575.2012.00406.x

Haanpää, M., Hakkarainen, M., & Garcia-Rosell, J.-C. (2014). Etnografia kehittämisen välineenä. Teoksessa P. Hämeenaho, & E. Koskinen-Koivisto (toim.), Moniulotteinen etnografia (ss. 287–307). Ethnos. http://urn.fi/URN:ISBN:978-952-68509-3-1

Kansalliskirjaston Digital Humanities –politiikka (2016). https://www.doria.fi/bitstream/handle/10024/130994/KK_DH_politiikka_18042016.pdf?sequence=2. Viitattu 26.4.2021.

Kansalliskirjasto. (2017). Avoin Kansalliskirjasto: politiikka ja toimenpideohjelma - Avoin Kansalliskirjasto - Yleinen sivusto. https://www.kiwi.fi/display/avoinkk/Avoin+Kansalliskirjasto%3A+politiikka+ja+toimenpideohjelma. Viitattu 29.4.2021.

Kansalliskirjasto (2021). Tehtävät ja strategia [Text]. https://www.kansalliskirjasto.fi/fi/tehtavat-ja-strategia. Viitattu 28.4.2021.

Koster, L., & Woutersen-Windhouwer, S. (2018). FAIR Principles for Library, Archive and Museum Collections: A proposal for standards for reusable collections. The Code4Lib Journal, (40).

Mahey, M., Al-Abdulla, A., Ames, S., Bray, P., Candela, G., Chambers, S., . . . Wilms, L., with forewords by: Al-Emadi, T. A., Broady-Preston, J., Landry, P., & Papaioannou, G. (2019). Open a GLAMLab. Digital Cultural Heritage Innovation Labs, Book Sprint, Doha, Qatar, 23–27 September 2019.

Mansaré, M. (2019). Finna-palvelun avoimen rajapinnan hyödyntäjät ja heille viestiminen [opinnäytetyö]. https://urn.fi/URN:NBN:fi:amk-2019060314397

Meng, M., Steinhardt, S., & Schubert, A. (2018). Application Programming Interface Documentation: What Do Software Developers Want? Journal of Technical Writing and Communication, 48(3), 295–330. http://doi.org/10.1177/0047281617721853

Neumann, A., Laranjeiro, N., and Bernardino, J., (2018). An Analysis of Public REST Web Service APIs. IEEE Transactions on Services Computing, 14(4), 957-970. https://doi.org/10.1109/TSC.2018.2847344

Näpärä, L. (2020) Digitaalisten aineistojen tutkimusta tehdään enimmäkseen perinteisin menetelmin. Scripta Selecta 17.8.2020. https://blogs.helsinki.fi/scriptaselecta/2020/08/17/dam-kysely-digitaaliset-aineistot/. Viitattu 20.4.2020.

Näpärä, L. & Liukkonen, E. (2020). Report on the benchmarking interviews in the Digital Open Memory project. Zenodo. http://doi.org/10.5281/zenodo.4285836.

Näpärä, L., & Lilja, J. (2021). Kansalliskirjaston aineistojen jatkokäyttö tutkijakyselyssä. Informaatiotutkimus, 40(1), 27–62. https://doi.org/10.23978/inf.99425

Padilla, T., Allen, L., Varner, S., Potvin, S., Russey Roke, E., & Frost, H. (2017). Call for Nominations: National Forum Attendance. https://collectionsasdata.github.io/nominations/. Viitattu 22.12.2020.

Puschmann, C., & Ausserhofer, J. (2017). Social data APIs: Origins, types, issues. Teoksessa M. T. Schäfer, & K. van Es (toim.), The datafied society: Studying culture through data (ss. 147–154). Amsterdam University Press.

Raemy, J., & Schneider, R. (2019). Suggested measures for deploying IIIF in Swiss cultural heritage institutions. http://dx.doi.org/10.5281/zenodo.2640416

Schlicht, H. (2021). Open Access, Open Data, Open Software? Proprietary Tools and Their Restrictions. Teoksessa S. Schwandt (toim.), Digital Methods in the Humanities - Challenges, Ideas, Perspectives (ss. 25–57). Bielefeld University Press.

Schwandt, S. (2021). Introduction – Digital humanities in practice. Teoksessa S. Schwandt (toim.), Digital Methods in the Humanities - Challenges, Ideas, Perspectives (ss. 7–22). Bielefeld University Press.

Schöch, C. (2013). Big? Smart? Clean? Messy? Data in the Humanities. Journal of Digital Humanities, 2(3). http://journalofdigitalhumanities.org/2-3/big-smart-clean-messy-data-in-the-humanities/

Sherratt, T. (2013). From portals to platforms – building new frameworks for user engagement. Presented at the LIANZA, Hamilton, New Zealand. Zenodo. http://doi.org/10.5281/zenodo.3563238

Sherratt, T., Wilms, L., & Lingstadt, K. (2020). LIBER Webinar: Setting Up A GLAM Workbench In Your Library. Zenodo. http://doi.org/10.5281/zenodo.3743193

Sugimoto G. (2017). Battle Without FAIR and Easy Data in Digital Humanities. Teoksessa E. Garoufallou, S. Virkus, R. Siatri, D. Koutsomiha (toim.), Metadata and Semantic Research. MTSR 2017 (ss. 315-326). Communications in Computer and Information Science, vol 755. Springer. https://doi.org/10.1007/978-3-319-70863-8_30

Thomas, G., & Myers, K. (2015). The anatomy of the case study. SAGE.

Vander Sande, M., Colpaert, P., De Nies, T., Mannens, E., & Van de Walle, R. (2014). Publish data as time consistent web API with provenance. Teoksessa Proceedings of the 23rd International Conference on World Wide Web (ss. 953–958). Association for Computing Machinery. http://doi.org/10.1145/2567948.2579217

Verborgh R., Hooland, S. V., Cope, A.S., Chan, S., Mannens, E., & Walle, R. (2015). The Fallacy of the Multi-API Culture:Conceptual and Practical Benefits of Representational State Transfer (REST). Journal of Documentation, 71, 233-252. https://doi.org/10.1108/JD-07-2013-0098

Tiedostolataukset

Julkaistu

2021-11-05

Viittaaminen

Liukkonen, E. ., Näpärä, L., Pääkkönen, T., & Rautiainen, J. (2021). Aineistopaketit ja rajapinnat tutkijoiden työkaluna Kansalliskirjastossa: mahdollisuudet ja rajoitteet . Informaatiotutkimus, 40(3), 189–215. https://doi.org/10.23978/inf.107887