Elore 2/2003, 10. vuosikerta
Julkaisija: Suomen Kansantietouden Tutkijain Seura ry., Joensuu
ISSN 1456-3010, URL: http://cc.joensuu.fi/~loristi/2_03/kaa203.html
E-mail:loristi@cc.joensuu.fi

Kaksi viikkoa kenttätöitä internetissä

- miltä Joensuu näyttää tietokoneen ruudulta?

Taija Kaarlenkaski


Suoritin perinteentutkimuksen praktikum-työni kartoittaen, tallentaen ja dokumentoiden Joensuu-aiheisia internet-sivuja. Tehtäväni liittyi Joensuun perinnearkiston Joensuun paikat -keruuhankkeeseen, jonka tuottamaa aineistoa oli tarkoitus täydentää kartoituksella Joensuun virtuaalisista paikoista. Tehtävän parissa jouduin pohtimaan monia internet-tutkimukseen liittyviä kysymyksiä, niin teknisiä kuin kulttuurisiakin: millä ohjelmilla ja missä muodossa materiaalia kannattaa tallentaa, millä tarkkuudella, ja millaista aineistoa ylipäänsä tulisi arkistoida? Katsaukseni pohjautuu praktikum-työstäni tekemääni raporttiin, ja noudattaa sen päiväkirjamuotoa.

Internetin dokumentointia maailmalla ja meillä

Internet on käsittämättömän valtava aineistolähde: vuonna 2002 siinä arveltiin olevan yli neljä miljardia sivua. Se myös uudistuu jatkuvasti, sillä joka päivä internetiin tulee yli seitsemän miljoonaa uutta sivua, ja samanaikaisesti sivuja myös häviää. Internet-sivun keskimääräinen "elinikä" on 44 päivää. (Lyman 2002.) Tämä jatkuva muuttuvuus onkin yksi merkittävimmistä ongelmista internet-aineiston tallennuksen ja arkistoinnin suhteen: koottaessa aineistoa internetistä kokoelma ei ole koskaan valmis eikä täydellinen.

Teknologia muodostaa lisäksi oman ongelmansa, kuten muunkin digitaalisen aineiston arkistoinnissa. Tekniikan uudistuessa laitteet ja ohjelmat tulevat nopeasti vanhanaikaisiksi, eikä tallennettua tietoa voida kenties lukea uusilla laitteilla. Myös internet-sivun sisällön tarkka määrittely voi olla vaikeaa, koska sivut sisältävät keskimäärin 15 linkkiä muille sivuille, ja lisäksi niillä voi olla myös ääni- ja kuvamateriaalia. (Lyman 2002; Stenvall 2001.) Missä laajuudessa tietyn sivun sisältö tulisi siis tallentaa?

Maailmalla on käynnissä useita internetin tallennus- ja arkistointiprojekteja. Euroopassa on Cedars NEDLIB-hankkeet (Stenvall 2001), ja Ruotsilla ja Tanskalla on omat internet-arkistonsa. Tanskassa valtionarkisto tallentaa internetin julkisen osan (Digitaaliset Kuolleen meren kääröt), ja Ruotsissa Kuninkaallinen kirjasto on arkistoinut internet-sivuja jo kuuden vuoden ajan. Myös Suomi on ollut mukana NEDLIB-projektissa (Hakala 1999), joka tosin on ilmeisesti päättynyt vuonna 2001. Lisäksi Helsingin yliopiston kirjaston ja CSC:n (tieteen tietotekniikan keskus) yhteinen EVA-projekti on keskittynyt elektronisen verkkoaineiston arkistointimahdollisuuksien selvittämiseen. Myös tämä hanke on päättynyt vuonna 2001. Tämänhetkisiä tietoja Suomen internet-arkistoinnin tilanteesta en ole löytänyt.

Edellä mainittujen projektien keräämiin tietokantoihin ei yleisöllä ole mahdollisuutta päästä, mutta tietokantoja voi ilmeisesti käyttää tutkimuksessa. Maailmanlaajuisia internet-arkistoja ovat Internet Archive ja WebArchivist.org, ja ainakin Internet Archivesta löytyy myös suomalaisia sivuja. Internet Archive on perustettu vuonna 1996 ja avattu yleisölle vuonna 2001 (Onnela 2001). Nämä arkistointihankkeet toimivat luonnollisesti automaattisten haku- ja tallennusrobottien avulla, ei suinkaan yksittäisten ihmisten "surffaa ja tallenna" -menetelmällä, kuten omassa työssäni. Kulttuurintutkimuksessa ihmisen tekemä "kenttätyö" voi kuitenkin olla hedelmällisempää kuin mekaaninen kaiken tallentaminen, sillä se mahdollistaa erilaisten yhteyksien hahmottamisen ja muistiin kirjaamisen. Yksi merkittävä osa internet-aineiston tutkimista ja tallentamista voikin olla kenttäpäiväkirjan kirjoittaminen. Kenttäpäiväkirja voi tehdä kerätyn materiaalin huomattavasti helpommin ymmärrettäväksi kuin pelkät tiedostot tietokoneen kovalevyllä tai cd:llä.

Internet-kenttäpäiväkirja

23.6.2003

Aloitin internet-sivustojen kartoittamisen paikallisen päälehden, sanomalehti Karjalaisen kulttuurilinkkien perusteella. Eniten materiaalia löytyi Taidekeskus Ahjon ja Joensuun taidemuseon linkkien kautta. Ahjon sivuilta oli linkkejä monien joensuulaisten taiteilijayhdistysten sivuille, joilla taas esiteltiin niiden jäsenien tuotantoa. Tallensin näistä pääsivuja sekä taiteilijoiden esittelyjä. Myös rockklubi Kerubin ja Ilosaarirockin sivut vaikuttivat varsinaisilta runsaudensarvilta lukemattomine kuvineen ja keskustelupalstoineen, mutta tallensin niistäkin alustavasti vain avaussivut.

Paljon aineistoa löytyi myös erilaisten koulujen sivuilta: kaikilla Joensuun ala-asteilla on omat sivunsa, joilla kerrotaan esim. koulun historiasta. Joillakin sivuilla oli myös oppilaiden itse tuottamaa materiaalia. Lisäksi löysin koululaisille suunnatut Joen suusta Joensuuksi -opetussivut, joilla on erittäin paljon valmista kuva- ja tekstimateriaalia sekä oppilaiden itsensä tuottamaa aineistoa. Joensuun Kaupungin sivut ja niistä avautuvat linkit mm. turistipalveluihin ovat myös erittäin laajat.

Ensimmäinen päivä kului lähinnä aihepiiriin tutustumiseen. En tallentanut vielä kovin paljoa sivuja, koska olin hieman epävarma siitä, millaista ja missä laajuudessa aineistoa olisi tarkoitus tallentaa.

24.6.2003

Jatkoin aineiston tutkimista Joensuun kaupungin sivuilta siltä osin kuin se edellisenä päivänä oli jäänyt kesken. Mielenkiintoista oli, että eri kaupunginosista nähtävästi vain Marjalalla on omat sivunsa. Lisäksi myös Penttilästä löytyi paljon materiaalia, koska kaupungilla on juuri menossa ideakilpailu alueen kehittämisestä. (Penttilässä sijainnut vanha saha paloi syksyllä 1996, ja alue on siitä lähtien ollut käyttämättömänä.)

Tutustuin alustavasti myös Karjalaisen sivuilla olevaan keskustelupalstaan ja yritin etsiä myös muita Joensuuhun liittyviä keskustelupalstoja. Niitä löytyikin mm. nuorten ponu.netistä, susiraja.netistä, joka on maakunnallinen internet-portaali, sekä Joensuun yliopiston ylioppilaskunnan sivuilta. Kaupungin sivujen keskustelu-linkin takaa ei yllättäen löytynyt mitään.

Nämä kaksi ensimmäistä päivää kuluivat siis lähinnä tutkimuskenttään tutustumiseen ja "haltuunottoon". Internet käsitetään usein erityisenä paikkana, vaikka tosiasiassa se onkin vain toisiinsa yhteydessä olevien tietokoneiden suunnattoman laaja verkko. Internet-sivuilla on kuitenkin aina tietty osoite, mikä tuntuu tekevän verkosta ympäröivän maailmamme kaltaisen: voimme siirtyä osoitteesta toiseen. Siispä kenttätöitä aloittaessa on tässäkin tapauksessa hyödyllistä ensin hahmottaa, minkälaisia paikkoja tutkimusalueelta löytyy ja mitkä vaikuttavat mielenkiintoisimmilta tutkimuskohteilta.

25.6.2003

Aloitin järjestelemällä edellisinä päivinä tallentamiani sivustoja kansioihin aihepiirin mukaan. Joitakin, kuten Joyful Beat Cafeta (nuorisokahvila ja toimintakeskus) tai Popkatua, oli tässä vaiheessa vaikeaa sijoittaa mihinkään kategoriaan, mutta luokittelua joutuukin varmaan vielä parantelemaan aineiston lisääntyessä.

Ensimmäiseksi varsinaiseksi tallennuskohteekseni valitsin rockklubi Kerubin, joka joutui lopettamaan toimintansa syksyllä 2002, koska sen vanhojen toimitilojen paikalle alettiin rakentaa liiketiloja ja asuntoja. Olin jo edellisenä päivänä tallentanut keskustelupalstan Windowsissa olevalla Notepad-ohjelmalla ja nyt tallensin samalla tavalla Kerubia koskevat muistelut, joita kuka tahansa voi kirjoittaa sivulle. Ne vaikuttivatkin erittäin mielenkiintoisilta. Kerubilla on todella ollut suuri merkitys paitsi joensuulaisen rock-kulttuurin edistäjänä, myös tietyn ihmisryhmän "henkisenä kotina." Kuvia klubin viimeisiltä päiviltä oli sivuilla todella paljon, ja niiden kaikkien tallentamiseen meni aikaa liki kaksi tuntia. Kuviin ei liittynyt tekstejä, mikä toisaalta helpotti tallentamista, mutta toisaalta kuvissa olevat henkilöt ja tilanteet jäävät nyt hämärän peittoon.

Kun olin mielestäni saanut jo Kerubin sivut talteen, huomasin, että "kokonainen web-sivu" -muodossa tallennettuina ne eivät näkyneet Internet explorerilla (versio 6.0) katsottuna ollenkaan. Kokeilin siis tallentamista "vain HTML"-muodossa. Silloin sivut olivat näkyvissä, mutta tallennettuani jälleen kaikki alasivut (uutiset, tekniikka jne.), huomasin, että ne kaikki näyttävätkin samalta kuin aloitussivu! Sitten kokeilin vielä "web-arkisto"-muotoa, jolla kaikki alasivutkin tulivat vihdoin oikeanlaisina talteen. Täytyy siis muistaa aina tarkistaa, että sivut tallentuvat oikeannäköisinä!

Seuraavaksi kävin Ilosaarirockin sivujen kimppuun. Havaitsin pian, että sivuilta löytyy erittäin paljon linkkejä ja vielä niiden alta lisää linkkejä ja niin edelleen. On siis mietittävä, millä menetelmällä ja kuinka tarkasti sivut voi dokumentoida. Tämän päivän osalta kysymys jäi vielä auki, sillä ryhdyin tarkemmin tutkimaan sivujen keskustelupalstaa. Ensin ajattelin tallentaa keskustelut samalla tavalla Notepadilla kuin Kerubinkin osalta, mutta sitten havaitsin, että sivuilla on itse asiassa neljä eriaiheista keskustelufoorumia, joissa on yhteensä yli 900 viestiketjua; kaiken tallentaminen ei siis tule kysymykseen. Päädyin sellaiseen ratkaisuun, että tallennan jokaisesta foorumista joitakin uusimpia viestiketjuja Notepadilla. Se on tähän tarkoitukseen sopiva ohjelma, koska se ei kopioi sivujen muotoiluja, taulukoita, eikä muuta "turhaa", vain tekstin. Tosin siihenkin tulee väkisin mukaan jonkin verran ylimääräisiä tekstejä kuten "edit", "vastaa tähän viestiin" yms. Kaikenkaikkiaan tallensin keskusteluketjuja tänään 23 kappaletta, ja lisäksi otsikot "Rock"-otsikoidusta foorumista, jossa on eniten viestiketjuja.

26.6.2003

Jatkoin Ilosaarirockin sivujen dokumentointia. Ensin tallensin kaikki alasivut (kuten info, bändit jne.) omiksi kansioikseen, jotta tallennus vastaisi edes jollakin tavalla sivujen alkuperäistä rakennetta. Sivuilta löytyivät myös tapahtuman televisiomainokset, mutta niiden katsomiseen tarvitsi Quick Time -ohjelman. Latasin ohjelman netistä ja asensin sen, minkä jälkeen mainoksia pääsi kyllä katsomaan, mutta ei tallentamaan kovalevylle. Harmi, sillä ne olivat erittäin persoonallisia ja hauskoja.

Aikaisemmat Ilosaarirockit vuosilta 1999-2002 on dokumentoitu sivuille varsin perusteellisesti. Ilosaarirockilla on oma verkkotoimitus, joka tuntuu olevan hyvin aktiivinen. Ryhdyin ensimmäiseksi tallentamaan viime vuoden rokista tehtyjä juttuja. Päätin tallentaa ne Wordilla (versio 2000), koska siihen voi ottaa mukaan teksteihin liittyvät kuvatkin. Kun olin käyttänyt juttujen tallentamiseen lähemmäs kaksi tuntia, huomasin, etten ole vielä aivan listan puolivälissäkään! Kaikkien internetiin arkistoitujen aiempien vuosien juttujen tallentaminen olisi kyllä varmasti aivan liian suuri urakka, etenkin kun pelkkiä kuviakin on varmasti satoja. Tallensin kuitenkin kaikki 120 vuoden 2002 rokkiin liittyvää juttua yhteen Word-dokumenttiin. Festaria oli näissä jutuissa tarkasteltu hyvin monipuolisesti: oman osansa saivat niin bändien keikat, yleisö, järjestäjät kuin kaikenlainen muu "oheiselämäkin". Näissä jutuissa voisi olla aineistoa ehkä johonkin pieneen tutkielmaankin.

Tallensin myös kaikki vuoden 2002 rokin kuvat, joita oli erittäin paljon, mutta onneksi tallennus kävi nopeasti. Lisäksi kokeilin kokoamieni tiedostojen polttamista cd-levylle Nero-ohjelmalla. Vaikka ohjelma huomautti, että jotkut tiedostopolut ovat liian pitkiä, tallennus onnistui ja tiedostot aukesivat myös poltetulta levyltä. Tämä polttaminen oli lähinnä kokeilu, sillä kokoamaani aineistoa on vasta reilut 100 megatavua.

27.6.2003

Jatkoin edelleen Ilosaarirockin parissa. Tallensin vuosien 1998-2002 festivaalien sivujen olennaisimmat kohdat. Vuoden 2000 sivuilla oli yleisön kirjoittamia kokemuksia Ilosaarirockista, ja tallensin ne Wordilla. Pdf-muodossa olleen historiikin tallensin myös. Kuvia en kuitenkaan tässä vaiheessa ryhtynyt tallentamaan enempää. Aikaisempien vuosien rokeista jäi siis vielä paljon aineistoa tallentamatta, mutta päätin tässä vaiheessa siirtyä eteenpäin ja jatkaa Ilosaarirockin parissa vielä myöhemmin, jos aikaa siihen jää.

Seuraavaksi tallensin Popkadun ja Ilovaarirockin sivustot, mikä kävikin kohtuullisen nopeasti. Popkatu on Ilosaarirockin yhteydessä kävelykadulla järjestettävä erityisesti lapsille suunnattu tapahtuma, ja Ilovaarirock puolestaan festivaali, joilla esitetään lähinnä 1960-luvun rockmusiikkia. Ilovaarirockin sivuilla ongelmaksi oli muodostua esiintyjät- ja info-sivut, jotka eivät tallentuneet täydellisesti millään web-sivun tallennuksen muodolla. Niinpä jouduin kopioimaan tekstit ja kuvat Wordiin ja tallentamaan ne sillä. Ilovaarirockista pystyin tallentamaan kaikki kuvat ja vieraskirjankin koko sisällön vähällä vaivalla, koska materiaalia ei ollut läheskään niin paljon kuin Ilosaarirockin sivuilla.

Siirryin musiikkikulttuurista vaihteeksi muille alueille ja tallensin Muistoja Joensuusta -hankkeen sivut ja itse muistot Word-tiedostoksi. Muistoja Joensuusta on Joensuun taidemuseon ja Palvelukeskus Koivupihan yhteistyöprojekti, jonka tavoitteena on kerätä ja tallentaa Joensuuta koskevaa muistitietoa internetiin. Sen pyrkimyksenä on koota Joensuun historiaa koskevaa arkistoa ja samalla aktivoida vanhuksia muistelemaan. Tallensin samalla tavoin myös opetuskäyttöön tarkoitetut Joen suusta Joensuuksi -sivustot. Koska teksti oli näillä sivuilla jaoteltu melko lyhyisiin omilla sivuillaan oleviin pätkiin, kopioin ne kuvineen wordiin. Näin minun ei tarvinnut tallentaa kymmenittäin erillisiä internetsivuja, joilla on melko vähän tekstiä.

Pielisjoen koulu on nähtävästi hyvin aktiivinen erilaisten multimediahankkeiden parissa, sillä sen sivuilta löytyi melko paljon oppilaiden tekemiä videoita ja muuta aineistoa. Valitettavasti en saanut Powerpoint-muodossa olevaa koulun historiikkia tallennettua, koska Powerpoint-ohjelma sanoi sen tiedostonimen olevan viallinen. Sain kuitenkin talteen videoita, joilla oppilaat haastattelevat sotaveteraaneja ja Joensuun kaupunginvaltuutettuja, sekä muutamia historiaan liittyviä videoita. Videoiden katsomiseen tarvitaan Real One -ohjelma, joten latasin sen internetistä ja asensin sen koneelle. Lopuksi vielä poltin cd-levylle viikon aikana keräämäni materiaalin.

30.6.2003

Päätin siirtyä Joensuun kaupungin sivuille ja sieltä löytyviin linkkeihin. Aloitin kävelykeskustaprojektin sivuista, jotka tallensin sellaisenaan. Keskustelupalstan tallensin Notepadilla, koska sivujen muotoilujen tallentaminen ei mielestäni ollut tarpeellista. Tallentaminen kopioi ja liitä -menetelmällä oli melkoisen työlästä, mutta parempaakaan tapaa en keksinyt. Lisäksi Notepadin tiedostokoko on nähtävästi rajallinen, sillä tietyssä vaiheessa ohjelma ilmoitti, ettei muistikapasiteetti enää riitä. Niinpä jouduin tallentamaan keskustelut kolmeen eri tiedostoon, jotka numeroin. Keskustelupalstan erikoisuus oli erittäin pitkä ja monipolvinen skeittauskeskustelu, jossa nuoriso vaati skeittaushallia niin Joensuuhun, Kajaaniin, Kokkolaan kuin joihinkin muihinkin kaupunkeihin kirosanoja ja muita alatyylin ilmaisuja säästämättä.

Kaupungin sivuilta löytyivät myös linkit Penttilän alueen ideakilpailuun sekä Marjalan omille sivuille. Näillä sivuilla oli runsaasti myös kuvia, jotka tallensin kaikki. Tallensin myös Penttilän ideakilpailun ohjeet, jotka olivat pdf-muodossa, mutta en päässyt lukemaan niitä, koska koneen Acrobat Reader -ohjelma vaikutti olevan jumissa. Joensuun muista kaupunginosista ei löytynyt juurikaan tietoa, vaikka etsin myös Google-hakukoneella. Lähes jokaisessa kaupunginosassa näyttää kyllä olevan asukasyhdistys, mutta internet-sivut on vain Hukanhaudan ja Kanervalan yhdistyksellä, ja nekin ovat hyvin suppeat. Marjalan sivujen laajuus johtunee siitä, että alueella pidettiin asuntomessut vuonna 1995. Tallensin myös kaupungin oman kuvagallerian sisällön. Kaupungin sivujen valtavasta materiaalitarjonnasta tallensin lähinnä kulttuuriin ja Joensuun eri paikkoihin liittyvät sivut.

Lisäksi tallensin Susiraja.netin keskustelupalstan, jossa tosin oli vielä varsin vähän viestejä. Palsta oli ilmeisesti avattu vasta toukokuussa, eikä kirjoittelu ollut mitenkään aktiivista. Päivän päätteeksi etsin joensuulaisten yliopisto-opiskelijoiden omia kotisivuja. Muistelin nähneeni linkin opiskelijoiden kotisivuihin joskus yliopiston sivuilla, mutta nyt en löytänyt sitä enää mistään. Hakemalla yliopiston sivuilta sanalla "kotisivut" löysin kuitenkin linkkejä opiskelijoiden sivuille, joista tallentelin muutamia ikään kuin näytteiksi. Valitettavasti en kuitenkaan löytänyt mitään virallista listausta siitä, kuinka paljon opiskelijoilla on kotisivuja yliopiston palvelimella. Pikaisella katsauksella miehillä näytti olevan enemmän sivuja kuin naisilla, mikä ei sinänsä ollut suuri yllätys.

1.7.2003

Aloitin käsittelemällä Joyful Beat Cafen ja Joensuun Gospelfestivaalien sivut, jotka olivat jääneet työni alkuvaiheessa "roikkumaan". Koska Joyful Beat Cafe on joutunut lopettamaan toimintansa, voi olla, että sen sivutkaan eivät enää pitkään säily internetissä. Valitettavasti sivujen kuvat -linkin alla ei jostain syystä ollut mitään. Tallensin myös keskustelufoorumin sisällön, jälleen Notepadilla. Keskusteluun olivat osallistuneet lähinnä Joyful Beat Cafen toimintaan osallistuneet henkilöt, joten keskustelu oli melkoisen sisäpiirihenkistä. Gospelfestivaalien sivuilta tallensin runsaasti kuvia viime vuoden festivaaleilta sekä keskustelupalstan.

Pohjois-Karjalan nuorten foorumilla, Ponu.netissä on todella paljon materiaalia kaikenlaisista nuoria koskettavista aiheista. Tallensin sivuja mahdollisimman paljon, eri osa-alueet omiin kansioihinsa. Myös keskustelupalstalla on paljon viestejä, joista ehdin tallentaa vajaat puolet, loput jäivät seuraavalle päivälle. Ongelmallista näiden keskustelujen tallentamisessa on se, että Notepadille kopioitaessa tekstiin liittyvät hymiöt ja kirjoittajien profiiliinsa liittämät kuvat jäävät pois (Sama ongelma oli myös Joyful Beat Cafen ja Gospelfestivaalien keskusteluissa). Wordiin kopioitaessa ne tulisivat mukaan, mutta toisaalta Word-tiedostosta tulisi todella iso. Loppujen lopuksihan tekstisisältö on kuitenkin olennaisin.

2.7.2003

Päivä sujui keskustelupalstojen tallennuksen merkeissä. Aluksi tallensin loput Ponu.netin foorumin keskusteluista ja siirryin sitten Karjalaisen verkkolehden keskustelupalstan pariin. Senkin tallensin Notepadilla. Valitettavasti Karjalaisen palstalla ei näy viestien lähettämisen päivämääriä. Päätin käyttää eritasoisia sisennyksiä Notepadissa saadakseni näkyviin kirjoitusten porrastumisen (A kirjoittaa viestin, B vastaa A:lle, C vastaa B:lle, D vastaa A:lle). Tämä vaati tietysti hieman lisää työtä, mutta tekee mielestäni keskusteluista hieman helpommin seurattavia. Menetelmäni tuntui toimivan hyvin, kunnes eteen tuli Irak-jupakkaa ja Anneli Jäätteenmäkeä koskeva erittäin pitkä, monia tasoja ja pitkiä kirjoituksia sisältävä keskustelu. Koska sisennysten käyttäminen ei enää järkevästi ollut mahdollista, jouduin lisäilemään joihinkin kohtiin omin sanoin, mihin kirjoitukseen mikäkin viesti reagoi. Lopuksi vielä tallensin koko Irak-keskustelun "sisällysluettelon" omaksi Word-tiedostokseen, jotta keskusteluketjusta pystyisi saamaan jonkinlaisen kokonaiskäsityksen. Vaikka keskustelupalstojen tallennus onkin melko mekaanista työtä, samalla saa kuitenkin varsin mielenkiintoisen läpileikkauksen siitä, mitä pohjoiskarjalaisten päässä liikkuu tallennushetkellä. Karjalaisen palsta on ilmeisesti kohtuullisen ahkerassa käytössä, sillä tallennusprosessin aikana sivulle oli ilmestynyt neljä uutta aihetta.

Päivän päätteeksi tein vielä Googlella haun sanalla "Joensuu" nähdäkseni, onko jotain oleellista jäänyt vielä huomaamatta. Tuloksia tuli yhteensä yli 200 000 kappaletta, joista tietysti selasin vain pientä murto-osaa. Löysin kuitenkin mm. Joensuun raviradan sivut sekä #joensuu-sivuston, joilla näyttää olevan paljon aktiivisia käyttäjiä. Erikoisuuksista mainittakoon pilvenpiirtäjiin ja muihin korkeisiin rakennuksiin erikoistuneet Skyscrapers.com -sivut, joille oli listattu Joensuun keskussairaala ja kaupungintalo, sekä Joensuun keltaisille kaupunkipyörille omistettu englanninkielinen sivu.

3.7.2003

Käytin lähes koko päivän viime viikolla kesken jääneeseen Ilosaarirockin keskustelupalstan tallennukseen. Tallensin jokaisesta neljästä aihealueesta ne "topicit", joihin oli tullut uusia viestejä viimeisimmän viiden päivän sisällä. Edelleen siis jäi varmasti satoja viestiketjuja tallentamatta, mutta kaikkien tallennus veisi useita päiviä, eikä sellainen ajankäyttö olisi varmastikaan projektin kannalta järkevää. Joissakin keskusteluissa tuli päällekkäisyyttä viime viikolla tallentamieni kanssa. Tällä kertaa en kuitenkaan tallentanut jokaista keskusteluaihetta omaksi Notepad-tiedostokseen, vaan tallensin jokaisen tiedoston "täyteen" eri keskustelunaiheista. Numeroin tiedostot juoksevasti, joten niistä selviää viestien senhetkinen järjestys. Tietysti tallennuksen aikana sivuille oli ilmestynyt jo paljon uusiakin viestejä, mutta koska niitä olisi ollut erittäin vaikea sijoittaa oikeaan kohtaan enää jälkeenpäin, jätin ne sikseen. Tällaisen jatkuvasti karttuvan ja uusiutuvan aineistolähteen dokumentoinnissa onkin omat ongelmansa. Lopuksi tallensin vielä vuoden 2001 Ilosaarirockin kuvat, joita oli 263 kappaletta.

4.7.2003

Tallensin vielä muutamia mieleen tulleita sivuja, kuten paikallislehtien Karjalan Heilin ja Karjalanmaan etusivut. Tallensin lisäksi vielä kaikki Word-dokumentit myös rtf-muotoon, koska tietyllä Wordin versiolla tehty dokumenttihan ei välttämättä aukea jossakin toisessa ohjelman versiossa.

Laadin Wordilla sisällysluettelon keräämästäni aineistosta, jotta sen sisältöihin voisi luoda pikaisen silmäyksen tarvitsematta availla kaikkia alakansioita. En kuitenkaan merkinnyt sisältöjä erityisen tarkasti, sillä se olisi vienyt aivan liikaa aikaa. Lopuksi poltin tekemäni Jnsnetti ja Jnsnettikuvat -kansiot cd-levylle ja polttamisen jälkeen tein vielä "pistokokeita" valmiille levylle todetakseni, että siellä olevat tiedostot näkyvät oikein. Keräämääni aineistoa on kaiken kaikkiaan vajaat 600 megatavua. Cd-levy on liitetty osaksi Joensuun paikat -keruun aineistoa SKS:n Joensuun perinnearkistossa.

Yhteenvetoa ja pohdintaa

Praktikum-työni oli varsin mielenkiintoinen kokemus siitä, millaista aineistonhankinta voi olla internetin valtakaudella. Työtä tehdessä joutui miettimään paitsi tutkimuksellisia, myös teknisiä näkökulmia. Pohdin myös tekijänoikeudellista puolta: internethän on periaatteessa kaikille avoin ja suuri osa aineistosta vapaasti käytettävissä, mutta siellä on paljon myös tekijänoikeudella suojattua aineistoa, kuten valokuvia. Tutkimuskäyttöön näitä aineistoja saa varmaankin käyttää, mutta ongelmia voisi ehkä tulla, jos niitä käytettäisiin esimerkiksi julkaistavassa teoksessa. Myös muita eettisiä näkökulmia on syytä ottaa huomioon varsinkin keskustelupalstojen yhteydessä: haluaisivatko kirjoittajat välttämättä omia tekstejään käytettävän tutkimuksessa? Erityisen ongelmallista on se, että kirjoittajia on lähes mahdotonta jäljittää nimimerkkien takaa esimerkiksi siinä tapauksessa, että tutkija haluaisi heiltä lisätietoja. Huomionarvoista on myös, että suuri osa internetin keskustelupalstoista on moderoituja, eli sopimattomat viestit poistetaan. Kaikki itse tallentamani keskustelut olivat moderoituja.

Paljon Joensuu-aiheista aineistoa jäi toki tallentamattakin. Oma asemani perinteentutkijana sekä Joensuun paikat -tutkimushankkeen antama viitekehys vaikuttivat työni tuloksiin, kuten myös omat henkilökohtaiset kiinnostuksen kohteeni. Pyrin keskittymään lähinnä kulttuurin kannalta kiinnostavaan aineistoon, joten Joensuun yritykset, talouselämä ja sosiaaliset rakenteet jäivät keruun ulkopuolelle. Myös se, että aikaa tallennukselle oli vain kaksi viikkoa, vaikutti tulokseen. Esimerkiksi Ilosaarirockin sivuja en saanut täydellisesti talteen yksinkertaisesti ajanpuutteen takia, ja Pohjois-Karjalan muut kulttuuritapahtumat jäivät kokonaan käsittelemättä. Samoin aineiston tarkempi analysointi jäi tällä kertaa työni ulkopuolelle.

Vaikka internet tuntuukin laajuutensa puolesta varsinaiselta aineiston aarreaitalta, materiaalin suuri määrä ja jatkuva muuttuvuus aiheuttavat myös omat rajoituksensa sen keräämiseen. Lisäksi on syytä miettiä, minkälaisessa tarkoituksessa eri sivut on tehty: onko tarkoituksena antaa tietoa, mainostaa, vaiko kenties jopa johtaa harhaan? Lähdekritiikki on erityisen olennaista internet-aineistoja käytettäessä. Nykykulttuurin tutkijalle internet on kuitenkin erittäin antoisa aineistolähde, sillä sivustoilta pääsee nopeasti ja helposti näkemään ihmisten tämänhetkisiä kiinnostuksen kohteita ja spontaaneja mielenilmaisuja.

Linkkejä

Joensuu-aiheinen aineisto:
Ilosaarirock
http://www.ilosaarirock.fi

Ilovaarirock
http://www.ilovaarirock.fi

Joensuun kaupunki
http://www.jns.fi

Joensuun kävelykeskustaprojekti
http://www.jns.fi/kavelykeskusta/

Joensuun museot
http://www.jns.fi/joensuunmuseot/

Joen suusta Joensuuksi
http://pelu.jns.fi/vianova/

Muistoja Joensuusta
http://www.jns.fi/taidemuseo/muistoja/index.html

Pohjois-Karjalan Nuorten Foorumi
http://www.ponu.net

Rockklubi Kerubi
http://www.kerubi.net/

Susiraja.net
http://www.susiraja.net

Verkko-Karjalainen
http://www.karjalainen.fi/cgi-bin/vk

Lähteet

Digitaaliset Kuolleen meren kääröt - digitaalisen kulttuurihistorian arkistoinnin ja suojauksen merkityksestä
http://www.fourleaf.fi/flt/web/WebPages.nsf/0/DE9B56EAA3A015F6C1256C3800320A11?Opendocument 11.9.2003.

EVA-projekti:
http://www.lib.helsinki.fi/eva/index.html 16.9.2003.

Hakala, Juha 1999, Suomalainen internet arkistoon. Tietolinja 3/1999.
http://www.lib.helsinki.fi/tietolinja/0399/nwi_nwa.html 11.9.2003.

Internet Archive:
http://www.archive.org 23.9.2003.

Lyman, Peter 2002, Archiving the World Wide Web. Teoksessa Building a National Strategy for Preservation: Issues in Digital Media Archiving.
http://www.clir.org/pubs/reports/pub106/web.html 28.8.2003.

NEDLIB:
http://www.kb.nl/coop/nedlib/ 16.9.2003.

Onnela, Tapio 2001, Internet-arkisto avattu aikamatka Internetin 1990-luvulle. Agricolan Tietosanomat 2/2001.
http://www.utu.fi/agricola/tietosanomat/numero2-01/internetarkisto.html 11.9.2003.

Stenvall, Jani 2001, Metadatan hyödyntäminen elektronisten aineistojen pitkäaikaissäilytyksessä. Tietolinja 1/2001. http://www.lib.helsinki.fi/0101/metadata.html 28.8.2003.

Kiitokset

Katja Laitiselle ja Jyrki Pöysälle asiantuntevista kommenteista ja lähdemateriaalivihjeistä.

Taija Kaarlenkaski, HuK
Joensuun yliopisto
Perinteentutkimus