Tutkimusaineistot turvaan jopa sadoiksi vuosiksi – pitkäaikaissäilytys käynnistyi

Suomalaisten korkeakoulujen ja tutkimuslaitosten tutkimusaineistojen digitaalinen pitkäaikaissäilytys käynnistyi 5.12.2019, kun ensimmäinen aineistopaketti tallennettiin CSC:n ylläpitämään pitkäaikaissäilytyspalveluun. Digitaalinen pitkäaikaissäilytys (PAS) varmistaa digitaalisten aineistojen säilyvyyden ja saatavuuden tutkijoiden käyttöön useiden kymmenien tai jopa satojen vuosien ajan.

Ensimmäinen pitkäaikaissäilytykseen tallennettu aineistopaketti tuli Helsingin yliopistosta. Tämä aineistopaketti oli pitkäaikaissäilytykseen tehty kooste 12 datasetistä, jotka sisälsivät SMEAR-asemien mittalaitteiden tuottamaa jatkuvaa dataa vuosilta 1992 – 2018. SMEAR-asemat mittaavat ilmakehän ja metsän välisiä aineen ja energian virtoja. Pitkäaikaista mittausdataa tarvitaan esimerkiksi ilmastokriisin ratkaisemiseen.

Ensimmäisen aineistopaketin pitkäaikaissäilytykseen tallentaminen hyödynsi laajasti Fairdata-palvelukokonaisuutta.  Data sijaitsi tutkimusdatan säilytyspalvelu IDAssa, aineisto kuvailtiin tutkimusaineistojen kuvailutyökalu Qvaimella, paketoitiin Fairdatan paketointipalvelulla, hyväksyttiin Helsingin yliopiston kiintiöön hallintaliittymällä ja lopuksi validoitiin ja tallennettiin Fairdata PAS -palveluun. Palvelun yhteinen metatietovaranto Metax toimi liimana eri vaiheiden välillä ja varmisti palvelukokonaisuuden yhteentoimivuuden.

– Jatkossa odotamme innolla lisää aineistoja pitkäaikaissäilytettäväksi. Nyt vastaanotettu aineistopaketti osoitti, että CSC:llä rakennetut palvelut muodostavat yhteentoimivan kokonaisuuden pitkäaikaissäilytykseen. Kun organisaatioiden sopimukset ovat olemassa, Fairdata-putken avulla aineistojen siirto pitkäaikaissäilytykseen on helppoa ja nopeaa ja tämä on myös mahdollista tehdä pitkälti itsepalveluna, sanoo kehityspäällikkö Kimmo Koivunen CSC:stä.

Tietosisällöt säilyvät murroksista huolimatta

Pitkäaikaissäilytettävät tutkimusaineistot ovat korvaamattoman arvokkaita ja siksi on tärkeätä turvata näiden digitaalisten aineistojen säilyvyys ja saatavuus tutkijoiden käyttöön tulevaisuudessakin.

Digitaalisessa pitkäaikaissäilytyksessä informaatio säilytetään ymmärrettävänä ja käytettävänä. Bittitasolla data säilytetään useina kopioina hajautetusti eri alustoilla ja informaation säilyvyys varmistetaan konvertoimalla. Laitteet, ohjelmistot ja tiedostomuodot vanhenevat ajan myötä, eikä tulevaisuudessa ole käytettävissä ohjelmistoja ja laitteita, joilla nykyistä dataa voidaan lukea. Sen vuoksi dataa muokataan tuleviin laite- ja ohjelmistoympäristöihin sopivaksi.

– Pitkäaikaissäilytys on aktiivista huolehtimista siitä, että informaatio säilyy siihen kohdistuvista erilaisista murroksista huolimatta. Tekniikka vanhenee, mutta myös ihmiset ja osaaminen vanhenevat.  Keskeistä on varmistaa hyvin toimivat prosessit, jotka mahdollistavat henkilöistä riippumattoman toiminnan ja myös osaamisen siirron uusille tekijöille, jotta tietosisältöjen hyödyntäminen mahdollistuu, Kimmo Koivunen kertoo.

Taustaa

Fairdata-palvelut ovat opetus- ja kulttuuriministeriön omistama ja CSC:n tuottama palvelukokonaisuus aineistonhallintaan, aineistojen kuvailuun ja turvalliseen säilytykseen sekä merkittävien tietoaineistojen pitkäaikaissäilytykseen.

CSC:llä on valmisteltu digitaalista pitkäaikaissäilytystä yhdessä aineistoja säilyttävien organisaatioiden ja opetus- ja kulttuuriministeriön kanssa jo noin kymmenen vuoden ajan. Kulttuuriperintöaineistojen pitkäaikaissäilytys on aloitettu yhdessä kansallisten muistiorganisaatioiden, kuten arkistojen, kirjastojen ja museoiden kanssa jo syksyllä 2015. 

Lisätietoja

Kehityspäällikkö Kimmo Koivunen, CSC
+358408408196
kimmo.koivunen at csc.fi