NOMAD tarjoaa avointa materiaalitieteen dataa

NOMAD tarjoaa avointa materiaalitieteen dataa

NOMAD Repository and Archive (Novel Materials Discovery) on arkisto, jonka säilömä ja jakama data liittyy materiaalitieteeseen, joka on fysiikkaan, kemiaan ja insinööritieteisiin perustuva tieteenala. NOMAD tarjoaa datan Creative Commons -lisenssillä sekä raaka- että käsitellyssä muodossa.

– NOMAD on hyvä esimerkki tieteenalakohtaisesta data-arkistosta, sanoo Mikhail Kuklin, laskennallisen materiaalitieteen tutkija Aalto-yliopiston Sähkötekniikan korkeakoulusta. – NOMADissa on käytössä kuvailutietomalli, joka on kehitetty erityisesti laskennallisten tieteiden tarpeisiin. NOMADin käyttöliittymä on hyvin kehittynyt ja soveltuu erinomaisesti materiaalitieteen tutkijoille.

Kuva: Mikhail Kuklin.

 

NOMADin hakukäyttöliittymä on avoin eikä edellytä käyttäjätunnusten luomista tai sisäänkirjautumista. Luomalla tunnuksen pääsee lisäksi lisäämään arkistoon omaa dataa. Dataa siirrettäessä järjestelmä luo syötteen perusteella automaattisesti datalle kuvailutiedot (metadata), minkä ansiosta datan voi tämän jälkeen julkaista välittömästi. Sille voi halutessaan myös asettaa julkaisuviiveen, joka voi olla pisimmillään kolme vuotta. Tallennusprosessi samalla muuntaa datan yhtenäiseen muotoon riippumatta millä sovelluksella se on alun perin tuotettu, jolloin hakutoimintokin löytää halutut tulokset helpommin. Data on luvattu säilyttää vähintään kymmenen vuotta. Pysyvien tunnisteiden (DOI, Digital Object Identifier) avulla dataan viittaaminen esimerkiksi julkaisuissa on helppoa, ja se löytyy vielä pitkän ajankin päästä.

– Olen tutkinut materiaalitiedettä laskennallisen kemian menetelmin, Kuklin sanoo. – Aikaa ja resursseja säästääksemme tutkimme kemiallisten yhdisteiden ominaisuuksia laskennallisin työkaluin tavanomaisen laboratorioympäristön sijaan. NOMADia olen käyttänyt enemmän sijoittamalla sinne omaa dataani kuin lataamalla sieltä jonkun muun tuottamaa dataa. Toisinaan olen kuitenkin käyttänyt NOMADin tarjoamaa dataa säästääkseni tutkimusaikaani. Yksi tärkeimmistä materiaalimallinnuksen kysymyksistä on kuinka löytää luotettava tutkimusmetodologia. On melko tyypillistä joutua kokeilemaan erilaisia lähestymistapoja ja vertailemaan tuloksia vertailuarvoihin (mieluiten kokemusperäiseen dataan, jos sellaista on saatavilla). NOMAD-arkistosta voi aina katsoa onko soveltuvaa tutkimusta jo aiemmin tehty ja näin välttyä tekemästä samaa työtä uudelleen.

NOMADin ensisijainen vahvuus on datan lisäämisen helppous, sanoo NOMAD-projektiin osallistunut kehityspäällikkö Atte Sillanpää CSC:stä. – Laskennallisen materiaalitieteen tutkijan uran aikana kertyy paljon eri metodein tuotettuja, eri materiaaleja koskevia laskelmia. Tiedän omasta kokemuksesta, että on haastavaa pitää kirjaa kaikista vanhoista tuloksista ja pystyä vielä hyödyntämäänkin niitä. NOMADin monipuoliset haku- ja suodatusominaisuudet auttavat omankin datan hallinnassa. Datan tallettaminen NOMADiin säästää lukemattomia laskentatunteja erityisesti tietokoneelta tai tutkimusryhmästä toiseen siirtyessä.

NOMAD kehitettiin kansainvälisessä yhteistyöprojektissa, jossa CSC oli mukana. Sitä ylläpitää Max Planck Computer & Data Facility (MPCDF). Uusi, suurlaskentaan suuntautuva jatkoprojekti on käynnistymässä.

 

 

NOMAD-arkiston yleisesittely:

 

NOMAD Analytics Toolkit -työkalujen esittely:

 

 

Tutustu CSC:n uusiin datanhallinnan sivuihin ja palvelukatalogiin.

Oletko tekemässä rahoitushakemusta Suomen Akatemialle? Akatemiahakijan tietopaketti kokoaa hyödyllisiä linkkejä uudistetuille datanhallinnan palvelusivuillemme.

 

Kuvat: AdobeStock

Lisää tästä aiheesta » Siirry sisältöihin ja uutisiin »

Tero Aalto

Kirjoittaja on kieliteknologi ja Kielipankin ylläpitäjä.