Kolme uutta GA4GH-standardia tukevat datan saatavuuden automatisointia

Datan saatavuus ja sen skaalautuvuus ovat ratkaisevan tärkeitä, jotta valtava genomitiedon määrä ja tarjolla olevat laskennalliset resurssit saataisiin hyödynnettyä. Maapallolla tuotetun genomitiedon määrä kasvaa eksponentiaalisesti, mikä johtaa datan käyttöpyyntöjen määrän suhteelliseen kasvuun.

The Global Alliance for Genomics and Health (GA4GH) on kansainvälinen konsortio, joka kehittää standardeja genomitietojen vastuuntuntoiseen keräämiseen, varastointiin, analysointiin ja jakamiseen "genomitietojen Internetin" mahdollistamiseksi.

GA4GH-ohjauskomitea on hyväksynyt kolme uutta GA4GH-standardia. Nämä standardit ovat osa laajempaa kokonaisuutta; ne toimivat osana suunnitelmaa, jossa kehitetään yhtenäistä verkkoa vastuullista ja turvallista terveys- ja genomitietojen vaihtoa varten.

Yksi hyväksytyistä standardeista on Data Repository Service (DRS) API. DRS-sovellusliittymä täydentää GA4GH Cloud Work Stream –sovellusliittymiä. Ne toimivat yhdessä auttamalla tutkijoita löytämään pilviympäristöistä algoritmeja, joiden avulla tutkijat voivat analysoida datasettejä.

Kaksi muuta hyväksyttyä standardia ovat GA4GH Passports and Authentication & Authorization Infrastructure (AAI) -määritelmät.  Nämä kaksi standardia toimivat yhdessä tutkijan digitaalisen henkilöllisyyden todentamiseksi luotettavasti ja automatisoimalla tutkijan pääsyä pyydettyihin genomisiin datasetteihin.

Uudet standardit lisäävät tehokkuutta tukemalla tietojen käyttöprosessin automatisointia. AAI luo perustan mekanismille, jolla todennetaan yksilön henkilöllisyys ja valtuutetaan hänen pääsynsä taustalla olevaan tietoaineistoon. Perustuen OpenID-säätiön ylläpitämään OpenID Connect -standardiin, GA4GH: n AAI-määritelmä antaa "käyttöoikeustunnuksen", joka voidaan välittää Internetissä ja asentaa uudelleen seuraavia tietojen käyttöpyyntöjä varten ilman ylimääräistä käsityötä.

AAI tarjoaa mekanismin, jonka avulla käyttäjä tunnistautuu kirjautumalla sisään ja kuljettaen samalla käyttäjän vaatimuksia mukanaan. Passit tarjoavat dataformaatin, jotta nämä käyttäjän vaatimukset voivat muuttua  mm. datasetteihin, käyttäjärooleihin ja resursseihin liittyviksi käyttöoikeuksiksi.

Passports- ja AAI -määritelmät standardisoivat datan saatavuus- ja käyttörajoituksia, tehostavat valtuutus- ja todennusprosesseja ja pyrkivät vähentämään aikaa, joka Data Access komitean (katso video "Why DACs?") on käytettävä tietojen prosessoimiseen ja päätösten tekoon. Ne toimivat yhteistyössä muiden DURI Work Stream -standardien kanssa, mukaan lukien hyväksytty GA4GH Data Use Ontology (DUO).

– Odotamme, että passit ja AAI-määritelmät vievät eteenpäin kehitystä parantamalla datan saatavuutta ja auttamalla Data Access komiteoita ja datapalveluita automatisoimaan prosessinsa, kommentoi Tommi Nyrönen, ELIXIR Finlandin johtaja ja GA4GH DURI Work stream co-lead CSC:ltä.

– Vaikka Data Access komiteat tarkistavat edelleen tiedonsaantipyynnöt, henkilöllisyyden ja käyttöoikeuksien sisällön standardisointi nopeuttaa merkittävästi pyyntöprosessia ja vie meidät lähemmäksi automatisointia. Standardit helpottavat datan jakamista ja saatavuutta ympäri maailmaa, mikä edistää tutkimusta ja yhteistä ymmärrystämme ihmisten terveydestä ja sairauksista.