Jakaminen mahdollistaa 16 miljoonan rakenteen seulonnan 7 minuutissa

Ruutukaappaus Schrödinger drug discovery suitesta.

Jakaminen mahdollistaa 16 miljoonan rakenteen seulonnan 7 minuutissa

Tietokoneavusteinen tutkimus on olennainen osa lääkekehitystä, ja siihen kuuluu esimerkiksi simulaatioita ja datavetoisia menetelmiä. Biotieteen tutkijat ovat CSC:n asiakaskunnan suurin käyttäjäryhmä. Helppokäyttöiset graafiset käyttöliittymät tarjoavat viimeisimmät välineet yhä kasvavan käyttäjäryhmän käyttöön ja laajat tallennuspalvelut helpottavat tietojen käsittelyä ja ylläpitoa. 

Alan yhteistyön hyötyjä on viime aikoina korostettu covid-19-yhteishankkeissa. Alla kuvattu työ onkin osa Suomen Akatemian rahoittamaa covid-hanketta lääkkeiden uusiokäytöstä. Raakadatan tai esikäsitellyn datan saatavuus voi nopeuttaa tutkimusta merkittävästi, ja seuraavassa kerromme esimerkin Itä-Suomen yliopistosta, jossa tohtori Tuomo Laitinen työskentelee tiiminsä kanssa. 

Schrödinger Shape mahdollistaa nopeamman seulonnan

Lääkesuunnittelun varhaisissa vaiheissa on usein tarpeen seuloa nopeasti suuri määrä molekyylejä, jotta löydetään ne, joita tutkitaan tarkemmin. Nämä seulonnat perustuvat usein molekyylien 3D-geometriaan. Suuri molekyylikirjasto skannataan ja pyritään löytämään samanlaisia molekyylejä kuin ne, joilla on haluttu vaikutus. Perinteisesti tämä on tehty esimerkiksi molekyylien telakoinnin tai farmakoforisten hakujen avulla. Schrödinger on kehittänyt uuden algoritmin, jossa voidaan hyödyntää GPU-suoritinta vastaavanlaisen geometriahaun suorittamiseksi, mikä nopeuttaa prosessia merkittävästi. 

Schrödingerin lääkekehityksen ohjelmisto, joka on kaikkien suomalaisten yliopistojen opiskelijoiden ja henkilöstön käytettävissä akateemiseen tutkimukseen, tarjoaa Shape-nimisen työkalun tähän tarkoitukseen. 

– Pientä molekyylikirjastoa voidaan käsitellä helposti paikallisen kannettavan tietokoneen graafisen käyttöliittymän kautta, mutta jos haluaa seuloa 6 miljoonaa molekyyliä, kannattaa käyttää CSC:n supertietokonetta. Tämän tekeminen tehokkaasti vaatii hieman enemmän, mutta oli ehdottomasti sen arvoista, tiivistää Laitinen.

Kävi ilmi, että kun suuri – ja yleisesti hyödyllinen Molport-kirjasto  – on esikäsitelty käytettäväksi lopullisessa seulontavaiheessa Phase-työkalulla, muita tutkijoita kiinnostavia uusia molekyylejä voidaan käsitellä hyvin nopeasti GPU-suorittimilla.

– Kirjaston esikäsittelyvaiheet vaativat aika paljon työtä. Oikeiden haettavien tekijöiden ja muiden syntaktisten yksityiskohtien lajittelu oli tärkeää, koska kyseessä oli erittäin suuri tietokanta ja päivässä voitiin tehdä korkeintaan kolme ajoa. Koko kirjasto jaettiin sopivan kokoisiin eriin Puhti-supertietokoneen käsittelyä varten. Varsinainen käsittely kesti laskentatunteina lähes kaksi viikkoa, kertoo Arun Tonduru Itä-Suomen yliopiston tiimistä. 

Tohtori Laitinen jatkoi käsittelyä yhdistääkseen tulokset yhdeksi tiedostoksi. 

– Kun shapefile oli lopulta valmis, GPU:lla 16 miljoonan rakenteen (tai 160 miljoonan konformaation) varsinainen seulonta kesti vain 7 minuuttia, Laitinen ihmettelee.

FAIR-jakamiseen kannustetaan

Koska alkuperäinen kirjasto on jo julkinen, esikäsittely ei paljasta tutkimussalaisuuksia, vaan se voidaan – ja tulisi – saattaa muiden tutkijoiden saataville FAIR-periaatteiden mukaisesti. Koska viimeinen varsinainen seulontavaihe on helppo, mutta käsitellyn shape-tiedoston valmistelu on monimutkaisempaa, vaatii moninkertaisesti enemmän laskentaresursseja ja lopputulos vie 139 GB levytilaa, tällaisia tiedostoja kannattaa jakaa!

Tämä ja muut tietoaineistot löytyvät Puhdista, jolla niitä voi käyttää uudelleen: docs.csc.fi/data/datasets

Jos haluat seuloa molekyylisi tätä aineistoa vasten, noudata tätä yksityiskohtaista opastusta siitä, miten se tehdään Puhdissa.

Kirjoittajat

Professori Antti Poso, tohtori Tuomo Laitinen ja tohtori Arun Tonduru ovat Itä-Suomen yliopiston tietokoneavusteisen lääkekehityksen tutkijoita ja Atte Sillanpää CSC:n kehityspäällikkö, taustaltaan kemisti.

Lisää tästä aiheesta » Siirry sisältöihin ja uutisiin »

Antti Poso, Tuomo Laitinen, Arun Tonduru ja Atte Sillanpää