Julkaisut > Tietoyhteys (2002-2008) > HTML-lehdet > Tietoyhteys 3/2008 > Euroopan grid-infrastruktuuri seuraavaan vaiheeseen
 
Tehdyt toimenpiteet

Euroopan grid-infrastruktuuri seuraavaan vaiheeseen

Neljä vuotta pyörinyt EGEE-projekti (Enabling Grids for E-SciencE) on tullut kolmanteen vaiheeseen. EGEE-III -projektin johtoryhmän puheenjohtajaksi valittiin toukokuussa CSC:n ohjelmistopalveluiden johtaja Per Öster. Hänen puheenjohtajuuskautensa EGEE-III-hankkeen parissa kestää kuusi kuukautta.


Per ÖsterCSC:n ohjelmistopalveluiden johtaja Per Österin mielenkiinnon kohteina ovat gridit ja e-infrastruktuurit.


Grid-teknologian avulla tutkijat voivat jakaa erilaisia resursseja ja työkaluja keskenään, eli grid on virtuaalinen työympäristö.

EGEE-projektin tavoitteena on luoda gridinfrastruktuuri Eurooppaan eri alojen tutkijoiden käyttöön. Jo EGEE- ja EGEE-II-hankkeiden aikana EGEEn grid-infrastruktuurista on syntynyt maailman suurin monitieteinen verkosto. Numerotkin todistavat tämän: sadat ihmiset työskentelevät infrastruktuurin parissa 250 eri paikassa 48 maassa. Nämä sijaintipaikat muodostavat yhdessä 60 000 prosessorin laskennallisen tehon ja yli 20 petatavun muistikapasiteetin, jotka ovat noin 8 000 käyttäjän käytössä 24 tuntia vuorokaudessa, seitsemänä päivänä viikossa. Tällä hetkellä EGEE-gridin avulla prosessoidaan keskimäärin noin 170 000 työtä päivässä monien eri tieteenalojen parissa. EGEE-III:n tavoitteena on laajentaa grid-infrastruktuurin käyttäjäkuntaa ja kehittää edelleen sen suorituskykyä ja ylläpidettävyyttä.

Gridiä on käytetty muun muassa lääkkeen
löytämiseksi lintuinfluenssaa vastaan:
grid-teknologian avulla analysoitiin 500 000
lääkkeenkaltaista molekyyliä vain muutaman viikon aikana.


CSC herätti mielenkiinnon

Öster on suhteellisen tuore kasvo CSC:llä: hän aloitti CSC:n ohjelmistopalveluiden johtajana viime vuoden lokakuussa. Hän työskenteli aiemmin Tukholman Kuninkaallisessa teknillisessä korkeakoulussa, PDC:llä, laskentakeskuksen apulaisjohtajana.

– Oli tietenkin hyvin mielenkiintoinen mahdollisuus tulla työskentelemään CSC:lle sellaisen asian parissa, missä on tapahtumassa paljon muutoksia, ja minkä parissa olen työskennellyt paljon – nimittäin e-infrastruktuurien ja gridien kanssa. CSC on paikka, jossa tämä työ tehdään vakavasti, Öster toteaa.

EGEE, hiukkastörmäytin ja Higgsin bosoni tuottavat valtavat määrät dataa

Eräs EGEE-hankkeen lähtökohdista oli erittäinvaikeasti havaittavan hiukkasen, Higgsin bosonin etsintä Cernin LHC-hiukkastörmäyttimen (Large Hadron Collider) avulla. Jos hiukkanen pystytään löytämään, on fysikaalinen massan teoria täydellinen.

LHC-kokeet vievät noin 65 prosenttia
koko EGEE-gridin laskentakapasiteetista.
CSC on yksi paikoista, joissa LHC-törmäyttimen
tuottamaa dataa analysoidaan.


LHC-törmäyttimen odotetaan tuottavan joka vuosi yli 15 petatavua dataa, joka pitää analysoida. Näin suuren datamäärän käsittely vaatii niin valtavaa laskennallista tehoa, ettei sellaista ole olemassa yhdessä laskentakeskuksessa. Gridteknologian avulla tietokoneiden laskennallinen työmäärä on mahdollista jakaa, ja suuren datamäärän prosessointi on mahdollista.

– EGEE-gridin suurin käyttäjäryhmä on tällä hetkellä LHC-hiukkastörmäyttimen ympärillä, Öster kertoo.

Öster puhuu EGEEstä innostuneesti: – EGEE-III-hankkeen aikana kokeet LHCtörmäyttimellä alkavat ja törmäytin alkaa tuottaa dataa. EGEE-gridin avulla tehtävien töiden määrä on noussut hitaasti koko ajan, mutta EGEE-III-hankkeen myötä töiden määrä kasvaa valtavasti, hän kertoo.

LHC-kokeet vievät noin 65 prosenttia koko EGEE-gridin laskentakapasiteetista. CSC on yksi paikoista, joissa LHC-törmäyttimen tuottamaa dataa analysoidaan. Voidaanko CSC:llä siis istua Higgsin bosonin päällä?

– Ei, ei vielä. Mutta myöhemmin tänä vuonna meillä pitäisi olla LHC-törmäyttimen tuottamaa dataa. Osa siitä tullaan analysoimaan CSC:llä, Öster toteaa.

LHC-hiukkastörmäytin on vain yksi EGEEgridin käyttötapa. Gridiä on käytetty muun muassa lääkkeen löytämiseksi lintuinfluenssaa vastaan: grid-teknologian avulla analysoitiin 500 000 lääkkeenkaltaista molekyyliä vain muutaman viikon aikana. Laboratoriossa työ olisi ollut monin verroin hitaampaa. Jos kyseessä olisi nopeasti muuntuva virus, nopeuttaisi grid-teknologia prosessia, ja ajansäästö voisi pelastaa ihmishenkiä. EGEE-gridiä on käytetty myös muun muassa lihassolun rakenteen ymmärtämiseksi, soluprosessien simulointiin, proteiinirakenteiden ennustamiseen, ilmansaasteiden tutkimiseen ja geenitutkimukseen.

Yhteentoimivuus on monimutkaista

LHC-kokeiden alkaminen ja tuotannolliseen vaiheeseen siirtyminen eivät ole ainoita uusia haasteita EGEE-III-projektille.

– EGEE-III-hankkeen myötä grid-infrastruktuuria yhdistetään ja myös valmistellaan seuraavaa vaihetta varten. Meidän täytyy myös valmistautua siihen, mitä kaksivuotisen EGEEIII- hankkeen jälkeen tapahtuu. Tarkoituksena on rakentaa pysyvä grid-infrastruktuuri. Tällä hetkellä niin paljon tieteen tekemisestä on riippuvaista EGEE infrastruktuurista, että meidän pitää löytää sille tapa jatkua. Tavoitteena on rakentaa pysyvä Euroopan laajuinen grid-verkosto kansallisten grid-infrastruktuurien varaan, hän kertoo.

EGEE-gridiä on käytetty myös muun muassa
lihassolun rakenteen ymmärtämiseksi,
soluprosessien simulointiin, proteiinirakenteiden
ennustamiseen, ilmansaasteiden tutkimiseen ja
geenitutkimukseen.


Öster huomauttaa, että siirtyminen intensiivisempään tuotantovaiheeseen sekä kestävän, luotettavan ja skaalautuvan grid-infrastruktuurin luominen ovat projektin suurimmat haasteet. Sitä vastoin hän ei näe grid-teknologian standardoimista ongelmana.

– Ei, standardointi on pikemminkin mahdollisuus. Muun muassa OGF (Open Grid Forum) työskentelee standardoinnin parissa. Teknologian standardointi vaatii maailmanlaajuista yhteistyötä ja kiinnostusta grid-infrastruktuureja kohtaan ympäri maailmaa. Olemme työskennelleet yhteentoimivuuden saavuttamiseksi paljon myös EGEE-hankkeen puitteissa. Se on ollut monimutkaisempaa kuin on odotettu, mutta yhteentoimivuuden jatkuva korostaminen alkaa tuottaa hedelmää.

Öster muistuttaa, että grid-teknologian toteuttamiseksi on olemassa monia tapoja. Teknologian kehittyminen eri puolilla maailmaa on riippuvaista muista teknologioista.

– Kehitystyötä tehdään niin USA:ssa, Japanissa, Aasiassa kuin Intiassakin. Grid-teknologia on kaukana valmiista. Vielä on paljon asioita tehtävänä, hän toteaa.

Supertietokoneet vs. grid-teknologia

Mitä grid-teknologioiden parissa työskentelevä mies ajattelee supertietokoneista?

– On yleinen väärinkäsitys asettaa vastakkain grid-teknologia ja supertietokoneet. Grid on yhdistävä käsite ja hyvin riippumaton siitä, minkälaisia resursseja lopulta käytetään. Olkoon resurssina pieni tietokoneryhmittymä, radioteleskooppi tai supertietokone, on resurssien jakaminen lopullinen tavoite, Öster huomauttaa.

Miltä tulevaisuus viiden vuoden kuluttua näyttää grid-teknologioiden kannalta?

– Nykyään puhumme grideistä, mutta en tiedä puhummeko enää niin paljon grideistä viiden vuoden kuluttua. Päämääränä on luoda verkostoitunut tutkimusinfrastruktuuri tutkijoiden perustyökaluksi. Tämä tarkoittaa sitä, ettei enää mietitä, kuinka teknologiaa käytetään, vaan siitä tulee osa tutkijoiden jokapäiväistä työtä. Tavoitteena on käyttää grid-infrastruktuuria uusien asioiden tutkimiseen eikä niinkään keskittyä teknologian kehittämiseen, hän ennustaa.

On yleinen väärinkäsitys asettaa
vastakkain grid-teknologia ja supertietokoneet.
Grid on yhdistävä käsite ja hyvin riippumaton siitä,
minkälaisia resursseja lopulta käytetään.


– Tutkijat tulevat olemaan täysin riippuvaisia grid-teknologioista. Organisaatioille kuten CSC:lle tämä tarjoaa puitteet tehokkaaseen sovellusten ja työkalujen kehitystyöhön, hän lisää.

Ja lopuksi, kuinka Öster on sopeutunut Suomeen?

– Ruotsalaisena minun oli helppo muuttaa Suomeen. Maat ovat hyvin samankaltaisia. Suomi on kaksikielinen maa ja se tekee asettautumisen tänne entistä helpommaksi, vaikkakin jään paljosta paitsi, kun en osaa puhua suomea. Minulla on tapana sanoa, että puhun vain toista Suomen kielistä, hän naurahtaa. ■

Anni Jakobsson


Mikä on grid?


Tutkijalle grid on infrastruktuuri, virtuaalinen työympäristö, joka mahdollistaa hajallaan sijaitsevien tietoja laskentaresurssien käytön esimerkiksi internetin kautta. Grid yhdistää erilaisia laskentaresursseja, tietovarantoja ja mittalaitteita, joita voidaan koordinoidusti, integroidusti ja joustavasti käyttää yhteisinä voimavaroina.


Lisätietoja
http://public.eu-egee.org/
http://www.csc.fi/csc/tieteen_tietotekniikka/tietoverkot_laitteet/grid