null Humanisti datailee

Tutkijatohtori Tuomo Hiippala tutkii mm. turistien Instagramiin lataamia kuvia Helsingistä. Kuva: Heta Koski

Humanisti datailee

Heta Koski

Tutkijatohtori Tuomo Hiippala on selvästi innoissaan. Ennen kuin ehtii edes kysyä, hän suoltaa jo kiitosta käyttämälleen CSC:n cPouta-pilvipalvelulle: "Ei tarvinnut täyttää kuin yksi lomake ja yhtäkkiä minulla olikin kaikki tarvitsemani resurssit käytettävissä!"

Hiippala on käyttänyt kannettavaa tietokonettaan tehokkaampaa tietotekniikkaa tutkimuksensa apuna vasta noin vuoden verran, mutta puhuu jo kuin konkari. Äkkiseltään ei uskoisi, että edessä istuu kuitenkin ihan ehta humanisti, joka ei myönnä olevansa kovin kiinnostunut tietojenkäsittelytieteestä, vaikka puheessa soljuvat sujuvasti ohjelmointikielet, serverit ja algoritmit.

Tällä hetkellä Soveltavan kielentutkimuksen keskuksessa Jyväskylän yliopistossa työskentelevä Hiippala on kiinnostunut erityisesti kielen ja kuvan vuorovaikutuksesta erilaisissa dokumenteissa. Vuonna 2013 Helsingin yliopistossa hyväksyttyä väitöskirjaansa varten hän keräsi ainutlaatuisen aineiston, joka on tähän mennessä laajin Bremenin yliopistossa kehitettyä Genre and Multimodality -mallia soveltava aineisto. Avoimesti julkaistu tutkimusdata[1] koostuu Helsingin kaupungin vuosina 1967–2008 julkaisemista matkailuesitteistä, joiden sisältö, ulkoasu, sommittelu ja niiden väliset suhteet on määritelty XML-merkintäkieltä käyttävään tietokantaan.

Konenäköä ja -oppimista

Routledge julkaisi tänä kesänä Hiippalan väitöskirjatutkimuksen pohjalta kirjoittaman kirjan[2], joka käsittelee juuri multimodaalisten dokumenttien rakennetta ja niiden tutkimusta. "Kirja on avuksi tutkijoille, jotka suunnittelevat multimodaalisten korpusten eli kieliaineistojen keräämistä tai tutkimista", Hiippala kertoo. Itse hän sanoo opetelleensa ohjelmoimaan omin avuin, yrityksen ja erehdyksen kautta. Mitä humanisti sitten tekee tieteelliseen laskentaan tarkoitetulla pilvipalvelulla?

"Viimeisimmässä tutkimuksessani sovelsin algoritmia, joka laskee kahden kuvan välistä samankaltaisuutta.  Käytin tätä kaksikielisten tekstien sommittelun analyysiin. Esimerkiksi sijoittamalla kaksikielinen sisältö aukeaman molemmin puolin voidaan lukijaa ohjata jättämään toinen puoli huomiotta, mikäli kielitaito ei riitä molempien ymmärtämiseen. Hypoteesin alkuperäinen esittäjä oli todella mielissään, kun otin yhteyttä ja kerroin, että olin pystynyt tutkimaan tätä myös empiirisesti", Hiippala selvittää.

"Olisin tietysti voinut käydä käsin läpi koko Finnairin asiakaslehdistä koostuvan, 1500 aukeamaa käsittävän aineistoni, mutta tietokoneen on helppo laskea symmetrisyys. Miksi en siis antaisi koneen tehdä sitä puolestani?", Hiippala kysyy. Hänen mukaansa myös tarve ulkopuolisille laskentaresursseille oli ilmeinen – omalla läppärillä parikin tuntia vienyt analyysi sujuu kuulemma CSC:n palvelimilla kymmenessä minuutissa.

Parhaat ideat syntyvät vapaasti kokeilemalla

Parasta cPouta-pilvipalvelussa ei oikeastaan ole edes tehokkaat laskentaresurssit, vaan käytön helppous ja vapaus.

"On mahtavaa, että käyttöönotto on tehty niin helpoksi. Käyttö on yliopistotutkijoille maksutonta ja heti käyttöoikeuksien saamisen jälkeen pääsee kokeilemaan. Olen saanut parhaat ideani vasta käytön aloittamisen jälkeen, kun olen saanut vapaasti testata ja kokeilla ideoitani. Selainkäyttöliittymä on niin joustava, että tuntuu ihan siltä, kuin työskentelisin omalla koneellani – mutta vain todella paljon tehokkaammin", tutkija iloitsee.

Tällä hetkellä Hiippala sanoo ensisijaisesti kehittelevänsä menetelmiä, joiden käyttöä tutkimuksessa on jatkossa mahdollista laajentaa. Jopa paluu vanhaan väitöskirja-aineiston pariin on alkanut houkutella, vaikka hän paljastaakin olevansa usean vuoden jälkeen jo vähän kyllästynyt matkailumainoksiin. Uusilla resursseilla vanhaankin aineistoon voisi kuitenkin löytyä uusia näkökulmia. Konenäön avulla voisi esimerkiksi selvittää nopeasti, näkyykö Tuomiokirkko esitteissä useammin kuin Uspenskin katedraali.

Selfiet Senaatintorilta seuraavaksi tarkasteluun

Seuraavaksi tutkija suuntaa kuitenkin katseensa sosiaaliseen mediaan. Helsingin kaupunki myönsi alkukesästä hänelle apurahan matkailijoiden Instagram-palvelussa jakamien valokuvien analysointiin. Tarkoituksena on selvittää, mitä turistit haluavat näyttää Helsingistä maailmalle.

 

"Otetaan joku kaunis kesäpäivä tai -viikko ja katsotaan vaikka kaikkia Senaatintorilla otettuja ja jaettuja valokuvia. Kuvataanko kirkkoa vai ihmisiä, maisemaa vai selfieitä tai ihan jotain muuta? Aineisto tulee kattamaan tuhansia kuvia", Hiippala kaavailee.

Akateemisen mielenkiinnon lisäksi tutkija näkee konenäön ja humanistisen matkailututkimuksen sovelluksissa myös kaupallista potentiaalia. Ihan kaikkia päässä muhivia liikeideoita hän ei suostu paljastamaan, mutta antaa yhden vinkin: "Menetelmää kehittämällä esimerkiksi matkailijalle voitaisiin uudessa kaupungissa suositella kohteita sen perusteella, millaisia asioita hän on kuvannut kotikaupungissaan."

Siitä vaan, innokkaat ohjelmistoalan start-up-yrittäjät – ottakaa yhteyttä Hiippalaan, hän kertoo varmasti mielellään lisää.