Jylkkäri kokosi datajournalismista kiinnostuneet Opinkivelle tiistaina 20.3.2012.

Julkisia datavarantoja, kuten karttatietoa, kaupunkien budjettidataa ja vaalikonedataa, on viime vuosina avattu verkkoon kaikkien saataville ja jalostettavaksi. Datanavaaminen on synnyttänyt uusia verkkopalveluita ja uutta tietoa. Yksi datanjalostumisen muoto on datajournalismi. Datajournalismista voidaan puhua, kun datasta on kaivettu esiin uutta merkittävää ja kiinnostavaa tietoa, joka puetaan journalistisen jutun muotoon.

Jyväskylän ylioppilaslehti on edelläkävijämediana haistellut mahdollisuuksia tuottaa datan avulla parempaa journalismia. Siksi Jylkkäri kokoaa ympärilleen datajournalismista kiinnostuneiden verkostoa, jossa uuden tiedon tuottamista voidaan tehdä journalistien ja koodaajien yhteistyönä . Verkostoon pääsee mukaan täyttämällä lomakkeen, ja data-ajatusten kanssa voi myös ottaa suoraan yhteyttä toimitukseen.

Päätoimittaja Jarno Liski käynnisteli verkoston kokoamista maaliskuun alussa esityksellään Jyväskylän Instanssi-festareilla.

[youtube]http://www.youtube.com/watch?v=DO2OatsKF-M[/youtube]

Instanssista kutsuttiin koodajapuolen porukkaa Opinkiven datasaunailtaan, joka yhdistettiin Jylkkärin avustajapalaveriin.

Jyväskylä avoimeksi

Datasaunaillassa ideoitiin useita kysymyksiä, joita Jyväskylässä voidaan lähteä selvittämään. Yksi näistä koskee virkamiesvaltaisuuden selvittämistä datan avulla, josta tarkemmin omassa jutussaan.

Lisäksi Antti Poikola on lähettänyt kaupungille helmikuun puolivälissä tietopyynnön budjettidatasta. Vielä dataa ei ole saatu, mutta kaupungin kirjaamosta on luvattu, että asia etenee. Kun data saadaan, se ladataan kansainväliselle OpenSpending-sivustolle, jossa budjetti on helpommin tarkasteltavassa ja anlysoitavassa muodossa.

Budjettidatasta saadaan enemmän irti, kun siitä piirretään esimerkiksi veropuu.

Journalistien pitää oppia datailemaan!

Datajournalismin verkkokursseja vetänyt Poikola on painottanut, että toimittaja, joka ei dataa ymmärrä, ei voi kunnolla tehdä datajournalismia.

”Jos toimittaja ei tajua mitään datasta, hän ei osaa kysyä oikeita kysymyksiä, eikä tiedä mitä sillä voi tehdä”, sanoo Poikola.

Siksi yksi keskeisiä datajournalismin edellytyksiä on toimittajien kurssittaminen datan käsittelyn perusteista. Jyväskylän ylioppilaslehti pyrkii edesauttamaan taulukkolaskennan ja datankäsittelyn peruskurssien pikaista aikaansaamista Jyväskylään, viimeistään syksyn journalismin päivien yhteydessä.

Sitä odotellessa voi tehdä yksinkertaisia verkossa opastettuja dataharjoituksia.

Yksi helppo dataharjoitus on verkostotutkija Kari A. Hintikan opastama omien Facebook-verkostojen visualisointi.

Allekirjoittanut piirteli omat verkostonsa julki aikalailla tasan vuosi sitten.

Jos haluaa olla datajournalismin kentällä kovan tyypin maineen, voi tehdä kuten Jens Finnäs, ja opetella ohjelmoimaan. Poikolan mukaan Finnäs käynnisteli ohjelmoinnin opettelua vielä noin vuosi sitten, mutta piirtelee jo näyttäviä animoituja datavisualisointeja.

Klikkaamalla kuvaa pääset Jens Finnäsin visualisointtin Suomen rikkaimmista ihmisistä.

Ohjelmoinnin opetteluun on hiljattain käynnistetty helposti lähestyttäviä verkkokursseja. Meneillään on esimerkiksi Codecademy-palvelun Code Year, johon osallistuminen on ilmaista, ja sähköpostiosoitteen luovuttamalla saa jokaviikkoisen selaimessa tehtävän javascript-harjoituksen. Koska ohjelmointipiirit on koettu liian miehisinä ja naisille vaikeasti lähestyttävinä, järjestetään myös erityisesti naisille suunnattuja Rails Girls -ohjelmointitapahtumia. Suomessa järjestetään seuraava 9. syyskuuta Helsingissä.

Mistä dataa pyöriteltäväksi?

Vaikka julkisia tietovarantoja ja dataa on avoimesti verkossa jatkuvasti enemmän, suurinta osaa tietovarannoista piilotellaan edelleen viranomaisten ja yritysten arkistoissa. Viranomaisilta toimittaja saa dataa julkisen tietopyynnön avulla. Tietopyyntö vaatii yleensä yhden sähköpostin ja varmistukseksi puhelinsoiton.

Valmiiksi verkossa olevaa dataa löytää muun muassa seuraavista datakatalogeista.

Myös yritykset ovat alkaneet suhtautumaan myönteisemmin rajapintojen avaamiseen omiin tietokantoihinsa. Esimerkiksi Sanoma-konserni on avannut verkkopalvelujensa datoja saataville, kuten Oikotien asuntodataa ja Omakaupungin palvelu- ja tapahtumatietokantoja.

Tietotekniikkataitoiset voivat raapio datansa kasaan avoimesta verkosta. Tähän tarkoitukseen on olemassa muun muassa seuraavia palveluita.

Datanhankintaan voi perehtyä myös viime vuoden datajournalismin päivän luentovideolta.

Datasta journalismiksi

Pelkkä data ja sen visualisointi ei välttämättä ole vielä journalismia. Täytyy olla jokin pointti, minkä takia aiheesta lähdetään tekemään juttua. Kun aihe ja näkökulma on, mietitty on helpompaa rajata, mitä dataa tarvitaan ja mitä tietoa siitä etsitään.

Dataa saatuaan kannattaa ensimmäisenä siivota se. Tähän erinomainen väline on ilmainen Google Refine. Ohjelmalla sotkuisesta ja sekavasta datasta saa nopeasti rajattua ja eroteltua siistimmän koosteen juuri siitä, mitä on etsimässä.

Valmista datapakettia ryhdytään analysoimaan. Yksinkertaista analyysiä voi tehdä jo taulukkolaskentaohjelmilla. Esimerkikis Google Docsin taulukkolaskentaohjelmalla pystyy piirtämään interaktiivia graafeja, joilla datasta saa irti enemmän kuin taulukkomuotoisena.

Taulukkolaskentaohjelma on kuitenkin vain yksi sadoista välineistä, joilla dataa analysoidaan. NICAR 2012 -datajournalismikonferenssissa on juuri koottu kattava lista datajournalismissa käytettävistä työkaluista ja oppaista niiden käyttämiseen.

Kun datasta on saatu irti jokin yllättävä tieto, kannattaa aina varmistaa sen paikkansa pitävyys aihetta tuntevilta ihmisiltä. On hyvin todennäköistä, että joko datassa tai analyysissä on tehty virheitä. Virheet eivät ole traagisia, vaan kuuluvat asiaan. Datajournalismin eetokseen kuuluu, että lähdemateriaalit jaetaan muiden saataville silloin, kun se vain on mahdollista. Tieto jatkojalostuu, eikä toimittajan alkuperäinen näkökulma ole lopullinen totuus.

Katso myös Esa Sirkkusen luento datajournalismista.

Lisää datajournalismista

Facebook-ryhmissä jaetaan jatkuvasti datajournalismiin liittyviä linkkejä, ja ryhmien kautta on nopeinta saada apua käytännön ongelmiin.

Datan avaamista edistävät organisaatiot järjestävät tilaisuuksia ja tarjoavat resursseja aiheesta kiinnostuneille.