Semanttiset hakukoneet tulevat

Puhuttaessa internetin tulevaisuudesta tai “web 3.0″:sta mainitaan usein yhtenä mahdollisena kehityssuuntana siirtyminen kohti semanttista webiä. Tavoitteena on saada hakukoneet todella ymmärtämään, mistä sisällöissä on kysymys, ja saada näin parempia hakutuloksia.

Jo 2004 kehitettiin Swoogle, joka yhdistää Googlen haku- ja pagerank-algoritmien piirteitä semanttisen webin dokumenttien hakuun. Tavalliselle tiedonhakijalle siitä ei kuitenkaan ainakaan toistaiseksi ole paljon iloa, sillä semanttisesti järjestetyn tiedon määrä on vielä melko vähäinen. RDF-muotoisten dokumenttien lukeminen ei myöskään onnistu suoraan selaimella, vaan siihen tarvitsee erillisen ohjelmiston.

Mielenkiintoinen uusi tulokas on israelilainen SemantiNet, joka pyrkii tekemään täysin uudenlaisen, semanttisiin tekniikoihin perustuvan hakupalvelun. Toistaiseksi palvelua ei kuitenkaan ole vielä olemassa, eikä tekniikastakaan kerrota tarkemmin. Yritys sai kuitenkin hiljattain 1,7 miljoonaa dollaria riskirahaa, joten ehkä firma on todella tehnyt jonkin suuren innovaation.

Toisenlaisen lähestymistavan on valinnut Mahalo, joka mainostaa itseään sanoilla “human-powered search engine”. Se ei hyödynnä semanttisen webin teknologiaa lainkaan, vaan sen ytimessä ovat linkit, jotka yrityksen työntekijät ovat merkinneet “hyviksi”. Ideana on suodattaa vähemmän relevantit hakutulokset pois. Esimerkiksi hakiessa tietoja jostakin tuotetyypistä suodattuisivat turhat mainokset pois, ja jäljelle jäisi vain oleellinen. Jos arkistossa ei ole “hyviä” linkkejä haetusta aiheesta, näytetään Googlen ensimmäiset osumat.

Mahalon idea kuulostaa kovin tutulta. Suurin piirtein samalla ideallahan toimii esimerkiksi Yahoo! Directory, joka eli kukoistuskauttaan 2000-luvun taitteessa. Siitä on kuitenkin aika jättänyt. Web laajenee valtavaa vauhtia, joten tarvittaisiin valtava määrä ihmisiä tiedon manuaaliseen organisointiin. Samaan aikaan monet linkit vanhenevat nopeasti, joten tuloksia täytyisi jatkuvasti tarkistaa. Tähän kaatui Yahoo! Directory ja hieman epäilen, että sama kohtalo saattaa odottaa myös Mahaloa.

Jos semanttinen web kiinnostaa, on nyt oiva aika ottaa selvää, missä suomalainen tutkimus on menossa. Viisivuotisen FinnONTO – Suomalaiset semanttisen webin ontologiat -hanke on päättynyt ja sen tulokset julkistetaan perjantaina Semanttinen web kansalliseksi voimavaraksi -tapahtumassa Otaniemessä.

Itse en valitettavasti ole paikkakunnalla enkä siis pääse paikalle. Se harmittaa, sillä olin jo viittä vaille lähdössä mukaan hankkeen toteuttamiseen viime keväänä, kunnes Hongkongin reissu tuli väliin. Odotan kuitenkin mielenkiinnolla, millaisia tuloksia projektissa on saatu ja käynnistääkö hanke mahdollisesti jatkotutkimusta. Toivottavasti. Jos semanttinen web todella on “web 3.0:n” keskeinen elementti, siihen kannattaa panostaa nyt.

Tags: , ,

2 comments

  1. Contact Forumiin voit tulla kyselemään, mitä Sininen Meteoriitti on FinnONTOssa tehnyt :)

  2. [...] Aiemmassa postauksessa käsittelin yhtä mahdollista tulevaisuudennäkymää, semanttista webiä. Samaan aikaan etenee vahvasti myös toinen vallitseva suuntaus, ns. sosiaalinen haku. [...]

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>