SELECT * FROM Web

Tähän päivään asti minulle on ollut jossain määrin epäselvää se, mitä hyötyä semanttisesta hakukoneesta oikeasti olisi.

Hyvä on, tiedän, semanttisuus mahdollistaa sen, että kone oikeasti ymmärtää tekstien sisällön ja tuottaa sen perusteella relevantteja hakutuloksia. Mutta millä tavalla hakutulokset sitten paranevat? Tosiasia kuitenkin on, että Google toimii aika hyvin. Sanahaun lisäksi se osaa jopa jossain määrin vastata kysymyksiin. Jos tiedustelen, milloin Suomi itsenäistyi, saan välittömästi oikean vastauksen.

Toisaalta monet semanttiseen hakuun liitetyt odotukset ovat ylimitoitettuja. Kone on kuitenkin aina kone, eikä opi täysin ymmärtämään ihmistä. Paraskaan semanttinen hakupalvelu ei osaa vastata, jos siltä kysytään vaikkapa “Millainen olisi minulle parhaiten soveltuva lomamatka?”

Juuri äsken lukemani artikkeli kuitenkin valaisi minulle, mihin semanttista webiä tarvitaan. Sitä tarvitaan, jotta voidaan esittää relaatiokyselyjä webiin. SQL-tietokantakielellä ilmaistuna: SELECT * FROM Web.

Tai oikeastaan juuri nimenomaan tuota kyselyä ei esitetä. Relaatiokyselyjen idea on, että koska kaikki relaatiotietokannassa olevien asioiden väliset suhteet tiedetään, voidaan hakea hyvin eksaktisti juuri halutut asiat, eikä mitään ylimääräistä.

Käytännön esimerkki voisi olla vaikkapa seuraava: “Ketkä kaikki Keskustan kansanedustajat jättivät ilmoittamatta tai ilmoittivat vain osittain eduskuntavaaleihin 2007 saamansa vaalituen määrän.” Tällaiseen kysymykseen ei Google pysty vastaamaan, mutta relaatiotietokannasta tieto löytyy vaivatta.

Tällainen hakukone voisi todella olla Googlen tappaja. Miksei sellaista ole vielä olemassa? Syy ei ole siinä, että hakualgoritmi olisi niin vaikea toteuttaa. Tarvittava hakuteknologia on ollut olemassa jo pitkään.

Ongelma on nimeämisessä. Web on massiivinen tietovarasto, jota ei ole järjestetty millään tavalla. Sen organisoiminen edes etäisesti relaatiotietokantaa muistuttavaan muotoon tuntuu lähes mahdottomalta urakalta, varsinkaan kun nimeämispolitiikasta on vaikea päästä yksimielisyyteen. Tavaraa ja toimijoita on yksinkertaisesti niin paljon.

Silti pikku hiljaa juuri tuota tavoitetta kohti ollaan menossa. Ehkä jo muutaman vuoden päästä pystyn esittämään esimerkkikysymykseni hakukoneelle ja saan tuloksena oikean vastauksen.

Tags: , ,

Comments are closed.