fredag 20 mars 2015

Stor förändring i Googles sökningar och datalänkningen

Jag hade helt missat nyheten som tydligen kom redan i december att Freebase blir read-only redan om några veckor. I stället övergår Google till att använda Wikidata. Det låter kanske fjärran från vår vardag men det är faktiskt en stor sak, tycker jag både principellt och praktiskt. Det påverkar åtminstone alla som använder Google ...

Vad handlar det då om? För några år sedan lanserade Google ett system med semantiskt bättre strukturerad data, Google Knowledge Graph. För användarna märktes detta främst som att Googles sökresultatsida fick en faktaruta till höger. Redan i detta skede var Wikipedia en viktig källa för den information som användes.  Då i form av DBpedia (se bilden nedan). En annan viktig källa var Freebase som Google köpt upp några år tidigare, när man insåg var sökteknikerna är på väg: det blir allt viktigare med semantiskt bättre strukturerad information. Inom Wikimedia hade man också insett detta och startat ett projekt, Wikidata, för att förbättra och berika den enorma mängd data som finns.  Nu har Wikidata blivit så bra att man lägger ner Freebase. I stället ska data föras in i Wikidata.

Både Freebase och Wikipedia har till stora delar gjorts genom crowdsourcing, dvs genom frivilligarbete. Bakom Freebase har det funnits ett företag, medan Wikimedia är en stiftelse. På sätt och vis har nu det "ideella" segrat - å andra sidan kommer Google att få ett större inflytande på innehållet i Wikidata. Det är ett tveeggat svärd. Det kommer säkert att innebära en ännu rikare informationsresurs, men det kommer också att föra oss mot en på sätt och vis mer "entydig" sanning. Trots att både Google och Wikipedia har varit noggranna med att bara koda in "enkla fakta" i sina databaser, har det ändå funnits rum för olika sanningar.

Därför blir det också ännu viktigare att vi vinner användare för andra liknande resurser, s k ontologier. För det finns många, många av dem. För den som vill friska upp sitt minne kring vad det handlar om rekommenderar jag Tim Berners-Lees TED-talk från 2009. Det var han som uppfann webben och i videon förklarar han varför det bara var början och hur man bör gå vidare. Och också gjort. Men den digitala revolutionen är faktiskt bara i startgroparna, trots att den redan skakat om våra liv och vårt samhälle ordentligt.


LOD Cloud 2014

På webben finns i dag mängder av liknande länkade resurser. Här läget 2014.
By Max Schmachtenberg, Christian Bizer, Anja Jentzsch
and Richard Cyganiak (http://lod-cloud.net/) [CC BY-SA 3.0 (http://creativecommons.org/licenses/by-sa/3.0)], via Wikimedia Commons

2 kommentarer:

  1. Om jag förstått det hela rätt så är det egentligen inte så att Google nu skull börja förlita sig på Wikidata för att strukturera sina sökningar. Det är väl mer som så att de mjölkat ur all nytta de kunde få av Freebase som de köpte 2010. Den infp de behöver har de nu införlivat i sin egen Knowledge Graph. Då har de inte längre någon nytta av Freebase, så de lägger ner den. Men de försöker ändå att "don't do any evil", så det ger datat till Wikidata.

    SvaraRadera
  2. Det är väl enklare om de behöver "uppdatera" sina sökningar också bara från en källa, dvs man styr alla att uppdatera Wikidata i stället?

    SvaraRadera