Jussi Karlgren och Magnus Sahlgren är inga entreprenörer och de ville från början egentligen inte driva företag. Ändå startade de Gavagai som sysslar med något av de hetaste man kan ägna sig åt i dag: Big data.

– Vi är språkforskare och har utvecklat en modell för representation av text i datorsystem. Under åren som vi har arbetat med det här fick vi allt fler förfrågningar från företag som vill använda vår teknik och därför startade vi företaget och började utveckla tjänster på vår modell, säger Jussi Karlgren.

I stora drag handlar tjänsterna om att lyssna på vad som sägs på nätet och dra slutsatser av det. Gavagai är knappast först inom området. Men deras teknik skiljer sig på flera grundläggande sätt.

Till att börja med tar modellen in all information medan andra tar stickprov. Den är också självlärande. Ju mer information den fylls på med desto bättre förstår den olika begrepp och ord. Och just steget från enkla teckensträngar till begrepp, till en modell av språklig mening, är en den grundläggande egenskapen Magnus Sahlgren och Jussi Karlgren har siktat mot hela tiden.

Enkelt förklarat innebär den att en sökning på ”tillit” och ”Juholt” fångar alla uttryck för sådant som hänger ihop med orden, snarare än bara orden och enkla synonymer. Det ger förstås ett mer heltäckande och därmed rättvisande resultat.

– De modeller som används idag för informationshantering och sökrelaterade saker använder kunskap från statistiska och sannolikhetsbaserade modeller eller från mer traditionella lexikon,
ordlistor, och grammatiker. Det kan fungera väl, men om språkbruket förändras eller blir mer spontant och slarvigt kärvar modellerna.