Att ett modernt företag ska vara ”datadrivet” är lika självklart som att det ska vara ”digitalt”. Epitetet datadrivet är kanske mer konkret än digitalt, men ändå ganska luddigt.

Frågan är, vad kan en CIO göra för att göra företaget mer datadrivet?
Dataexperten Lars Albertsson har ett förflutet på Google, Spotify och Recorded Future, och driver idag konsultföretaget Mapflat. Här bjuder han på tolv tips.

1 Våga vara visionär
Men kan utgå från att de flesta chefer och affärsansvariga inte har full koll på vilka möjligheter som finns för att använda data i dag. Här har en CIO en given roll – att sprida budskapet. Det handlar inte minst om att informera om tjänster som ter sig lite science fiction-aktiga, men som är fullt möjliga att köpa i molnet – på gott och ont.

– Ett exempel är ansiktsigenkänning. Man kan tänka sig att ha kameror i en butik och analysera folks ansiktsuttryck, för att få en uppfattning om hur olika lösningar tas emot. Om de ser glada ut när man provar en ny skyltning, eller ett nytt reklambudskap.

Läs också: Han lyfter SAS med dataanalys och artificiell intelligens

Det finns ävenmöjlighet att identifiera besökare via wifi och deras telefoner, för att ge personligt utvalda budskap.

2 Glöm inte etiken
Kändes det lite olustigt att läsa om exemplen innan? Tänkte du på filmer som Minority Report? Troligen. Men om den typen av data samlas in måste man ta hänsyn till integritetsaspekten.

Det blir extra viktigt 25 maj 2018 när EUs dataskyddsförordning (GDPR) börjar gälla med dryga böter som påföljd för dem som bryter mot reglerna (upp till fyra procent av omsättningen).
– Sedan finns förstås en allmänt moralisk aspekt på att samla in data om människor.

Ett sätt att komma runt problemen är att använda interna id-begrepp i databaserna – och en tabell med kopplingar till faktiska identiteter för personer. Sedan kan man radera tabellen så att data inte kan kopplas till personer, men ändå ha kvar beteendedata som kan analyseras på anonym gruppnivå.

Som CIO bör du ha koll på detta.

3 Alltid denna säkerhetsfråga
Det är lika bra att beta av de jobbiga frågorna på en gång. Efter att ha funderat på integritetsfrågor ligger det nära till hands att se över säkerhetsfrågorna över lag.

Just säkerhet är extra jobbigt vad gäller många nya lösningar för datahantering. Det finns ett virrvarr av plattformar, ramverk, verktyg och protokoll, vars upphovspersoner har jobbat för högtryck med att få ut lösningar på marknaden. Säkerhetsfrågorna har i de flesta fall inte haft högsta prioritet för dem.

Dessutom öppnar användningen av många olika komponenter i samverkan för en rad nya säkerhetshål. 
– I värsta fall får du en exponentiell ökning av säkerhetsproblemen, jämfört med hur många olika komponenter som används.
 Du måste helt enkelt få ett grepp om det här, eller ta in kompetenta konsulter eller välja paketerade lösningar. Eller både och.

4 Gör datamolnet hanterbart
Att datasjöar (data lakes), molntjänster, nosql-databaser och andra nymodigheter ger flexibilitet är förstås bra. Men alla nya lösningar medför också en uppenbar risk för kaos, eller hög grad av entropi för att använda ett finare begrepp.

Som CIO ska du säkerställa att det görs verktygsval och att processer fastslås, och sedan se till att man gör som man bestämt. 
– Det här gäller övergripande frågor som att ifrågasätta om man verkligen behöver en femte nosql-databas när de fyra som redan används fungerar bra.
 Men det gäller också mer detaljerade processfrågor. Som att bestämma att vissa typer av data som kan kopplas till individer ska raderas automatiskt efter tre månader.

Läs också: Högtryck för digitala privatdetektiver när data blir det nya guldet

5 Effektivisera dina befintliga lösningar
Att bli datadriven handlar naturligtvis inte bara om att vara visionär och tänka ut nya sätt att jobba. Det finns även goda möjligheter att effektivisera de lösningar som finns på plats.
 – Ett sätt att öka verkningsgraden är att arbeta mer agilt och att koppla data till de produkter och tjänster som de används för att göra analyser om. Många innovationsföretag jobbar så, vilket ger kortare ledtider och färre konflikter mellan projekt och avdelningar.

Ett mer agilt arbete gör det också enklare att göra utvärderingar som a/b-tester. Det blir besvärligt att få någon nytta av sådana med långa ledtider för att få tillgång till data.

En aspekt som knyter an till den före­gående punkten är att koppla agilt arbete (för att koda, testa, checka in lösningar och sätta i produktion) till strikt styrning (governance) över den tekniska miljön och processerna.
– Om man inte får ordning på det här kan utvecklingscyklerna lätt ta tio, eller till och med femtio, gånger längre tid än nödvändigt.

6 Infrastruktur som kod
När infrastruktur beskrivs med kod, i stället att baseras på att ny hårdvara installeras, blir det lättare att snabbt skapa nya lösningar. Det i sin tur gör att man snabbare kan få nya lösningar för datahantering på plats. Det sker mycket på det här området just nu. Amazons Cloudformation är ett exempel, Hashicorps Terraform ett annat.

7 Devopstänk förenklar
Att hantera populära tekniska lösningar för datahantering, som Hadoop, är ofta krångligt. I många fall går arbetet smidigare om man anammar en devops-organisation, där gränserna mellan utvecklare och driftspersonal är utsuddade. Det beror på att de olika momenten som behöver utföras ofta är beroende av varandra och ibland representerar rena sammansmältningar av tidigare åtskilda discipliner.

Det finns olika sätt att införa devops. Som CIO bör du vara ledande i att välja väg.

8 Se helheten
Efter att dykt ner i detaljer ett tag är det dags att höja blicken och se helheten. Grovt sett kan arbetet med att hantera data delas in i tre huvudsakliga delar:

  • Samla in data – det kan vara att registrera aktiviteter som användare utför på en sajt, till exempel att klicka på en viss länk. Här handlar det om att skicka dessa data vidare.
  • Hälla ner inkommande data i en datasjö, för förvaring. Då måste det finnas kopplingar, kallas ofta pipelines, till och från lösningar som Hadoop och Spark.
  • Förädla data. När data finns i datasjön kan man filtrera och sammanställa dem, och sedan skicka dem till verktyg som är bättre lämpade för att göra analyser, till exempel traditionella relationsdatabaser.

– Man bör formulera planer och arkitekturer som uppfyller den här helhetsbilden.

9 Gör rätt speciallösningar
De pipelines som används i det andra steget i punkt 8 behöver inte synas utåt, och det finns starka anledningar att skapa dem internt. Lars Albertsson höjer ett varningens finger för färdiga lösningar.
– Det är bättre att skapa en egen optimerad standardlösning baserad på breda komponenter i form av öppen källkod eller molnplattformar, tycker han.

Det är inte läge att trixa med flera speciallösningar, det gör man i stället med fördel i det tredje steget, när data ska förädlas. 
10 Var medveten om undantagen
Det finns naturligtvis undantag från uppmaningarna att standardisera i de två föregående exemplen. Ett exempel kan vara att en grafdatabas lämpar sig väl för en stor del av arbetet.

Läs också: AI den nya länken till användarna – gör tekniken mänsklig

11 Se över det verkliga behovet
Visst ger big data-lösningar nya möjligheter, men hur stor ska en datamängd vara för att den ska vara värd epitetet big? I Sverige idag torde verkliga big data-lösningar vara sällsynta än så länge. Och bland de projekt som dragits i gång finns det garanterat gott om exempel på att man skulle klara sig utmärkt med en gammal hederlig relationsdatabas.

– Det här är viktigt att fundera över, inte minst för att det kan bli oerhört dyrt att hantera tekniska lösningar som Hadoop.

12 håll reda på data
En sak som är lätt att glömma när man kokar ihop spännande nya datalösningar är att varje insamlad databit från användare och kunder kan vara mycket värd. Och ibland sjunker värdet på en stor datamängd snabbt, i takt med att den blir mindre komplett.

Tyvärr är inte alla nya tekniska lösningar alltid tillförlitliga, vad gäller att hålla reda på data. Därför är det viktigt att fokusera på att inte tappa data när man bygger nya lösningar, eftersom det i många tillämpningar aldrig går att återfå förlorade data. Ett typexempel på det här är när data som genereras i kunders smartmobiler ska förflyttas till en datasjö.

En CIO bör alltid fråga sig vad händer ”när servern går ner”.