Hett: MXNet

MXNet (uttalas ”mixnet”) är ett ramverk för djupinlärning som liknar Tensorflow. Det saknar Tensorflows visuella debuggmöjligheter, men har till skillnad från Tensorflow ett interaktivt programmeringsspråk för tensorberäkningar. MXNet-plattformen parallelliserar automatiskt symboliska och imperativa operationer och ett grafoptimiseringslager ovanpå schemaläggaren gör symbolisk exekvering snabb och minneseffektiv.

MXNet kan idag bygga och träna modeller i Python, R, Scala, Julia och C++. Upplärda MXNet-modeller kan också användas prediktivt i Matlab och Javascript. Oavsett vilket språk du bygger din modell i anropar MXNet en optimerad backendmotor i C++-.

Svalt: Batch-analys

Batchkörningar över natten för att analysera data hör 70-talet till. År 2017 finns det ingen anledning att nöja sig med dagsgamla data.

En del kanske har kvar system ända från 60-talet, och ibland kan det finnas legacysystem som endast kan tugga analyser eller backa upp data nattetid, när de inte används till annat. Men i andra fall jobbar man med batchkörningar utan teknisk anledning, bara av gammal vana.

Du kan bättre! Och din ledning är värd minutfärsk dataanalys.

Läs också: 10 tvärsäkra sätt att misslyckas på it-avdelningen

Hett: Microsoft Cognitive Toolkit 2.0

Microsoft Cognitive Toolkit, även känt som CNTK 2.0, är en verktygssamling för djup­inlärning (deep learning) som beskriver neurala nätverk grafiskt som en serie beräkningssteg. Det har många likheter med Googles Tensorflow och med MXNet, även om Microsoft hävdar att CNTK är snabbare än Tensorflow, har inferensstöd som är lättare att integrera i applikationer och mer effektiva, inbyggda dataläsare som också stödjer distribuerat lärande.

Microsoft Cognitive Toolkit ligger till grund för Microsoft Cortana, Skype Live Translation, Bing och några Xbox-funktioner.

Hett: Scikit-learn

Scikits är Python-baserade verktygslådor, byggda kring Python-biblioteket SciPy för vetenskaplig databehandling. Scikit-learn är ett open source-projekt inriktat mot maskininlärning som är försiktigt med att hoppa på okända algoritmer. Å andra sidan har det ett ganska bra urval av solida algoritmer, och den använder Cython (Python till C-kompilatorn) för funktioner som behöver vara snabba, exempelvis inre loopar.

En del områden som Scikit-Learning inte täcker in är djupinlärning, förstärknings­inlärning, grafiska modeller och sekvens­förutsägelse. Det definieras som i och för Python, så det har inte api:er för andra språk. Scikit-learning stöder inte PyPy, den snabba just-in-time-kompileringen av Python-implementeringen, och inte gpu-acceleration.

Scikit-Learning får höga betyg i tester av maskininlärningverktyg för att underlätta utveckling. Algoritmerna fungerar som de ska och är väl dokumenterade, api:erna är konsekventa och väl utformade, det finns få ”impedansmatchar” mellan datastrukturer och det är ordentligt avlusat från buggar.

Svalt: Caffe

Det en gång så lovande deep learning-projektet Caffe, ursprungligen för bildklassificering, verkar vara på väg ut. Modellerna kräver ofta alltför mycket gpu-minne, och mjukvaran lider av flera år gamla buggar som inte har åtgärdats och dokumentationen är i bästa fall problematisk.

Läs ocksåWindows 7 inte längre på en majoritet av Windows-pc

I april 2017 släpptes äntligen version 1.0, efter flera års kamp med buggiga release-kandidater. Men så sent som i juli 2017 dras Caffe fortfarande med över 500 öppna problem. Projektet tycks ha stannat av medan deep learning-communityn gick vidare till konkurrenter som Tensorflow, CNTK och MXNet.

Hett: Jupyter Notebooks

Jupyter Notebook, ursprungligen kallad IPython Notebook, är en öppen källkod för att skapa och dela dokument som innehåller levande kod, ekvationer, visualiseringar och förklarande text. Det kan användas till datatvätt och transformation, numeriska simuleringar, statistiska modeller, maskin­inlärning och mycket mer.

Jupyter Notebook har blivit den mest populära utvecklingsmiljön för många datavetenskapare och ML-forskare. Det är standardkomponenter på Azure, Databricks och andra onlinetjänster som inkluderar maskininlärning och big data, och du kan även köra dem lokalt. ”Jupyter” är en lös akronym som betyder Julia, Python och R, tre av de populära språk för dataanalys och de första målen för Notebook-kärnor, men idag finns det Jupyter-kärnor i ett 80-tal språk.

Hett: datalagring och analys i molnet

Ett mantra för effektiv dataanalys är ”gör analysen där datan ligger”. Om du inte följer den regeln lär din analys råka ut för stora förseningar om data ska flyttas över lan:et, och ännu större om den ska flyttas över Internet. Det är exempelvis därför Microsoft nyligen lagt till R-stöd till SQL Server.

Eftersom datamängden ditt företag genererar växer exponentiellt, lär inte dina datacenter räcka i längden; du kommer att behöva lägga till molnlagring. Och när dina data är i molnet ska din analys också vara det. Så småningom kommer de flesta nya projekt att ligga i molnet, och befintliga projekt kommer att migreras dit och flytta ditt företag från capex- till opex-världen.

Svalt: månadsvis BI-rapportering

Innan självbetjäningsverktygen inom BI vann mark, var BI en it-fråga. Chefer beskrev vad de trodde sig vilja veta, affärsanalytiker översatte önskemålen till specifikationer, och BI-specialister skapade rapporter för att uppfylla specifikationerna – så småningom, med tanke på eftersläpningstiden.

När en rapport väl hade definierats kördes den månadsvis, i princip för alltid. Alla dessa rapporter landade i chefernas inkorgar den första i månaden, för att beskådas, diskuteras på ledningsmöten och slutligen ageras på eller ignoreras.

I vissa fall kunde åtgärden vara att definiera en ny rapport för att besvara en fråga som tagits upp av en tidigare rapport. Då började en ny cykel, där en ny rapport kunde landa i inkorgen, en eller två månader senare …

Det här förfarandet är ohållbart i längden. Företag som vill vara snabbrörliga och agila kan inte vänta i månader med att svara på omvärlds- och marknadsförändringar: tiden mellan att ställa en fråga och få ett svar bör mätas i sekunder eller minuter, inte veckor eller månader.

IDG News

Sida 2 / 2

Innehållsförteckning