Når data-eksperten får sparken
Hele verden mangler dataeksperter. Likevel får de forbausende ofte sparken. Ikke på grunn av manglende dyktighet, men manglende leveranse. Men leveranse av hva - etter hvilken målestokk?
Et tilbakevendende tema her på myMAYDAY.com - spesielt i sfæren rundt AI, ML og data science: Avstanden mellom hype og virkelighet er ofte stor, mens forståelsen for verktøyenes egentlige funksjon og nytteverdi er tilsvarende liten. Det perfekte utgangspunkt for skuffelser, brutte forventninger og profesjonelle nedturer. Selv verdens beste ekspertise kan ikke levere mirakler, og forventningene til ML – skapt av media og entusiastiske salgspresentasjoner – er ofte der, tett opptil det umulige. Utfordringen starter gjerne med (mis)bruken av ordet 'intelligens', som vi diskuterte i Smartest i klassen for en stund siden.
Mange diskusjoner, nedturer og oppturer senere er bildet enda tydeligere: Avstanden mellom forventninger og realisme blir ikke mindre, snarere tvert imot. Vi utdanner en ny generasjon data-spesialister på flere nivåer (se Du kan bli den nye ML-sjefen), mens verktøy og algoritmer gjør små og store kvantesprang, og leverer synlige – noen ganger oppsiktsvekkende – resultater i settinger der forutsetningene er riktige. Dermed fortsetter forventningene å vokse, mens forståelsen og dermed realismen i markedet står nærmest stille. Situasjonen minner om IoT-bølgen for noen år siden: Alle 'bare måtte ha det', uten en klar formening av nytte eller anvendelse.
Et hjertesukk fra en data-ekspert (John Singer) på Quora forleden oppsummerer effektivt våre diskusjoner med spesialister og kundemiljøer den siste tiden.
Han fortsetter med tre karakteristiske problemområder som mange vil kjenne seg igjen i:
- Most companies and industries are not ready for ML. They don’t have the right set of features, have access to the right set of features or even know what features drive their market.
- ML is seen as a magic bullet that can solve anything, which is simply not true. If your feature space is not correlated in someway to the target variable, then no model can have any meaningful predictive power. For example, having a feature such as how many presidents over 50 have won a second term election will be useless to predict who is going to win in 2020. The reason I say this is because those are the types of features that are mostly available, related but not really driving the model.
- Most of the problems that companies want to throw at ML are usually not easy problems. They are usually what we call pie in the sky problems like predicting the stock market.
Siste punkt setter i særdeleshet 'fingeren i såret'. Markedet søker mirakler, tror AI kan fikse hva som helst, ansetter én eller flere data-spesialister – og blir brutalt skuffet. Data-eksperten får sparken og virksomheten er i en 'rykk tilbake til start' situasjon, ofte enda verre fordi verden har gått videre i mellomtiden.
Samtidig - som vi også har diskutert tidligere – markedet trenger mer ML og bedre datautnyttelse. Deler av markedet er avhengig av ML-løsninger forlengst, men vet det kanskje ikke selv – hvilket ironisk nok er det optimale. Situasjonen vi har beskrevet ovenfor oppstår fordi krevende teknologi blir presentert for - og solgt til - et publikum som har minimal forutsetning for å forstå både muligheter og forutsetninger.
Derfor - og her er vårt poeng: Ikke ansett data-spesialister, ansett en 'datasjef'. Om hun eller han kalles CDO, ML-sjef, data-direktør eller noe annet, er mindre vesentlig – det viktige er rollen: En ressurs som forstår både teknologi, data og business – på overordnet nivå. Som kan diskutere muligheter, bygge riktige forventninger, finne partnere, evaluere verktøy og ikke minst – ansette og lede spesialistene.
Legg igjen kommentar
Du må være innlogget for å kunne kommentere.