‘Najseksi posao‘

Pomama tvrtki za jednim zanimanjem: Potražnja je duplo porasla, a plaća im ide i preko 2500 eura

Ovi stručnjaci koriste tehničke vještine, statističku analizu i programersko znanje kako bi razumjeli podatke
 Pexels

Ugledni časopis Harvard Business Review je još prije deset godina objavio proročanski članak u kojem su rekli da je najseksi zanimanje 21. stoljeća takozvani data scientist. Na hrvatskom ovo zanimanje zovemo podatkovni znanstvenik, što na prvu možda i ne zvuči toliko seksi, no očekuje se da će vrijednost globalnog tržišta podataka narasti s 11.3 milijardi dolara u 2019. godini do 42.7 milijarde ove godine. Traženost podatkovnih znanstvenika je od 2009. do 2019. porasla za 256 posto, dok američki Ured za radnu statistiku predviđa da će do 2029. interes za ovim vještinama imati veći rast no što ga je bilježilo bilo koje drugo područje. Potražnju za zanimanjem prati i pošten iznos plaće, a ona u Hrvatskoj prema podacima portala MojaPlaća ide i preko 2500 eura.

Pa, tko je podatkovni znanstvenik zapravo?

To je stručnjak koji koristi svoje tehničke vještine, statističku analizu i programersko znanje kako bi dubinski razumio podatke, a onda na temelju njih razlučio uzorke, pa i donosio odluke ili pak trenirao umjetnu inteligenciju da za njega obavlja zadatke. Podatkovni znanstvenici koriste alate i tehnike poput strojnog učenja, analize podataka, obrade podataka i vizualizacije podataka kako bi istražili informacije i stvorili modele koji mogu predviđati ponašanje ili donositi zaključke iz podataka. Njihova znanja i vještine mogu biti važni u cijelom nizu industrija i zanimanja, a zbog toga ih trebaju brojne branše: od tehnoloških divova i manjih tvrtki, preko banaka i financijskih institucija, pa do bolnica i farmaceutskih tvrtki, telekomunikacija, medija, istraživačkih organizacija, vlade i javnog sektora.

Springboard vrlo slikovito objašnjava kako to izgleda u praksi: Streaming servis za gledanje filmova i serija prije Božića objavljuje hrpu božićnih filmova, a odabire ih na temelju analize podataka koji pokazuju koje sažetke filmova publika čita, koliko vremena provodi čitajući naslove, što gleda i koliko dugo. Jednom kad su skupili i analizirali podatke (uz pomoć umjetne inteligencije), pokušavaju predvidjeti ponašanje svoje postojeće i potencijalne publike te ih navesti na to da se pretplate na uslugu i što više vremena provode na platformi. Streaming servisi, dakle, na temelju rastumačenih podataka definiraju trendove, stvaraju marketinške strategije, optimiziraju način rada i donose velike poslovne odluke.

Ušteda vremena

Ivan Maglić, direktor ureda vodeće svjetske analitičke tvrtke Gartner, kaže kako data scientisti koriste AI u svrhu brže i kvalitetnije analize podataka, prepoznavanja uzoraka i procjene mogućih rezultata u slučaju poduzimanja konkretnih akcija i promjena niza parametara.

- Vrlo je važno znati kako promjena nekog od poslovnih pokazatelja utječe na ukupan rezultat i druge indikatore poslovanja. Primjerice, neke tvrtke koriste algoritme strojnog učenja kako bi iz ogromnog broja poslovnih transakcija izdvojile one koje zahtijevaju dublju analizu. Na taj način smanjuju ukupno vrijeme kontrole/revizije, ali i povećavaju vjerojatnost da lociraju potencijalno "sumnjive" događaje i poduzmu adekvatne akcije – objašnjava direktor Maglić.

image

Ivan Maglić, direktor ureda vodeće svjetske analitičke tvrtke Gartner

Hup Ict

Stručnjaci za obradu i analizu podataka u tvrtkama obično surađuju s kolegama iz svih drugih poslovnih sektora, od prodaje, financija, nabave, marketinga i proizvodnje pa sve do uprave.

- Primarna je uloga i cilj osigurati točnost podataka i pravovremenu dostupnost. Vrlo često imamo situacije u kojima se podaci pojedinih sektora razlikuju i uloga tima je upravo u tome da se obradom podataka dođe do provjerenih i točnih informacija nužnih za donošenje poslovnih odluka i to postaje sve kritičnije s obzirom na pouzdanost informacija, ali i brzinu raspoloživosti – tumači Maglić.

Suradnja s pravnicima

Vrlo važno za podatkovne znanstvenike je da oni najčešće rade u primjeni umjetne inteligencije. Ona je njihov najvažniji alat. Jedan od ljudi koji u praksi rade ovaj posao je Matej Gjurković, zaposlen na zagrebačkom Fakultetu elektrotehnike i računarstva u Laboratoriju za analizu teksta, ujedno suosnivača startupa Semadot i Ulpian, koji su specijalizirani za konverzacijske semantičke pretraživače. Njihova napredna tehnologija omogućuje korisnicima da brzo i jednostavno pronađu potrebne informacije upitima na razgovornom jeziku, bez potrebe za pretraživanjem stranica nepovezanih rezultata. Gjurković sa stručnjacima za politiku i komunikaciju u sklopu projekta Adria Digital Media Observatory istražuje dezinformacije u hrvatskom javnom prostoru, a u sklopu Ulpiana surađuje s pravnicima, s kojima radi na pravnom savjetniku temeljenom na umjetnoj inteligenciji. Gjurković zapravo svakodnevno istraživački i praktično radi na obradi jezika. Objašnjava nam kako taj posao izgleda u praksi.

image

Matej Gjurković, suosnivač startupa Semadot

Saša Ćetković

- Najprije treba identificirati koji podaci su potrebni da bi se odgovorilo na istraživačko pitanje ili da bi se napravio sustav koji će riješiti zadani problem. Nakon toga se pristupa prikupljanju podataka. U mojem primarnom istraživačkom području prepoznavanja crti ličnosti na temelju teksta su to podaci s društvenih mreža ili podaci prikupljeni kroz sustave za testiranje. Na projektu u sklopu kojeg se bavimo prepoznavanjem tvrdnji vrijednih provjere u kontekstu širenja dezinformacija, prikupljaju se podaci s hrvatskih novinskih izvora. U drugom slučaju, kod razvoja pravnog savjetnika temeljenog na umjetnoj inteligenciji, čime se bavi moj startup, prikupljaju se tekstovi zakonskih propisa – objašnjava nam, dodajući da za prikupljanje tako različitih podataka koristi programski jezik Python, programske pristupne točke servisa (primjerice, društvenih medija), takozvano scrapanje ili prikupljanje putem posjećivanja web stranica kao što to rade tražilice poput Googlea. Nakon identifikacije podataka, treba ih obraditi, pročistiti ih i izvući strukturirane informacije.

- Primjerice, u novinskim tekstovima to mogu biti datum objave i autor ili neki događaj spomenut u tekstu članka – kaže Gjurković.

Projekt osmišljen za suradnju znanstvenika i tvrtki

Gjurković je sjajan primjer toga da je suradnja znanstvenika i poduzetnika ključna za napredak, inovacije, rješavanje kompleksnih problema te komercijalizaciju znanosti, što na koncu rezultira pozitivnim promjenama u društvu i ekonomiju. A jedan korak prema tome da takve suradnje sve češće postanu svakodnevica svakako je novi projekt Scinergy.

Radi se o inicijativi koja će tvrtkama svih veličina i vrsta djelatnosti omogućiti besplatan ekskluzivan pristup vrhunskim znanstvenicima s najprestižnijih znanstvenih institucija. Ideja je upariti ih tako da se potrebe tvrtke i ekspertiza znanstvenika najbolje podudaraju, s ciljem rada na zajedničkim projektima, kako bi tvrtke razvijale svoje proizvode ili usluge i unaprjeđivale svoje poslovanje, postale inovativnije, a znanstvenici svoje istraživačke radove i ekspertizu pretočili u stvarnost.

Znanstvenici i tvrtke mogu se prijaviti na projekt do 28. siječnja, a sudjelovanje je i za tvrtke i za znanstvenike besplatno. U okviru projekta uparene tvrtke i znanstvenici dobivaju potrebnu edukaciju, vođene sastanke, pomoć u strukturiranju i razvoju suradnje, uvid u mogućnosti za financiranje suradnje i slično, a projekt im, među ostalim, može donijeti prilike za testiranje i razvoj novih proizvoda, pronalazak partnera za prijave na druge projekte i veću vidljivost.

Projekt provodi Inovacijski centar Nikola Tesla (ICENT) uz podršku Ministarstva znanosti i obrazovanja, a riječ je inače o pilotu globalnog projekta Europske komisije koji koordinira Svjetska banka u suradnji s međunarodnim partnerima London Business School (LBS) i Massachusetts Institute of Technology (MIT).

Jednom kad Gjurković i njegovi suradnici pročiste podatke, onda se pristupa statističkoj analizi da bi se dobio osjećaj o tome što podaci od interesa sadrže, koliko ima kojeg tipa podataka koji ujedno i služe potvrdi da nije došlo do greške prilikom prikupljanja podataka.

- Iako se često radi o skupovima podataka od desetaka milijuna zapisa, obavezno pročitam uzorak tekstova da bih dobio dodatan osjećaj o tome što skup podataka sadrži i na koja se pitanja uopće može očekivati dobiti kvalitetan odgovor ili dizajnirati sustav koji će riješiti problem – govori.

Njegovo je zanimanje sjajan primjer toga zašto je umjetna inteligencija vrlo korisna. Ljudski jezik je iznimno kompleksan te se pokazalo da je nemoguće sve izuzetke i varijacije pokriti skupom pravila. I tu ulijeće AI.

- Strojno učenje nam omogućuje da u velikim količinama nestrukturiranih tekstova pronađemo uzorke koji onda predstavljaju izvor signala za rješavanje određenih problema te ih prikažemo na strukturirani način, kao u Excel tablici. Problemi kojima se bavim tipično su složeni te se njihovo rješavanje sastoji od korištenja više ulančanih modela strojnog učenja - govori stručnjak.

Primjerice, ako žele procijeniti ličnost osobe koja je napisala tekst na društvenoj mreži, mogu gledati stil pisanja ili sadržaj poruke. Stil pisanja ovisi i o izboru riječi pa tako mogu koristiti model strojnog učenja za označavanje sintaktičkih kategorija da bismo vidjeli koje pridjeve osoba koristi češće od drugih osoba.

Procjena ličnosti autora

- S druge strane, možda nas ne zanima stil pisanja već sadržaj i značenje onoga što je osoba napisala. U tom slučaju možemo koristiti model koji kodira semantiku ili značenje teksta bez da osobni stil i izbor riječi ima utjecaja. Takve tehnike nam omogućuju razvoj alata kojima možemo detektirati dijelove teksta u kojima osoba opisuje svoje karakteristike ličnosti, a ne nečije tuđe. Njihovim objedinjavanjem i analizom moguće je procijeniti ličnost autora teksta. Ako pri tome imamo rezultate psiholoških tekstova možemo direktno istrenirati model koji predviđa ličnost na temelju tekstova – kaže o nevjerojatnim mogućnostima ovih alata.

Iako su već sada moćni, Gjurković ističe kako je AI tek u svojem začetku - nešto slično onome što je internet bio 90-ih godina prošloga stoljeća - te smatra da će u nadolazećem vremenu ona promijeniti skoro sve grane ljudske djelatnosti. Data scientisti će tu igrati veliku ulogu. Njihovo znanje postajat će sve važnije cijelom nizu (ne)komercijalnih branši, što će ubrzati i već rastući veliki trend zajedničkog rada znanstvenika i poslovnjaka.

Sponzorirani sadržaj nastao u suradnji Native Ad Studija Hanza Medije i ICENT-a.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
11. studeni 2024 21:22