NEVJEROJATNO POSTIGNUĆE

PRIJELOMNI TRENUTAK U RAZVOJU UMJETNE INTELIGENCIJE Sad je pobijedila čovjeka i u najsloženijoj igri na svijetu

Starcraft, igrači
 Profimedia, imageBROKER

Grzegorz Komincz, poznatiji kao MaNa, sjedio je pred ekranom u Googleovu londonskom uredu, u desnoj ruci miš, ispod lijeve tipkovnica. Osjećao je nervozu, kao i prije svake velike partije, no i dozu straha od nepoznatog. Jedan od najboljih igrača Starcrafta u Europi, pobjednik dvaju globalnih turnira, spremao se okušati prvi put protiv novog protivnika - umjetne inteligencije AlphaStar.

“Kada igrate protiv drugih profesionalaca, znate protiv koga igrate”, rekao je poslije Komincz. “Razvijete određeni osjećaj za svakog igrača. Ljudi iz AlphaStar tima odmah su mi dali do znanja da AlphaStara nije briga. Da nema nikakve emocije prema meni.”

No tvorci AlphaStara, zaposlenici Googleove tvrtke DeepMind, jedva su susprezali emocije. Desetak članova tima, zajedno s direktorom i glavnim mozgom operacija Demisom Hassabisom, znojilo se u sobi pokraj Komincza, nervozno gledajući prvu partiju svojeg umjetnog “djeteta” protiv 25-godišnjeg Poljaka.

“Izgleda puno samouvjerenije”, komentirao je jedan od inženjera, gledajući Kominczovo lice na jednom od ekrana. Samo tjedan dana prije, u istom je uredu bio Dario Wünsch, alias TLO. Veseli Nijemac odigrao je pet partija protiv AlphaStara i izgubio svih pet. Nakon svake se od srca nasmijao. Iako je i on profesionalni igrač, trenutačno 85. na svijetu po rejtingu gosugamers.neta, sa svojih je 28 godina na zalasku karijere, a rasa koju je igrao u igri - Protoss - nije rasa s kojom inače igra.

Nogometnim rječnikom, to bi bilo kao da iskusnog stopera gurnete na mjesto centarfora. Kada su ga ljudi iz DeepMinda zamolili da im predloži drugog igrača, kojem je Protoss glavna rasa, kao iz topa je izbacio ime momčadskog kolege. “Ovo protiv čega sam ja igrao, MaNa može dobiti bez problema”, rekao je.

Tjedan dana poslije, Komincz je dobio tu priliku. Ali je i AlphaStar dobio još tjedan dana treninga. Pobijedio je najboljeg igrača među DeepMind zaposlenicima, ali nisu ga stigli testirati protiv pravog profesionalca.

Komincz je osjećao velik pritisak. “Predstavljam cijelu Starcraft zajednicu i svoju ekipu, Team Liquid”, rekao je. “Moram ih dobro predstaviti.” Unatoč pritisku, vjerovao je da će pobijediti 5-0, ili možda 4-1.

Identično je predviđanje prije tri godine dao svjetski prvak u igri Go, Lee Sedol, neposredno prije nego što je izgubio četiri od pet partija protiv DeepMindove umjetne inteligencije AlphaGo.

Partija je počela. Sve su emocije nestale s Kominczova lica i ušao je u trans - jedini znaci života bili su nadrealno brzi trzaji prstiju i desnog zgloba. Više od 600 naredbi u minuti - više od 10 klikova u sekundi. Istodobno praćenje tri-četiri složene situacije na nepreglednoj mapi igre. Predviđanje mogućih poteza protivnika, balansiranje dugoročne strategije i hiperaktivne taktike. Sve se jedinice u Starcraftu pomiču istodobno, do 200 njih odjednom. Ne znate što protivnik radi, koji je njegov plan, koja mu je strategija, ako uz sve drugo što radite ne šaljete i izvidnice.

“Mislio sam da imam sve pod kontrolom”, rekao je Komincz. “Izvidio sam što radi, znao sam što mi može spremiti.” Vidio je da mu AlphaStar planira podvalu - pokušao je sakriti par tvornica nedaleko od ulaza u njegovu bazu - no to je strategija koja je rijetko uspješna protiv vrhunskih profesionalaca. Ipak, kada su se prve neprijateljske jedinice pojavile pred bazom, nije mu bilo svejedno - bilo ih je mnogo više nego što je očekivao. AlphaStar je pokušao napad i Komincz ga je uspješno odbio. Odahnuo je. Pokazao je računalu da može obraniti ulaz.

No potom je učinio jednu pogrešku. Jedna je bila dovoljna. “Nisam pazio na ulaz u svoju bazu dok sam napadao njegove radnike. Niti jedan ljudski igrač ne bi samo tako ušetao. Nisam to očekivao.”

“Izgubio sam partiju, ali sam se nasmiješio. Još sam bio dobre volje. Znao sam da sam se mogao obraniti. Moja greška, mislio sam. Jednostavna. Mogao sam pobijediti”, razmišljao je tada. Omelo ga je glasno slavlje iz susjedne sobe kada je predao prvu partiju. Tvorci AlphaStara gotovo su plakali od sreće.

Komincz je izgubio i sljedeću. I onu iza nje. I zadnje dvije. Ogled je završio s 5-0 za računalo. Poljak se nije smijao nakon zadnje, na licu su mu se vidjeli nervozni tikovi. U svakoj mu je partiji presudila vlastita greška. AlphaStar nije griješio.

DeepMind je vjerojatno vodeća svjetska tvrtka u razvoju umjetne inteligencije. Google ju je kupio od njezina direktora Hassabisa prije pet godina, no ostavio je tog genijalnog programera i šahovskog velemajstora na njezinu čelu. U prostorijama u Googleovu uredu na londonskom Kings Crossu danas radi stotinjak vrhunskih svjetskih stručnjaka - najbolji od najboljih u svom polju.


Nakon premoćne pobjede u igri Go prije tri godine, “nišan” su okrenuli prema Starcraftu 2. Radi se o igri koja je neopisivo kompleksnija od šaha ili Goa. Dok u šahu igrači u prosjeku biraju između 40-ak mogućih akcija svaki potez, u Starcraftu je u prosjeku moguće oko 100 kvadrilijuna akcija po “potezu” - to je broj koji iza sebe ima 26 nula. Dok se u Gou igra oko 150 poteza svaku partiju, u Starcraftu se igra 22,4 poteza svake sekunde - toliko često igra registrira nove naredbe. U prosječnoj se partiji od oko 12 minuta odigra više od 16.000 takvih “poteza”. Uz 100 kvadrilijuna mogućih akcija 22,4 puta u sekundi, radi se o zadaći koja ljudski mozak testira do krajnjih granica.

Originalni Starcraft, koji je izišao 1998. godine, prva je igra koja je postala e-sport. Stekla je golemu popularnost među mladima u Južnoj Koreji krajem prošlog stoljeća i ubrzo postala svojevrsni nacionalni sport u toj državi - pokrenuli su se televizijski kanali koji su pratili partije, organizirane su lige, profesionalni timovi sa sponzorstvima i trenerima. Vrhunski igrači tamo su zvijezde koje na ulici potežu za rukave i traže ih autograme.

Danas se diljem svijeta igra Starcraft 2 - nastavak koji je izišao 2010. godine te zadržao svu taktičku i stratešku kompleksnost originala. Iako vrhunski igrači dolaze iz svih svjetskih država, Korejci i dalje apsolutno dominiraju - od najboljih 20 igrača čak 11 su iz Južne Koreje. Najbolji je igrač, doduše, Finac Joona Sotala (Serral), a Poljak Komincz (MaNa) trenutačno je 16. na ljestvici.

Konsenzus je računalnih stručnjaka da je Starcraft sljedeći veliki izazov za umjetnu inteligenciju. Koliko god umjetnoj inteligenciji bilo teško svladati Go, radilo se o igri s vrlo jednostavnim pravilima i ograničenim brojem mogućih poteza, u kojoj su sve informacije o igri dostupne svima - sve se vidi na ploči.

“Starcraft je jedna od najkompleksnijih strategija u realnom vremenu i postavlja goleme izazove u istraživanjima”, rekao je David Silver, jedan od voditelja projekta, i detaljno objasnio razloge.

“Taktička složenost igre je veća od šaha jer svaki potez može pomicati stotine jedinica odjednom; strateška složenost je moguće bogatija i od igre Go, zbog mogućnosti iskorištavanja velikog raspona pristupa, a igrači imaju manje informacija o svojem protivniku nego u pokeru. Sve ove složene odluke moraju se donositi u realnom vremenu, u kojem je bitan svaki djelić sekunde. Znanstvenici koji se bave umjetnom inteligencijom hrvaju se s kombinacijom tih faktora dulje od desetljeća”, rekao je Silver.

DeepMind je uspio riješiti te probleme u samo par mjeseci. “Daleko smo ispred onoga gdje sam očekivao da ćemo biti prije dva mjeseca”, rekao je Hassabis nakon pobjede protiv Komincza.

“Golem je napredak postignut”, složio se i Saša Vrcelj, Hrvat koji je pod imenom SaleSarma nekad bio među boljim hrvatskim igračima, a danas vodi Zagreb 360 Gaming tim. “Najveći problem računala bio je kako smisliti dobru strategiju. Hoće li trenutno pokušati završiti partiju ili će ulagati u budućnost”, pojasnio nam je Vrcelj i dodao kako je u pozornosti i u brzini izvođenja akcija računalo već dugo u prednosti, ali mu to nije pomagalo u borbi s vrhunskim ljudskim igračima.

AlphaStar tim potrudio se što je moguće više ograničiti “klasične” prednosti računala. Ograničili su mu broj akcija u minuti da bude u skladu s akcijama prosječnog ljudskog profesionalca i ograničili vrijeme reagiranja na 350 ms - otprilike trećinu sekunde.

Sama umjetna inteligencija nastala je “od nule”. Djelatnici DeepMinda u svoje su algoritme učitali tisuće snimljenih partija između profesionalaca, iz čega je AlphaStar naučio temelje. Nakon toga, izradili su veliki broj “agenata” - individualnih verzija AlphaStara, od kojih svaki ima malo drugačiju strategiju i prioritete, i pustili ih da igraju jedni protiv drugih - što su u DeepMindu nazvali “AlphaStar ligom”.

Igrali su i učili ubrzano, pa su u dva mjeseca odigrali toliko partija koje bi u stvarnosti trajale 200 godina. Pritom su razvili i potpuno nove strategije koje ljudski igrači nikada nisu isprobali. Nakon treninga na Googleovim specijaliziranim čipovima za neuralne mreže, konačni “proizvod” toliko je jednostavan da mu je dovoljno obično, uredsko računalo.


Posljednja partija u tijeku

Agenti koji su izašli iz AlphaStar lige, koji su pobijedili Wünscha i Komincza, imali su vrlo neobične strategije. Za početak, gradili su mnogo više “radnika” - jedinica za skupljanje resursa - od ljudskih profesionalaca. Vrhunski igrači i matematičari radili su složene elaborate u proteklih deset godina u kojima se u najsitnije detalje računao optimalan broj radnika - sve više od toga je bacanje resursa, bolje je iskoristiti za izgradnju vojnih jedinica ili novih tvornica, vjerovali su. Nakon deset partija protiv AlphaStara, profesionalci sada više vjeruju “intuiciji” računala nego matematičarima.

Broj jedinica koje igrač može imati ograničen je na 200 - više od toga je nemoguće izgraditi. Igrači u pravilu pažljivo planiraju sastav svojih vojski, razmišljaju koji je optimalni broj kojih jedinica za maksimalnu učinkovitost. AlphaStar, s druge strane, kada želi graditi nove jedinice a došao je do limita, ima vrlo praktično i dosta jezivo rješenje. U jednoj od partija komentatori su se šokirali i sledili kada je AlphaStar otvorio paljbu po vlastitoj pješadiji. Nije mu više trebala.

“Impresioniran sam, zaintrigiran i pomalo prestravljen”, rekao je Evan Ballnik, velemajstor i jedan od vodećih online komentatora partija nakon što je odgledao svih deset. “Ovo je bio StarCraft na mnogo višoj razini nego što sam očekivao.”

Najnoviji projekt DeepMinda ponovno je šokirao stručnjake diljem svijeta. Većina je bila uvjerena da će umjetnoj inteligenciji trebati najmanje još nekoliko godina da svlada StarCraft, no Hassabis i njegov tim predani su svojem cilju: “Riješiti problem opće umjetne inteligencije. Potom riješiti sve druge probleme na svijetu”.

Svijet je pun složenih događanja s velikim brojem relevantnih varijabli koje nam nisu poznate. Od prognoze vremena do kretanja na burzi, ljudi su dosad bili dosta neuspješni u točnim predviđanjima. Iako ljudski algoritmi mogu predviđati dugoročne trendove, dnevna kretanja, poput toga hoće li padati kiša ili neće, često predviđamo s preciznošću jedva većom od nasumičnog bacanja kockica. Neuralne mreže temeljene na AlphaStar tehnologiji vrlo će vjerojatno znatno nadmašiti ljudske rezultate u tim i mnogim drugim poljima.

AlphaStar još nije gotov, rad na njemu se nastavlja. StarCraft 2 igra je u kojoj postoje 3 rase, međusobno potpuno različite po stilu igre i dostupnim građevinama i jedinicama, a sadašnja verzija u stanju je igrati samo kao Protoss protiv igrača koji je također Protoss. Namjerna asimetrija između rasa jedan je od glavnih razloga zašto je igra zanimljiva promatračima - svaki igrač mora praktički naučiti igrati tri različite igre - jer su različite strategije učinkovite protiv različitih rasa.

Agenti koji su pobijedili Wünscha i Komincza imali su i još jednu, malu ali osjetnu prednost - nisu morali pomicati “kameru” - držati fokus na jednom dijelu mape kako bi ondje zadavali naredbe.

Prije dva tjedna Komincz je dobio priliku uzvratiti udarac verziji AlphaStara koja je morala sama pomicati kameru. Iako su iz DeepMinda tvrdili kako je novi agent samo malo slabiji od prethodnog, Komincz je konačno upisao prvu pobjedu.

“Znao sam da će mu morati dati nekakve prednosti”, rekao nam je Vrcelj. “Mislio sam da će ta prednost biti puno veća, no nije toliko velika koliko sam očekivao.” Već sljedeće godine, procjenjuje Vrcelj, AlphaStar bit će u stanju pobijediti bilo kojeg čovjeka i bez ikakvih prednosti. “Kada to bude u stanju, od tog trenutka trebamo se bojati umjetne inteligencije”, zaključio je.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
06. listopad 2024 18:09