BUDUĆNOST PRED VRATIMA

VELIKA PREKRETNICA U RAZVOJU UMJETNE INTELIGENCIJE Googleov program u samo tri dana sam sebe naučio stratešku igru bolje od najboljeg svjetskog igrača

Aktualni svjetski prvak Ke Jie hvata se za glavu tokom druge od tri partije odigrane protiv AlphaGo Master verzije. Izgubio je sve tri.
 Profimedia, Zuma Press - News

Trenutak u kojem će umjetna inteligencija moći savladati sve vještine potrebne za obavljanje vašeg posla bliže je nego ikad. Googleova tvrtka za razvoj umjetnih inteligencija DeepMind jučer se pohvalila novim prijelomnim uspjehom, koji bi mogao označiti veliku prekretnicu u razvoju opće umjetne inteligencije.

Nakon što je 2015. DeepMindov program AlphaGo pobijedio tadašnjeg svjetskog prvaka u strateškoj igri Go, Leeja Sedola, tvrtka je nastavila testirati svoje algoritme za strojno učenje koristeći istu stratešku igru. Najnovija verzija njihovog programa, AlphaGo Zero, pomela je pod sa svojim prethodnikom, a proces njenog nastanka predmet je znanstvenog istraživanja objavljenog u časopisu Nature.

Lee Sedol izgubio je od originalnog AlphaGoa s 4-1 u partijama, i time barem minimalno osvijetlio obraz čovječanstva. Aktualni svjetski prvak u većini se partija osjećao potpuno bespomoćno, a u jednom trenutku je čak i problijedio i morao napustiti prostoriju, nakon što je AlphaGo odgovorio na potez koji je Sedol tek planirao povući.

Zero je nastao od nule

AlphaGo je nastao iz neuralne mreže koja je prvo analizirala 100.000 partija koje su igrali ljudski profesionalci. Nakon toga je počeo igrati partije sam protiv sebe, kako bi usavršio svoju strategiju. DeepMind je nastavio unaprjeđivati AlphaGo i nakon pobjede protiv Sedola, pa je tako ove godine poboljšana verzija, AlphaGo Master pobijedio i aktualnog svjetskog prvaka 3-0, te više od 60 vodećih igrača te igre.

KAKO JE RAČUNALO UBILO SVJETSKOG PRVAKA U POJAM Pali se zadnje zvono za uzbunu: Dolazi svijet u kojem će ljudski radnici biti suvišni

AlphaGo Zero nastao je, kako mu i ime govori, od nule. Novoj neuralnoj mreži programeri su samo dali osnovna pravila igre, i pustili ga da uči strategije sam od sebe, bez ikakvog uvida u ljudsko iskustvo.

Zero je nakon samo 3 dana učenja postao bolji igrač od originalnog AlphaGo-a, onog koji je pobijedio Leeja Sedola. Zero je dobio 100 partija za redom, bez ijednog poraza. U ta tri dana, Zero je odigrao 4,9 milijuna partija sam protiv sebe. Originalni AlphaGo imao je bazu od čak 30 milijuna partija iz koje je započeo svoje učenje.

Nakon 21 dan Zero je postao uspješniji od Master verzije, a nakon 40 dana postao je jači od svih drugih AlphaGo verzija, i time vjerojatno najbolji igrač igre Go u povijesti.

Osim što ima puno bolje rezultate, Zero je i puno jednostavniji. Sve ranije verzije AlphaGoa oslanjale su se na dvije neuralne mreže - jedna za odlučivanje sljedećeg poteza, te jedna za predviđanje pobjednika na temelju aktualne pozicije na ploči. AlphaGo Zero ima samo jednu neuralnu mrežu zaduženu za obje zadaće.

Više od 20 puta učinkovitiji

Istovremeno, Zero je puno učinkovitiji i što se tiče korištenja procesora. Dok je originalna verzija koristila čak 48 tenzorskih procesorskih jedinica (TPU) - specijaliziranih Googleovih procesora za uporabu u umjetnim inteligencijama - Zero je u stanju postići sve gore navedene rezultate samo s dva.

Posebno je zanimljivo bilo promatrati proces učenja brojnih finesa igre. AlphaGo Zero je u prva tri sata samo nasumično stavljao kamenčiće na ploču, dok ne bi došao do pobjede ili poraza. Umjesto da se fokusirao na dugoročnu strategiju, išao je izravno na brzo skupljanje bodova.

Već nakon 19 sati igranja sam protiv sebe, razvio je napredne strateške koncepte koje su ljudi učili i razvijali stoljećima. Nakon sedamdeset sati već je igrao na nadljudskom nivou.

Novi AlphaGo Zero možda se doima samo kao postupno poboljšanje postojećeg sustava, ali zapravo predstavlja velik skok u razvoju - radi se o prvom sustavu koji je uspio razviti napredne koncepte učeći potpuno sam, bez ikakvog uplitanja ljudi u njegov razvoj. Trenutno ga se koristi za igranje igre jer u njoj postoje poznati i mjerljivi faktori kojima se lako može ocjenjivati uspješnost njegovog učenja, no u vrlo bliskoj budućnosti, ista tehnologija mogla bi nam donijeti znatan napredak.

Osnivač i direktor DeepMinda, Demis Hassabis, rekao je za Verge kako je većina AlphaGo tima sada prešla na druge projekte u kojima će pokušati primijeniti istu tehnologiju na druga područja.

Napredak u stvarnom svijetu

Radi se o stroju koji je iznimno dobar u pretrazi kompliciranih setova podataka. AlphaGo Zero postao je najbolji u pretraživanju potencijalnih poteza u igri Go. No, kako nije napravljen za tu svrhu, već za općenito učenje, može primiti informacije iz brojnih drugih područja: farmacije, kvantne kemije, slaganja proteina, fizike čestica i razvoj materijala, na primjer.

Hassabis vjeruje kako bi nasljednici Zeroa mogli tragati za materijalima koji su supravodljivi i na sobnoj temperaturi. Mogao bi započeti s atomskim sastavima raznih materijala, a završiti sa spojem ili legurom koja ljudima do danas nije pala na pamet.

Vizija Demisa Hassabisa za budućnost njegove tvrtke samo je jednim dijelom šala. Korak prvi je, kaže, riješiti problem opće inteligencije. Korak drugi je - riješiti sve ostale probleme na svijetu.

- Pokušavamo izraditi algoritme za opće potrebe, i ovo je tek jedan korak k tome, ali jedan vrlo uzbudljiv korak, rekao je.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
16. studeni 2024 09:01