U nastavku donosimo:
- zašto je Anthropic odlučio zadržati svoj novi model Mythos pod ključem unatoč komercijalnoj prilici
- što otkrivaju interni testovi o napadačkim mogućnostima i “svjesnosti evaluacije” ovog modela
- iskustva i stavovi iz industrije kibernetičke sigurnosti te reakcije ključnih igrača
- što znači Project Glasswing i koji su prioriteti globalnog krpanja softvera
- koje dileme otvara buduće puštanje modela baziranih na Mythosu i gdje su granice kontrole nad AI sustavima
Anthropic - autor umjetne inteligencije Claude, na koju je u zadnje vrijeme prešla većina Silicijske doline - ima novi model. Zove se Mythos. Ali ako već trljate ruke i čekate da ga se dokopate, možete slobodno odustati - nećemo ga dobiti, barem ne tako brzo.
Zašto neka tech kompanija kojoj je cilj zaraditi novac ne bi htjela prodavati svoj novi proizvod? Zato što je preopasan, zato što je vijest o njegovim sposobnostima sredinom proteklog tjedna prestravila svakog ozbiljnog stručnjaka za kibernetičku sigurnost na planeti.
Claude Mythos Preview opisan je kao general-purpose model koji je završio fazu treniranja, ali Anthropic nema namjeru pustiti ga u širu javnost. U normalnim bi okolnostima to zvučalo kao uobičajena korporativna opreznost. Ovaj put nije.
Već smo i sami sebi...