Najčešće upotrebljavano prezime koje se pojavljuje u hrvatskom nacionalnom jezičnom korpusu jest Račan.
Slijede Mesić, Tuđman i Milošević. Najčešće korišteno muško ime je Ivica, a žensko Marija. Najučestalija psovka kod nas je kurvo, a slijedi je otiđi k vragu. Najčešći glagol je htjeti, a imenica godina.
Ograničen fundus
Dobriša Cesarić čitav je svoj opus stvorio s nešto manje od 10.000 riječi. A fundus riječi zapravo nam je dosta ograničen. Četiri tisuće najčešćih riječi u nekom jeziku pokriva i 80 posto svih tekstova na tom jeziku...
Riječ je o samo nekim od istraživanja vezanima uz jezik, točnije hrvatski jezični korpus, koja možemo pogledati na izložbi u Galeriji Vladimir Nazor.
Autori su jezikoslovac Marko Tadić, profesor na Odsjeku za lingvistiku Filozofskog fakulteta, te Vlatka Kolarović, voditeljica emisije “Drugi format” i urednica Programa za kulturu HTV-a. Riječi je u vizuale potrebne za izložbu pretvorio dizajner Dean Dragosavac Ruta, uz pomoć Marka Matošića.
U opsežnom istraživanju autore je zanimalo kojih deset imenica, glagola, psovki i prezimena najčešće koristimo u svakodnevnoj upotrebi. “Sve što možete pročitati, napisati i izgovoriti u jednoj minuti/jednom satu/jednom danu/jednom mjesecu/jednoj godini i čitavom životu nalazi se na ovoj izložbi”, slikoviti su njezini autori.
200 milijuna
Izložba obuhvaća i povijest istraživanja ovog korpusa, koje datira na kraj 60-ih godina prošlog stoljeća, točnije 1967. godinu kada Željko Bujas radi prvi hrvatski računalni korpus na temelju Gundulićeva “Osmana”.
Izložbom koja traje do 29. ožujka obilježava se 15 godina znanstvenoga rada na Hrvatskom nacionalnom korpusu, a predstavit će se i njegova nova inačica koja se zove HNK v 3.0, i broji 200 milijuna riječi.
Za sudjelovanje u komentarima je potrebna prijava, odnosno registracija ako još nemaš korisnički profil....