Sobota, 28 marec 2020
Iskanje

»Pomemben del jezikovnega boja za obstanek poteka v digitalnem svetu«

Raziskovalka dr. Špela Arhar Holdt o delu na CJVT in Igri besed

25. feb. 2020 | 9:34
Dark Theme

Ali veste, da bi svoj mobilni telefon lahko uporabili tudi za izboljšanje in utrjevanje slovenskega jezika? Da bi se med vožnjo na avtobusu ali lenarjenjem na kavču lahko preizkusili v Igri besed?

Dr. Špela Arhar Holdt je raziskovalka na Centru za jezikovne vire in tehnologije Univerze v Ljubljani; ukvarja se s korpusnim jezikoslovjem, pripravo jezikovnih virov za slovenščino in uporabniškimi raziskavami. Vse to zveni jezikoslovno manj veščemu bralcu morda zastrašujoče, v resnici pa se za temi dejavnostmi skriva tudi priprava spletne aplikacije Igra besed, v sklopu katere lahko na preprost način bogatimo svoj besedni zaklad, spoznavamo ustrezne sopomenke (to je besede, ki imajo podoben pomen) in kolokacije (to je tiste besede, ki se rade družijo).

Eno od vodil Centra za jezikovne vire in tehnologije, pri katerem ste zaposleni kot raziskovalka, je »za slovenščino želimo vse, kar imajo veliki«: čemu se prvenstveno posvečate?

Razvijamo jezikovno infrastrukturo za slovenščino v digitalni dobi. To morda zveni zapleteno, ampak je v osnovi precej preprosto. Ljudje vedno več nalog rešujemo s pomočjo pametnih tehnologij. S pametnimi telefoni sedaj lahko plačujemo v trgovinah, najemamo električne avtomobile, izdelujemo družinske fotoalbume, vse mogoče. In teh možnosti bo vedno več. V digitalnem svetu pridemo do rezultatov in ciljev tako, da uporabljamo jezik – tako komuniciramo med sabo, upravljamo programe, najdemo informacije. Posledično poteka v digitalnem svetu pomemben del jezikovnega razvoja in tudi jezikovnega boja za obstanek. Če želimo slovenščino uporabljati za vse naštete in prihajajoče naloge, morajo imeti razvijalci tehnologij na voljo digitalni jezikovni opis, učne množice, podatkovne vire, postopke za procesiranje slovenščine, torej vse, kar je na voljo za velike jezike. Vse to je digitalna jezikovna infrastruktura, s tem se ukvarjamo. Borimo se tudi za odprti dostop do te infrastrukture. Da bi imel vsakdo, ki želi razviti nekaj novega, odprto in prosto na voljo podatke tudi za slovenščino, da bi lahko vključil tudi slovenščino. To je zdajle edini način, da gre jezikovni razvoj naprej.

Mobilna aplikacija Igra besed
Mobilna aplikacija Igra besed

Med vašimi najnovejšimi projekti je mobilna aplikacija Igra besed – kako bi jo predstavili potencialnim uporabnikom?

Igra besed je del koncepta »odzivnega slovarja«, ki smo ga razvili na CJVT. Omenila sem, da se močno trudimo za odprti dostop do jezikovnih podatkov. Resnica je taka, da v tem trenutku v Sloveniji s tem zaostajamo in poskrbeti je treba, da bodo podatki čimprej na voljo. Odzivni slovarji, kot sta Slovar sopomenk sodobne slovenščine in Kolokacijski slovar sodobne slovenščine, so naš odgovor na ta časovni pritisk. Odzivni slovar je najprej narejen z avtomatskimi postopki, ki jih jezikoslovci razvijamo v sodelovanju z računalničarji in drugimi strokovnjaki. Kakor hitro presodimo, da je avtomatsko narejeni slovar za jezikovno skupnost lahko uporaben, ga damo prosto na voljo, nato pa ga po korakih izboljšujemo, čistimo, urejamo, pri čemer lahko skupnost tudi sodeluje.

Igra besed vsebuje avtomatsko pripravljene podatke iz naštetih dveh slovarjev, ki so oblikovani v preproste »jezikovne orehe«. Igralci in igralke recimo dobijo besedo, na primer zabava, za katero morajo zapisati tri sopomenke, na primer razvedrilo, žur, praznovanje. Če se sopomenke ne spomnite, vam jo predlaga igra, s čimer lahko nadgradite svoj besedni zaklad. Za tiste sopomenke, ki ste jih zapisali, pa dobite točke in napredujete na tekmovalni lestvici. Bistvo je, da lahko vaše odgovore uporabimo za nadgradnjo slovarja in tudi igre same. Če bo med igro dosti ljudi vneslo sopomenko, ki v slovarju še ne obstaja, jo bomo dodali med podatke, kar bo koristilo vsem.

Več v današnjem (torkovem) Primorskem dnevniku.

Za branje in pisanje komentarjev je potrebna prijava

$tempAlt.replaceAll('"','').replaceAll('<p>','').replaceAll('</p>','').replaceAll('<br>','').replaceAll('<br/>','').replaceAll('<br />','').trim()

Kako doma najraje preganjate čas?

17. mar. 2020 | 16:55
Gledam TV
Berem
Rešujem križanke
Kuham in pečem
Pospravljam
Poslušam glasbo
Se posvečam otrokom
Prikaz rezultatov

Glasovanje zahteva prijavo