Pošljite nam svoje jezikovne dileme
Dragi bralci, vabimo vas k soustvarjanju tedenske jezikovne rubrike. Svoje jezikovne dvome nam pošljite na spodnji naslov.
jezik@primorski.eu
Po e-pošti sem prejel vabilo na predstavitev novega orodja STIKit, pa me je pritegnilo ime in me zanima, čemu služi in kaj lahko z njim počnem.
Z današnjim dnem za javnost odpiramo enega svojih projektov in zdaj tudi izdelkov, projekt in korpus STIKit, ki ga na Sloriju pripravljamo v sodelovanju s Centralnim uradom za slovenski jezik in živi na portalu Jezik na klik.
V svojem bistvu je STIKit (ime prihaja iz zveze »slovenščina v stiku z italijanščino«) korpus, torej obsežna zbirka besedil, s katero lahko vidimo, kakšen je jezik v določenem okolju, času, žanru ipd. Vsak od nas namreč govori svojo različico jezika, ki je povezana s tem, od kod prihajamo, kje smo živeli, kje se šolali, kaj nas je zanimalo in kaj v življenju zaznamovalo – ko pa kopico takih zgodb in »jezikov« spravimo v eno samo, organizirano malho, dobimo »jezik« širšega področja, to pa je eden glavnih razlogov, zakaj korpuse sploh gradimo.
STIKit je za razvojni korpus, kar pomeni, da sta v njem zajeti dve različici besedila, izvorno – takšno, kot ga je avtor/-ica zapisal/-a, in končno, tj. takšno, kot je šlo v objavo ali kakšno drugačno rabo. Vmes pa se zgodi pomemben proces, tj. lektura – v lektorski službi Slorija se namreč vsako prejeto besedilo temeljito pregleda, kar pomeni, da se v stotinah, tisočih besedil skriva na tisoče ur dela in kopica znanja, ki smo ga na vsak način želeli izkoristiti in uporabiti, zato smo vsa ta besedila stlačili v spletni pregledovalnik, in sicer tako, da popravljena in izvorna različica živita ena ob drugi. Posledično lahko vidimo, kaj pišoče pri pisanju najbolj tare in s čim imajo največje težave, tako da jim lahko z novimi orodji in publikacijami sploh znamo pomagati in svetovati, zlasti šolarjem. Obenem pa je lektura tudi izjemno pomembna in odgovorna družbena dejavnost, saj posega v eno od temeljnih in intimnih človekovih dejavnosti – izražanje, tako da je edino prav, da je transparentna.
STIKit deluje podobno kot naš Loris, le nekoliko drugače – Loris svetuje na ravni besedil na podlagi vnaprej pripravljenih podatkovnih baz in umetne inteligence, STIKit pa zajema vse podatke o rabi besed v kontekstu, vendar mora o tem pišoči sklepati sam na podlagi povratnih informacij orodja.
Če denimo išče besedo telefonček, orodje STIKit pokaže vse pojavitve te besede v kontekstu, in če je bila ta med lekturo pogosto zbrisana, kar lahko razberemo iz statistike in barvne podobe, ali če je med pripravo korpusa popravek prejel tudi kategorijo, saj je dobršen del popravkov tudi označen s kategorijami, tako da lažje razumemo, kaj se med lekturo najpogosteje dogaja, lahko utemeljeno sklepamo, da je telefonček zaznamovana beseda, vidimo pa tudi, s čim se po navadi zamenjuje (telefon).