Terminološko svetovanje

Terminološka svetovalnica je namenjena širši strokovni javnosti, ki se sooča s konkretnimi poimenovalnimi problemi, pa naj gre za popolnoma nove pojme, ki jih je v slovenščini šele treba poimenovati, ali že znane pojme, za katere obstaja več poimenovanj. Terminološke odgovore pripravljajo sodelavci Terminološke sekcije Inštituta za slovenski jezik Frana Ramovša ZRC SAZU (in so objavljeni tudi na spletišču Terminologišče), ki pri delu upoštevajo osnovna terminološka načela.
Vprašanje poslano: 09. 04. 2024
Opis terminološkega problema:

Zanima me slovenski ustreznik za angleško zvezo automatic speech recognition, ki označuje tehnologije pretvarjanja človeškega glasu iz zvočne v pisno obliko z uporabo računalniške strojne in programske tehnike. Ali je ustrezneje avtomatsko razpoznavanje govora ali samodejno razpoznavanje govora? Prosim tudi za argumentacijo izbrane različice.

Odgovor:

V več virih smo našli potrditev, da se angleška termina automatic speech recognition in speech recognition uporabljata sinonimno (prim. npr. What is speech recogniton?, članek na spletni strani podjetja IBM; članek Speech recognition, Wikipedia, The Free Encyclopedia, 10. 4. 2024). Za automatic speech recognition se uporablja tudi kratica ASR, ki pa je v določenih kontekstih dvoumna, saj lahko označuje tudi angleški termin advanced speech recognition. V zvezi z razmerjem med daljšo in krajšo obliko termina smo našli tudi pojasnilo, da so pred desetletji s sestavino automatic želeli poudariti, da gre za strojno (in ne človeško) razpoznavanje, danes pa naj bi se pogosteje uporabljal krajši termin speech recognition (L. Tate, The Difference Between Speech And Voice Recognition, blog na spletni strani podjetja Kardome). Kljub temu je videti, da se v angleščini še naprej uporabljata oba termina.

V slovenščini termine, ki označujejo obravnavani pojem, najdemo v več terminoloških slovarjih. V Islovarju je iztočnica razpoznavanje govora z definicijo 'tehnologija, ki govor preoblikuje v napisano besedilo' in ustreznikoma speech recognition in voice recognition (op. opozorimo, da navedena angleška termina označujeta različna pojma oz. dve tehnologiji – pojem, ki ga označuje angleški termin voice recognition, je namenjen identifikaciji govorca, medtem ko je pojem, ki ga označuje speech recognition, namenjen identifikaciji izgovorjenega besedila). Geslo je označeno kot strokovno pregledano. Tudi v Terminološkem slovarju s področja umetne inteligence angleškemu terminu speech recognition ustreza razpoznavanje govora, definicija je 'postopek pretvorbe človeškega govora iz zvočne v pisno obliko', enako je v Večjezičnem glosarju jezikovnih tehnologij (v tem slovarju je opis pojma enciklopedičen, zato ga na tem mestu ne navajamo). V Slovarju družboslovne informatike angleškemu terminu speech recognition ustreza prepoznavanje govora, definicija je 'operacija, s katero naprava govor pretvori v drugo obliko, npr. v tekst ali v ukaz za neko dejanje'. Prav tako je prepoznavanje govora slovenski ustreznik za speech recognition v Računalniškem slovarčku. V iProm slovarju pa najdemo iztočnico samodejno prepoznavanje govora z definicijo '[u]poraba računalniške strojne in programske tehnike za prepoznavanje in obdelavo človeškega glasu. Uporablja se za identifikacijo besed, ki jih je oseba izgovorila, ali za preverjanje identitete osebe, ki govori v sistem.' Za isti pojem torej trije slovarji navajajo termin razpoznavanje govora, dva prepoznavanje govora in eden samodejno prepoznavanje govora.

Najprej se posvetimo jedrni sestavini termina, ki označuje obravnavani pojem, torej razpoznavanje/razpoznava/prepoznavanje/prepoznava. V Korpusu znanstvenih besedil OSS je največ pojavitev z jedrno sestavino razpoznavanje (1072), 398-krat pa se kot jedrna sestavina termina pojavi tudi razpoznava. S terminološkega vidika sta ustrezni obe varianti, a zaradi pogostosti predlagamo, da uporabljate jedro, ki je tvorjeno iz nedovršne oblike glagola (kar pomeni, da je poudarjen proces in ne rezultat), torej razpoznavanje. 618-krat se v korpusu OSS kot jedrna sestavina termina pojavi prepoznavanje, 412-krat pa prepoznava. Glagola prepoznavati in razpoznavati sta si pomensko blizu, lahko se celo uporabljata sinonimno, vendar se je za obravnavani pojem bolj uveljavil glagolnik razpoznavanje. To potrjuje tudi povezani termin razpoznavalnik govora, ki se v korpusu OSS pojavi 194-krat, medtem ko se prepoznavalnik govora pojavi le 6-krat. Če upoštevamo terminološko načelo usklajenosti s pojmovnim sistemom, je torej v tem primeru najbolj smiseln par razpoznavanje govora in razpoznavalnik govora.

Uporabljajo se tudi daljše, tribesedne oblike termina. Kot že omenjeno, se relativno pogosto pojavlja daljša oblika avtomatsko razpoznavanje govora (verjetno neposredno pod vplivom angleškega termina automatic speech recognition) – v korpusu OSS se pojavi 230-krat. Precej redkeje se pojavi samodejno razpoznavanje govora (25-krat). Če tehtamo med tema dvema možnostma, bi vsekakor dali prednost avtomatskemu razpoznavanju govora, ker je pogostejše. Ob množici sinonimov, ki se uporabljajo za obravnavani pojem, ne vidimo nobene potrebe po tem, da bi sestavino avtomatski menjali z domačo sestavino samodejni. Avtomatsko razpoznavanje govora je torej ustrezen termin in ga lahko uporabljate brez zadržkov.

Ker pa raba več terminov za isti pojem ni optimalna, menimo, da je še ustreznejši termin razpoznavanje govora, ki je krajši in se za obravnavani pojem uporablja najpogosteje.

Avtorji: Simon Atelšek, Tanja Fajfar, Mateja Jemec Tomazin, Jera Sitar, Mojca Žagar Karer