Valstybės skaitmeninių sprendimų agentūra įgyvendina projektą „Lietuvių kalbos medicinos garsyno sukūrimas“, projekto kodas – Nr. 02-115-P-0001.
Projekto tikslas – sukurti lietuvių kalbos medicinos garsyną, skirtą kokybiškiems šnekos atpažinimo modeliams parengti ir dirbtinio intelekto technologijų sprendimų poreikiams tenkinti.
Sparti informacinių technologijų plėtra visaverčiam lietuvių kalbos funkcionavimui skaitmeninėje terpėje kelia naujų uždavinių: lietuvių šnekos atpažinimo, sintezės, dirbtinio intelekto technologijų su kalba susijusioms paslaugoms kūrimas, mašininio vertimo ir kt. didžiųjų duomenų analizės tobulinimas, mašininio mokymosi ir neuroninių tinklų pritaikymas kalbos analizei.
Lietuvių kalba yra viena sudėtingiausių, tad ir viena mažiausiai komerciškai patrauklių kalbų. Pasaulyje plėtojamos šnekos atpažinimo sistemos netinka lietuvių kalba valdomų paslaugų kūrimo reikmėms. Lietuvių kalbai, ypač jos taikymui specialiose srityse, tokiose kaip medicina, pritaikytų kalbos technologijų ir susijusių elektroninių paslaugų kokybė gerokai atsilieka nuo užsienyje kuriamų sprendinių.
Visų šnekos atpažinimo ir sintezės, natūralios kalbos apdorojimo ir kitų inovatyvių skaitmeninių technologijų pagrindas yra anotuoti garsynai – fonetiškai reprezentatyvios šnekos duomenų bazės, susidedančios iš garso įrašų bei jų transkripcijų, pritaikytos šnekos (kalbos) technologijoms (pavyzdžiui, minėtam šnekos atpažinimui ir sintezei), skirtos elektroninėms paslaugoms kurti ir teikti.
Norint medicinos praktikoje sėkmingai pritaikyti, pavyzdžiui, šnekos atpažinimo technologijas, reikia garsyno, kuriame atsispindėtų specializuoti terminai, pavyzdžiai, kaip konsultuoja gydytojas, kaip skamba ligos istorija ir pan. Tokio garsyno pagrindu sukurtas šnekos atpažintuvas leistų gydytojui ligos istoriją ne rašyti ranka, o diktuoti žodžiu. Taip būtų taupomas gydytojo darbo laikas, didinamas pasitenkinimas darbu, atsirastų galimybių skirti daugiau dėmesio pacientui.
Medicinos garsynas gali būti panaudojamas ir tobulinant balso terapijas, konsultacijas telefonu, kuriant balso asistentus, mokymo programas medicinos studentams ir specialistams, automatizuojant pacientų aptarnavimo liniją, medicininių ataskaitų sudarymą, bendraujant su kitakalbiais pacientais ir kt.
Įgyvendinus projektą - bus sukurtas lietuvių kalbos medicinos garsynas. Tai unikalus išteklius, kurio analogų lietuvių kalba šiuo metu nėra. Garsynas bus viešai prieinamas ir galės būti panaudojamas kuriant dirbtinio intelekto technologijomis paremtas elektronines paslaugas bei sprendimus.
Projektu prisidedama prie 2021–2030 metų Lietuvos Respublikos Ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programos pažangos priemonės Nr. 05-002-01-07-08 „Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai ir patogiai naudotis paslaugomis“ veiklos „Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra“ įgyvendinimo. |