Lietuvių kalbos garsynas (šnekos sintezės tikslams neuroniniams balsams generuoti)

Picture1.jpg

Projektas finansuojamas Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ lėšomis“

Projekto aprašymas

Valstybės skaitmeninių sprendimų agentūra įgyvendina projektą „Lietuvių kalbos garsynas (šnekos sintezės tikslams neuroniniams balsams generuoti)“,  projekto kodas Nr. 02-116-P-0001. 

Projekto tikslas – sukurti lietuvių kalbos garsyną, skirto šnekos sintezės tikslams neuroniniams balsams generuoti ir dirbtinio intelekto technologijų sprendimų poreikių tenkinimui (toliau – Garsynas). 

Projekto rezultatas -  sukurtas Garsynas, skirtas šnekos sintezės tikslams neuroniniams balsams generuoti ir dirbtinio intelekto technologijų sprendimų poreikių tenkinimui. Garsynas bus kompleksinis kalbos išteklius, kurį sudarys pagrindinis ir papildomas emocinis garsynai. 
Šnekos sintezei skirtas garsynas -  aukštos kokybės garsynas, kuris būtinas siekiant sukurti balsus, kurie skamba natūraliai ir gali būti pritaikyti įvairiose srityse – nuo kasdienių užduočių iki specializuotų profesionalių sprendimų. Šio garsyno pagalba galima kurti balsus, kurie skamba natūraliai, aiškiai perteikia informaciją, turi patrauklų tembrą ir yra lengvai suprantami. 
Emocinis garsynas - specializuotas kalbos duomenų rinkinys, skirtas rinkti, saugoti ir analizuoti kalbos įrašus, kuriuose yra aiškiai išreikštos skirtingos emocinės būsenos. Toks garsynas paprastai apima įrašus, kuriuose kalbėtojai sąmoningai išreiškia emocijas, tokias kaip džiaugsmas, liūdesys, pyktis, baimė, nuostaba ir kt. Šie duomenys yra kruopščiai anotuoti pagal emocines kategorijas ir kitus su emocijomis susijusius parametrus, tokius kaip intonacija, tempas, kalbos garsumas ir ritmas. 

Šiuolaikiniame technologijų pasaulyje programinės įrangos kūrimo tempas nuolat įgauna pagreitį, o dirbtinis intelektas (DI) neabejotinai vaidina pagrindinį vaidmenį šiame procese. Kaip šios evoliucijos dalis, koncepcija, žinoma kaip DI papildytas vystymasis, ne tik atspindi tendencijas, bet, visų pirma, yra tikras įrankis, kuris veiksmingai palaiko ir pagreitina modernių programų kūrimo procesą. Ekspertų skaičiavimais, iki 2026-ųjų net 90 proc. interneto turinio bus sukurta DI ar kitu sintetiniu būdu. Visuomenei prieinami sukurti DI sprendimai lietuvių kalba paspartins skaitmeninę visos visuomenės transformaciją: naudojimasis šiomis paslaugomis taps patrauklesnis, jo neribos užsienio kalbų nemokėjimas, o dažnesnis naudojimasis padės visuomenei tobulinti skaitmeninius įgūdžius kasdienybėje.

Visų šnekos atpažinimo ir sintezės, o taip pat susijusių DI, natūralios kalbos apdorojimo ir kitų inovatyvių skaitmeninių technologijų pagrindas yra anotuoti garsynai. Garsynas – fonetiškai reprezentatyvi šnekos duomenų bazė, pritaikyta šnekos (kalbos) technologijoms (pavyzdžiui, šnekos atpažinimui ir sintezei ), susijusių elektroninių paslaugų kūrimui ir teikimui. Anotuotas garsynas – rinkinys, susidedantis iš garso įrašų ir juos atitinkančių tekstinių transkripcijų. Šnekos sintezei skirtas garsynas skiriasi nuo garsyno, kuris kaupiamas šnekos atpažinimo tikslams. 

Projekto metu bus sukurti kompleksiniai kalbos ištekliai, kuriuos sudarys šnekos sintezei ir emocijoms skirti garsynai.

Problemos, kurios bus išspręstos įgyvendinus Projektą:

•    Pagrindinė bendroji Projektu sprendžiama problema – kokybiškų lietuvių kalbos išteklių stygius, kurių pagalba būtų galima vystyti  DI, neuroninio šnekos atpažinimo ir šnekos sintezės sprendimus, leidžiančius mašinai tinkamai generuoti neuroninius balsus;

•    Konkreti Projektu sprendžiama problema – kokybiškų garsynų stygius, kurių pagalba būtų galima efektyviai kurti kokybiškus neuroninius  šnekos generavimo (sintezės) sprendimus, leidžiančius mašinai tinkamai generuoti (sintezuoti) neuroninius balsus bei leidžiančius žmogui bendrauti su mašina žmogui priimtiniausiu būdu – šneka.

•    Įgyvendinus projektą bus sudarytos sąlygos kurti naujomis technologijomis pagrįstus sprendimus, juos diegti kuriant pažangias skaitmenines paslaugas ir teikti šias paslaugas visuomenei, optimizuojant procesus, taupant darbo mokos fondą, kuriant naujos kartos skaitmenines paslaugas, kurios teikiamos žmogui priimtiniausiu būdu – šneka.

Projektu prisidedama prie 2021–2030 metų Lietuvos Respublikos Ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programos pažangos priemonės Nr. 05-002-01-07-08 „Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai ir patogiai naudotis paslaugomis“ veiklos „Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra“ įgyvendinimo.

Bendra projekto vertė

822 790,91 Eur (su PVM)

Projekto veiklų įgyvendinimo pradžia2024 m. vasario 19 d.
Projekto veiklų įgyvendinimo pabaiga     2026 m. balandžio 30 d.
Kontaktinis asmuoGiedrė Jakavičienė

Atnaujinimo data: 2025-02-24