Gynybos ir saugumo vienkalbių ir lygiagrečiųjų tekstynų sukūrimas

 Picture1.jpg

Projektas finansuojamas Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ lėšomis“.

Projekto aprašymas 

Valstybės skaitmeninių sprendimų agentūra įgyvendina projektą „Gynybos ir saugumo vienkalbių ir lygiagrečiųjų tekstynų sukūrimas“,  projekto kodas Nr. 02-118-P-0001.  

Projekto tikslas  - sukurti gynybos ir saugumo srities vienkalbius ir lygiagretų tekstynus, skirtus mašininio vertimo sprendimų vystymui ir dirbtinio intelekto technologijų sprendimų poreikių tenkinimui.

Projekto metu bus atliekama veikla - gynybos ir saugumo vienkalbių ir lygiagretaus tekstynų sukūrimas.

Įgyvendinus projektą „Gynybos ir saugumo vienkalbių ir lygiagrečiųjų tekstynų sukūrimas“ (toliau – projektas) šie rezultatai: sukurti 2 vienkalbiai ir 1 lygiagretusis tekstynai lietuvių ir anglų kalbomis gynybos ir saugumo srityje.

Didėjant informacijos kiekiams įvairiomis kalbomis, didėja poreikis tą informaciją suprasti ir patogiai išsiversti. Norint pateikti vartotojams informaciją kitomis kalbomis, reikalingos mašininio vertimo sistemos, gebančios kokybiškai tą informaciją versti (tekstą ir dokumentus) ir turinčios integravimo į institucijų portalus (svetainių vertimas) galimybes. Lokalizavimo įmonės, profesionalūs vertėjai ar valstybinių įstaigų darbuotojai taip pat tobulėja ir savo kasdienėje veikloje vis daugiau naudoja mašininio vertimo įrankius, padedančius versti gerokai greičiau ir patogiau. Šiuo metu institucijos, verslas ir vertimo profesionalai turi ribotas galimybes naudotis nemokamais mašininio vertimo įrankiais. Norint sukurti mašininio vertimo sprendimus naujoms kalboms, reikia rinkti mokymo duomenis, vienkalbius, lygiagrečius tekstynus, terminų duomenų bazes. Numatoma sukurti kalbinius išteklius, skirtus dirbtinio intelekto technologijų sprendimų poreikiams, daugiausia dėmesio skiriant naujiems resursams, kurie būtų skirti kurti naujų kalbų mašininio vertimo sprendimus.  Projekto metu bus nustatyti lygiagrečių tekstų šaltiniai, identifikuoti, surinkti duomenys, jie konvertuojami ir paruošiami tinkamu formatu panaudojimui mašininio vertimo sprendimų kūrimui. Taip pat labai svarbu sukurti įvairioms sritims pritaikytas mašininio vertimo sistemas, todėl tiek duomenų rinkimo, tiek filtrų kūrimo veikla bus sutelkta į skirtingų sričių mašininio vertimo duomenų rinkinių kūrimą.

Problemos, kurios bus išspręstos įgyvendinus Projektą:

  • Pagrindinė bendroji projektu sprendžiama problema – kokybiškų lietuvių kalbos išteklių stygius, kurių pagalba būtų galima vystyti DI, neuroninio mašininio vertimo sprendimus, leidžiančius mašinai tinkamai automatiškai versti tekstus (bendrinės ir specialiųjų sričių) į lietuvių kalbą ir iš lietuvių kalbos;
  • Konkreti projektu sprendžiama problema – kokybiškų vienkalbių ir lygiagrečių tekstynų specialiojoje srityje – gynybos ir saugumo srityje - stygius, kurių pagalba būtų galima efektyviai automatizuoti saugumo ir gynybos srities tekstų vertimą iš lietuvių kalbos ir į lietuvių kalbą pagerinant viešojo sektoriaus procesus, vystyti  mašininio vertimo DI inovacijas, neuroninio mašininio vertimo sprendimus. Sprendžiant šią konkrečią problemą, įgyvendinant Projektą bus sukurti trys saugumo ir gynybos specialiosios srities tekstynai (vienkalbis anglų kalbos tekstynas, vienkalbis lietuvių kalbos tekstynas, lygiagretus anglų-lietuvių kalbų tekstynas), skirti DI ir mašininio vertimo poreikiams.
  • Prisidedama prie lietuvių kalbos išsaugojimą ir gyvybingumą palaikančių skaitmeninių išteklių plėtros. Projekto rezultatai prisideda prie vienos iš problemų, stabdančių skaitmeninę plėtrą Lietuvoje, sprendimo – skaitmeninių kalbos išteklių lietuvių kalba trūkumo. Kuriami vienkalbiai ir lygiagretus tekstynai sudarys galimybę kurti ir plėtoti DI technologijomis grįstus ir automatinio mašininio vertimo sprendimus arba gerinti esamų kokybę;
  • Sudarytos sąlygos kurti naujomis technologijomis pagrįstus sprendimus, juos diegti kuriant pažangias skaitmenines paslaugas ir teikti šias paslaugas visuomenei.

Projektu prisidedama prie 2021–2030 metų Lietuvos Respublikos Ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programos pažangos priemonės Nr. 05-002-01-07-08 „Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai ir patogiai naudotis paslaugomis“ veiklos „Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra“ įgyvendinimo.

Bendra projekto vertė

290396,89 Eur

Projekto veiklų įgyvendinimo pradžia

2025 m. sausio 24 d.

Projekto veiklų įgyvendinimo pabaiga          

2026 m. balandžio 30 d.

Kontaktinis asmuo

Renata Marmienė

 

Atnaujinimo data: 2025-02-10