Klausimų-atsakymų porų tekstyno sukūrimas

Picture1.jpg

Projektas finansuojamas Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ lėšomis“

Projekto aprašymas

Valstybės skaitmeninių sprendimų agentūra įgyvendina projektą „Klausimų-atsakymų porų tekstyno sukūrimas“, projekto kodas – Nr. 02-119-P-0001.

Projekto tikslas – sukurti stambios apimties ir plačios tematinės aprėpties lietuvių kalbos klausimų-atsakymų porų tekstyną, skirtą pokalbių robotų kūrimui ir dirbtinio intelekto technologijų sprendimų poreikiams tenkinti.

Dirbtinis intelektas (DI) kasdien vis labiau paveikia mūsų kasdienybę. Europos, kartu ir Lietuvos, ateitis bei gerovė yra glaudžiai susijusios su duomenų ir technologijų panaudojimu. DI sprendimai gali padėti žmonėms sveikatos apsaugos, transporto, individualių produktų ir paslaugų srityse. Taip pat, gali palengvinti informacijos, išsilavinimo ir mokymų prieinamumą, sumažinti rizikas pavojinguose darbuose, žmones pakeičiant robotais, ir, kartu, sukurti naujas darbo vietas sparčiai augančiame DI sektoriuje.

DI plėtra visaverčiam lietuvių kalbos funkcionavimui skaitmeninėje terpėje kelia naujų uždavinių – reikia kurti galimybes naudotis lietuviška arba sulietuvinta programine ir technine įranga valstybės institucijose ir įstaigose, mokymo ir studijų įstaigose, viešosios prieigos vietose bei užtikrinti DI technologijų pagrindu veikiančių paslaugų prieinamumą visuomenei (rinkoje dominuojantys virtualūs asistentai, kalbos robotai, išmaniųjų namų sistemos ir kt.).

DI, neuroninio šnekos atpažinimo ir šnekos sintezės sprendimams, leidžiantiems mašinai tinkamai generuoti neuroninius balsus, vystyti reikia kokybiškų lietuvių kalbos išteklių.

Projektu siekiama spręsti jų stygiaus problemą, o konkrečiau – sukurti kokybišką stambios apimties ir plačios tematinės aprėpties lietuvių kalbos klausimų-atsakymų porų tekstyną, kurį pasitelkus būtų galima efektyviai kurti kokybiškus dirbtinio intelekto technologijomis grįstus pokalbių bei bendravimo robotus, virtualius asistentus ir išplėstinius vektorizuotus kalbos modelius.

Įgyvendinus projektą bus sukurtas savo apimtimi ir tematine aprėptimi unikalus bei analogų neturintis kalbos išteklius, laisvai ir nemokamai prieinamas visiems, norintiems jį naudoti, kuriant naujomis technologijomis pagrįstus sprendimus, pažangias skaitmenines paslaugas.

Tekstynas leis DI sistemoms mokytis iš įvairių kalbinių modelių, šnekamosios kalbos išraiškų ir kultūrinių niuansų, būdingų lietuvių kalbai. Jo duomenys gali žymiai pagerinti DI gebėjimą suprasti ir atsakyti į užklausas lietuvių kalba, taip užpildydami technologijų ir kalbos spragą.

Šis kalbinis išteklius pravartus tiek viešajam, tiek privačiam sektoriui: gali būti naudojamas tobulinant automatizuotas paslaugas (pvz., savitarnos portalus), kuriant geresnę vartotojo patirtį ir didesnį paslaugų teikimo efektyvumą, pažangius klientų aptarnavimo robotus, sugebančius atsakyti į klientų užklausas lietuvių kalba greitai ir tiksliai, pritaikant sprendimus žmonių su negalia poreikiams ir kt.

Projektu prisidedama prie 2021–2030 metų Lietuvos Respublikos Ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programos pažangos priemonės Nr. 05-002-01-07-08 „Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai ir patogiai naudotis paslaugomis“ veiklos „Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra“ įgyvendinimo.

Bendra projekto vertė931 682,95 Eur (su PVM)
Projekto veiklų įgyvendinimo pradžia2025 vasario 17 d.
Projekto veiklų įgyvendinimo pabaiga2026 balandžio 30 d.
Kontaktinis asmuoArminas Rakauskas, Vaiva Nemanienė

 

 

 

Atnaujinimo data: 2025-02-25