Melagingos informacijos automatinio identifikavimo tekstyno sukūrimas
Projektas finansuojamas Ekonomikos gaivinimo ir atsparumo didinimo plano „Naujos kartos Lietuva“ lėšomis“
Projekto aprašymas | |
Valstybės skaitmeninių sprendimų agentūra įgyvendina projektą „Melagingos informacijos automatinio identifikavimo tekstyno sukūrimas“, projekto kodas Nr. 02-104-P-0001. Projekto tikslas - sukaupti lingvistinius resursus ir sukurti išsamų anotuotą skaitmeninį kalbos išteklių, reikalingą kuriant ir vystant dirbtinio intelekto technologijomis grįstus sprendimus, kurie gebėtų automatiškai atpažinti klaidinančią informaciją interneto žiniasklaidos medijų tekstuose. Lietuvoje šiuo metu yra neišnaudojamos turimos valstybės skaitmeninimo galimybės, nesudaromos sąlygos kurti naujomis technologijomis pagrįstus sprendimus, juos diegti kuriant pažangias skaitmenines paslaugas ir teikti šias paslaugas visuomenei. Dirbtinio intelekto (DI), natūralios kalbos apdorojimo ir supratimo, mašininio mokymosi ir kt. inovatyvių sprendimų, kurie būtų susiję su pažangiomis neuroninėmis lietuvių kalbos technologijomis, plėtra Lietuvoje yra sunkiai įmanoma, nes nėra pakankamos apimties ir tinkamų lietuvių kalbos duomenų rinkinių – anotuotų tekstynų, tekstynų ir vektorizuotų modelių. Lietuvių kalba dėl savo specifinių savybių (sintetinė, morfologiškai turtinga, lanksti) turi menkas galimybes pasinaudoti kitų kalbų automatinio apdorojimo priemonėmis. Neuroninės kalbos technologijos Lietuvoje naudojamos minimaliai dėl technologijų trūkumo, tuo tarpu kalbos technologijų paklausa yra didžiausia tose rinkose (arba kalbose), kuriose plačiai (visuose sektoriuose ir visose srityse) prieinamą prie paslaugų ir procesų skaitmenizavimo balso. Iš vienos pusės, kyla grėsmė, kad lietuvių kalbą el. erdvėje ir viešosiose paslaugose išstums sprendimai kitomis kalbomis. Iš kitos, neturint efektyvių automatinių melagienų/dezinformacijos atpažinimo priemonių lietuviška auditorija tampa lengvu melagienų ir hibridinio karo vykdytoju taikiniu, nes prie dabartinių informacinių srautų jų kontrolė vien rankiniu būdu jau tampa neefektyvi. Šiandien dėl technologijų plėtros ir spartaus interneto ne tik gerokai padidėjo pasiekiamų žinių kiekis ir įvairovė, bet ir iš esmės pasikeitė būdai, kaip piliečiai jas gauna ir naudoja. Internetinė žiniasklaida tapo pagrindiniu informacijos šaltiniu, ypač jaunesniems vartotojams. Įvairi ir lengvai prieinama kokybiška informacija galėtų piliečius dar labiau įtraukti į demokratinius procesus ir paskatinti juose dalyvauti. Tačiau naujos technologijos būna naudojamos ir melagingai informacijai skleisti, ypač per socialinę žiniasklaidą, ir tai daroma dar neregėtu mastu, greičiu ir auditorijos pasirinkimo tikslumu: dezinformacijos kampanijų tikslais sukuriami individualizuoti informaciniai laukai ir galingi dezinformacijos didinimo mechanizmai. Melaginga informacija sparčiai plinta dėl tarpusavyje susijusių ekonominių, technologinių, politinių ir ideologinių priežasčių. Informacija interneto žiniasklaidos pagalba plinta labai greitai ir pasiekia didelę skaitytojų auditoriją, todėl labai svarbu užtikrinti, kad visuomenė gautų teisingą, pagrįstą informaciją. Šiuo Projektu bus prisidedama sprendžiant pagrindines problemas, kurios stabdo skaitmeninę plėtrą Lietuvoje – skaitmeninių anotuotų kalbos išteklių lietuvių kalba stygių. Įgyvendinus Projektą bus pasiektas rezultatas – sukurtas naujas lietuvių kalbos išteklius - Melagingos informacijos automatinio identifikavimo lietuvių kalbos tekstynas. Kuriamas Melagingos informacijos tekstynas sudarys galimybes:
Projektu prisidedama prie 2021–2030 metų Lietuvos Respublikos Ekonomikos ir inovacijų ministerijos valstybės skaitmeninimo plėtros programos pažangos priemonės Nr. 05-002-01-07-08 „Kurti technologinius sprendimus ir įrankius, leidžiančius saugiai ir patogiai naudotis paslaugomis“ veiklos „Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra“ įgyvendinimo. | |
Bendra projekto vertė | 4 513 298,30 Eur (su PVM) |
Projekto veiklų įgyvendinimo pradžia | 2024 m. rugsėjo 19 d. |
Projekto veiklų įgyvendinimo pabaiga | 2026 m. balandžio 30 d. |
Kontaktinis asmuo | Eglė Čepaitienė |