Informuojame, kad nuo 2026 birželio 11 d. 10:00 val. iki 2026 birželio 14 d. 23:59 val. bus vykdomi Atvirų duomenų saugyklos (get.data.gov.lt) planiniai techniniai darbai. Darbų metu galimi laikini sistemos veikimo sutrikimai, paslaugų nepasiekiamumas arba lėtesnis veikimas. Atsiprašome už galimus nepatogumus.

Duomenų ištekliaus peržiūros: 59

Lietuvių kalbos garsynas LIEPA-3 yra skirtas šnekos atpažinimo (ASR, STT) taikymams ir moksliniams tyrimams. Bendra anotuota garsyno trukmė yra 10000 val. Garsyną sudaro garso įrašai FLAC formatu (44.1 kHz, 16 bitų, mono) ir juos atitinkantys anotacijų failai teksto formatu žodžio bei frazių lygmens anotacijose bei Praat TextGrid (https://praat.org/" rel="nofollow noopener noreferrer">https://praat.org/) formatu foneminėse anotacijose. Garsyne įrašyta skaitoma šneka, spontaninė šneka ir lietuviškos tarmės. Garsynas sąlyginai sudalintas į kelis subgarsynus: spontaninės šnekos (SPON - 4900 val.), skaitomos šnekos (READ - 5000 val.), tarmių (DIAL - 100 val.) bei fonemiškai anotuotą garsyną (PHON - 500 val.). Bendras garsyno dydis yra 1,3 TB (ZIP formatas, dalys atsisiuntimui po 10 GB). Garsynas anotuotas fonemų lygmenyje (500 valandų), žodžių (10 000 valandų) ir frazių (10 000 valandų) lygmenyse.

Patinka 0
Brandos lygis -
Atnaujinama Neatnaujinamas
Kategorijos
  • Mokslas ir technologijos
  • Mokslo įstaigos
  • Telekomunikacijos ir ryšiai
  • Informaciniai ištekliai
Būsena Inventorintas
Duomenų išteklius viešinamas Taip
Prieigos teisės Vieši
Katalogas ADP
Prieigos nuoroda https://hdl.handle.net/20.500.11821/101

Peržiūrėti papildomą informaciją +


Dalintis socialiniuose tinkluose

Prenumeruoja: 0

Priskirtos organizacijos

Priskyrimo rūšis Organizacija
Duomenų rengėjas Vilniaus universitetas

Komentarai

Komentuoti gali tik prisijungę naudotojai