Lietuvių kalbos garsynas LIEPA-3 yra skirtas šnekos atpažinimo (ASR, STT) taikymams ir moksliniams tyrimams. Bendra anotuota garsyno trukmė yra 10000 val. Garsyną sudaro garso įrašai FLAC formatu (44.1 kHz, 16 bitų, mono) ir juos atitinkantys anotacijų failai teksto formatu žodžio bei frazių lygmens anotacijose bei Praat TextGrid (https://praat.org/) formatu foneminėse anotacijose. Garsyne įrašyta skaitoma šneka, spontaninė šneka ir lietuviškos tarmės. Garsynas sąlyginai sudalintas į kelis subgarsynus: spontaninės šnekos (SPON - 4900 val.), skaitomos šnekos (READ - 5000 val.), tarmių (DIAL - 100 val.) bei fonemiškai anotuotą garsyną (PHON - 500 val.). Bendras garsyno dydis yra 1,3 TB (ZIP formatas, dalys atsisiuntimui po 10 GB). Garsynas anotuotas fonemų lygmenyje (500 valandų), žodžių (10 000 valandų) ir frazių (10 000 valandų) lygmenyse.