Informuojame, kad nuo 2026 birželio 11 d. 10:00 val. iki 2026 birželio 14 d. 23:59 val. bus vykdomi Atvirų duomenų saugyklos (get.data.gov.lt) planiniai techniniai darbai. Darbų metu galimi laikini sistemos veikimo sutrikimai, paslaugų nepasiekiamumas arba lėtesnis veikimas. Atsiprašome už galimus nepatogumus.

Rasta duomenų išteklių: 19
Publikuota: 2025-03-04 Atnaujinta: 2026-06-07 Viešoji įstaiga Statybos sektoriaus vystymo agentūra
Duomenų išteklius viešinamas: Taip Brandos lygis:

Istorinių tyrimų Holokausto tema išleidžiama nemažai, tačiau dažniausiai tyrinėjama bendroji Holokausto istorija, vokiečių saugumo policijos ir SD operatyvinių ir ypatingųjų būrių veikla, lietuvių koloboravimas su naciais, dėmesys skiriamas getų istorijai, šiek tiek mažiau dėmesio sulaukia Holokausto provincijoje tyrimai. Iki šiol leidinio, kuriame būtų ne tik atskleistos masinės žydų žudynės visoje šalies teritorijoje, bet taip pat susietos geografine padėtimi iki šiol nebuvo, nors keletas pirmatakų paminėtini: tai dviejų tomų 1965 ir 1973 išleistos „Masinės žudynės Lietuvoje, (1941-1944) : dokumentų rinkinys“ ir 1997 Josifo Levinsono „Skausmo knyga“. Publikacijoje buvo surinktos paminklų nuotraukos iš maždaug 190 vietų, rodyklėje surašyti Lietuvos miestai ir miesteliai, kuriuose gyveno žydai, bei nurodytos jų nužudymo vietos.

2010 m. Valstybinis Vilniaus Gaono žydų muziejus ir Austrijos atminties tarnyba Gedenkdienst inicijavo projektą „Holokausto Lietuvoje Atlasas“, skirtą edukacijai, informacijos sklaidai, turizmui. Atlase pateikta surinkta, struktūrizuota ir koncentruotai pateikta informacija apie visas Lietuvoje esančias masinių žudynių vietas. Tokio pobūdžio išsamios informacijos, susietos su kiekviena konkrečia vieta, iki šiol nebuvo – duomenys įvairiuose panašaus pobūdžio leidiniuose buvo išskaidyti ar vis dar yra nepublikuoti, esantys archyvų fonduose.

Atliktas darbas svarus indėlis atskleidžiant Holokausto Lietuvoje vyksmą, kuris prisidės prie šių įvykių objektyvaus nušvietimo ir įvertinimo, principingo Holokausto suvokimo Lietuvoje. Tai svarbus mūsų, Valstybinio Vilniaus Gaono žydų muziejaus darbuotojų edukacinis darbas.

Leidinį "Holokausto Lietuvoje Atlasas" Jūs galite įsigyti Valstybinio Vilniaus Gaono žydų muziejaus padaliniuose: Naugarduko g. 10, Pamėnkalnio g. 12, Pylimo g. 4, Vilniuje.

30
0
0
Publikuota: 2025-03-04 Atnaujinta: 2026-06-07 Viešoji įstaiga Statybos sektoriaus vystymo agentūra
Duomenų išteklius viešinamas: Taip Brandos lygis:

Parsisiuntimo paslauga - Valstybės sienos apsaugos duomenų rinkinys. Rinkinį sudaro: Valstybės sienos apsaugos tarnybos padalinių informacija, sienos apsaugos ribos, pasienio ruožo ribos, pasienio kontrolės punktai. Duomenis galima naudoti tik nekomerciniais tikslais. Pasienio kontrolės punktus prižiūri Pasienio kontrolės punktų direkcija (PPKD), o erdvinius duomenis PPKD leidimu teikia VSAT. Valstybės sienos ženklų duomenys peržiūrai teikiami su apytikslėmis koordinatėmis, o atsisiuntimui - tik teisę juos gauti turintiems asmenims. Pasienio ruožo ribos patvirtintos Lietuvos Respublikos Vyriausybės 2007 m. gegužės 30 d. nutarimu Nr. 548 „Dėl pasienio ruožo ribų ir valstybės sienos apsaugos zonos ribų bei Lietuvos Respublikos gyvenamųjų vietovių, priskirtų pasienio ruožui, sąrašo patvirtinimo“ (su vėlesniais pakeitimais ir papildymais).

72
0
0
Publikuota: 2025-03-04 Atnaujinta: 2026-06-07 Viešoji įstaiga Statybos sektoriaus vystymo agentūra
Duomenų išteklius viešinamas: Taip Brandos lygis:

Parsisiuntimo paslauga - Lietuvos Respublikos teritorijos M 1:250 000 georeferencinių erdvinių duomenų rinkinys pagal tarptautinio projekto EuroRegionalMap reikalavimus. Šiam projektui vadovauja EuroGeographics - Europos valstybių nacionalinių kartografijos, geodezijos ir kadastro agentūrų asociacija.Duomenų bazę sudaro 8 temos: administracinės ribos ir administraciniai vienetai, hidrografija (upės, ežerai, tvenkiniai, jūra, užtvankos, šaltiniai, pelkės ), transporto tinklas (keliai, geležinkeliai, geležinkelių stotys, degalinės ir automagistralių pakelės poilsio aikštelės, keltų linijos, jūrų uostai, oro uostai, malūnsparnių nusileidimo aikštelės, valstybinės sienos kirtimo postai ), gyvenvietės (išreikštos plotais ir taškais), socialinės temos objektai (švietimo įstaigos, gydymo įstaigos, sąvartynai, elektros jėgainės ) augmenija ir pagrindinės žemėnaudos (miškai, dirbama žemė, pramoniniai sodai, atviri smėlynai ir akmenynai), fizinių geografinių regionų pavadinimų anotacijos (žemumos, aukštumos, lygumos ir pan.), įvairūs objektai ir orientyrai (produktotiekiai, naudingųjų iškasenų gavybos vietos, aukštos įtampos perdavimo linijos, nacionaliniai parkai, policijos nuovados, laisvalaikio ir pramogų parkai, populiariausi turistų traukos objektai - muziejai, istoriniai pastatai, paminklai).

Didelės vertės rinkiniai

113
0
0
Publikuota: 2025-03-04 Atnaujinta: 2026-06-07 Viešoji įstaiga Statybos sektoriaus vystymo agentūra
Duomenų išteklius viešinamas: Taip Brandos lygis:

Parsisiuntimo paslauga - Lietuvos Respublikos teritorijos M 1:100 000 georeferencinių erdvinių duomenų rinkinys pagal tarptautinio projekto EuroBoundaryMap reikalavimus - EBM_100LT. Ši duomenų bazė yra sudaryta iš administracinių ribų linijų vektoriaus, administracinių vienetų plotų vektoriaus bei taškų vektoriaus. Linijos kaupia tam tikrą atributinę informaciją apie ribą, jos hierarchiją ir kitą informaciją. Plotai ir taškai kaupia atributinę informaciją apie administracinių vienetų hierarchiją bei kodus.

Didelės vertės rinkiniai

40
0
0
Publikuota: 2025-03-04 Atnaujinta: 2026-06-07 Viešoji įstaiga Statybos sektoriaus vystymo agentūra
Duomenų išteklius viešinamas: Taip Brandos lygis:

Istorinių Karaliaučiaus srities vietovardžių duomenų rinkinys. Jame pateikta apie 4000 baltiškų kalbų kilmės vietovardžių (pradedant nuo XIII a.) su jų vokiškomis ir rusiškomis atmainomis. Surinkti duomenys iš daugelio šaltinių: etnografų Vinco Vileišio, Grasildos Blažienės, Aleksandro Miuicelio, Manfredo Švarco, Viliaus Pėteraičio, Marijos Razmukaitės, Valdemaro Šimėno, Rimanto Matulio, Rimanto Lazdyno, bendradarbiaujant su GOV, OSM ir talka Lietuvai.lt. Visų duomenų rinkinio kūrimui panaudotų šaltinių sąrašą galite rasti čia: https://www.geoportal.lt/download/kita/karaliauciaus_vietovardziu_saltiniai.xls

46
0
0
Publikuota: 2025-10-21 Atnaujinta: 2026-06-02 Valstybės duomenų agentūra
Duomenų išteklius viešinamas: Taip Brandos lygis:

Informuojame, kad Savivaldos Datalab aplikacijos „Pastatų būklė“ duomenys buvo pašalinti iš sistemos. Jeigu, išlieka poreikis šiems duomenims, juos galima rasti viešai prieinamuose šaltiniuose – Registrų centro atvirų duomenų portale:

https://www.registrucentras.lt/atviri-duomenys-ir-statistika/nekilnojamojo-turto-registro-pirminiai-duomenys-raw-data

139
0
0
Publikuota: 2025-12-31 Atnaujinta: 2026-02-02 Valstybės įmonė Registrų centras
Duomenų išteklius viešinamas: Taip Brandos lygis:

Gyventojų registro paskirtis – rinkti, kaupti, apdoroti ir saugoti asmens kodo; vardo (vardų); pavardės (pavardžių); lyties; gimimo datos; pilietybės (pilietybių); jos (jų) įgijimo ir netekimo datos (datų); gimimo vietos; gyvenamosios vietos; atvykimo į gyvenamąją vietą datos, jeigu asmuo išvyksta gyventi į užsienį; – išvykimo vietos (valstybės) ir išvykimo datos, jeigu asmuo nuolat gyvena užsienyje; – valstybės, jeigu asmuo neturi gyvenamosios vietos ir yra įtrauktas į gyvenamosios vietos neturinčių asmenų apskaitą; – savivaldybės, kurioje gyvena; šeiminės padėties ir jos pasikeitimo datos; mirties datos; tėvų, vaikų ir sutuoktinių asmens kodų; jeigu asmens kodai nesuteikti, – kitų asmens duomenų, pagrįstų dokumentais ir nurodytų Gyventojų registro nuostatuose; tautybės; veido atvaizdo; pirštų atspaudų; parašo; dokumentų duomenų; civilinės būklės aktų įrašų duomenų; duomenų apie asmens neveiksnumą ir veiksnumo apribojimą; asmens kontaktinių duomenų (Nacionalinės elektroninių siuntų pristatymo, naudojant pašto tinklą, informacinės sistemos aktyvuotos elektroninio pristatymo dėžutės adreso; elektroninio pašto adreso ir fiksuotojo arba judriojo ryšio telefono numerio, kurie naudojami susisiekti su asmenimis teikiant jiems Gyventojų registro duomenis, dokumentus ar informaciją pagal pateiktus prašymus, informuojant asmenis apie jiems išduoto kvalifikuoto elektroninio parašo sertifikato galiojimo sustabdymą ar galiojimo atšaukimą)duomenis apie Lietuvos Respublikos piliečius, asmenis be pilietybės ir kitų valstybių piliečius, kurie gauna Lietuvos Respublikoje išduodamus asmens dokumentus, deklaruoja gyvenamąją vietą Lietuvos Respublikos teritorijoje ar kurių civilinės būklės aktai registruojami Lietuvos Respublikos institucijose; teikti šiuos duomenis Lietuvos Respublikos valdžios institucijoms, viešojo administravimo subjektams, kitiems valstybės registrams ir valstybės informacinėms sistemoms, kitiems juridiniams asmenims, jų filialams, atstovybėms, įstatymų nustatytas funkcijas atliekantiems valstybės įgaliotiems asmenims, taip pat fiziniams asmenims įstatymų ir kitų teisės aktų nustatyta tvarka.

284
0
0
Publikuota: 2025-12-31 Atnaujinta: 2026-02-02 Valstybės įmonė Registrų centras
Duomenų išteklius viešinamas: Taip Brandos lygis:

Metrikacijos ir gyvenamosios vietos deklaravimo informacinės sistemos paskirtis - informacinių technologijų priemonėmis teikti su civilinės būklės aktų įrašų projektų duomenų tvarkymu, gyvenamosios vietos deklaravimu susijusias ir kitas MGVDIS nuostatuose nurodytas paslaugas (t. y. – MGVDIS paslaugas), vykdyti jų apskaitą ir priežiūrą.

88
0
0
Publikuota: 2026-05-13 Atnaujinta: 2026-05-13 Vilniaus universitetas
Duomenų išteklius viešinamas: Taip Brandos lygis:

Lietuvių kalbos garsynas LIEPA-3 yra skirtas šnekos atpažinimo (ASR, STT) taikymams ir moksliniams tyrimams. Bendra anotuota garsyno trukmė yra 10000 val. Garsyną sudaro garso įrašai FLAC formatu (44.1 kHz, 16 bitų, mono) ir juos atitinkantys anotacijų failai teksto formatu žodžio bei frazių lygmens anotacijose bei Praat TextGrid (https://praat.org/) formatu foneminėse anotacijose. Garsyne įrašyta skaitoma šneka, spontaninė šneka ir lietuviškos tarmės. Garsynas sąlyginai sudalintas į kelis subgarsynus: spontaninės šnekos (SPON - 4900 val.), skaitomos šnekos (READ - 5000 val.), tarmių (DIAL - 100 val.) bei fonemiškai anotuotą garsyną (PHON - 500 val.). Bendras garsyno dydis yra 1,3 TB (ZIP formatas, dalys atsisiuntimui po 10 GB). Garsynas anotuotas fonemų lygmenyje (500 valandų), žodžių (10 000 valandų) ir frazių (10 000 valandų) lygmenyse.

61
0
0
Publikuota: 2026-05-22 Atnaujinta: 2026-05-22 Vytauto Didžiojo universitetas
Duomenų išteklius viešinamas: Taip Brandos lygis:

NextGenerationEU projektas „Santraukų tekstynai dirbtiniam intelektui“, Nr. 02-101-K-0001.

Apimtis: 2340 tekstų (1 738 609 žodžiai), kiekvienas tekstas suporuotas su dviem žmonių parengtomis santraukomis: abstraktyvia (iš viso 352 591 žodis) ir ekstraktyvia (iš viso 494 861 žodis). Mokymo imtis – 2240 tekstų, testavimo imtis – 100 tekstų. Duomenys pateikiami CSV, JSON ir XML formatais.

Tekstyno sandara. Santraukų tekstynas priskirtinas specializuotiems lietuvių kalbos tekstynams, skirtiems automatinio santraukų sudarymo (angl. automatic summarisation) sistemų giliojo mokymo pagrindu apmokymui ir vertinimui. Tekstyną sudaro originalūs lietuvių autorių parengti tekstai kartu su žmonių parašytomis abstraktyviomis ir ekstraktyviomis santraukomis. Kiekviena santrauka sudaro ne mažiau kaip 10 proc. originalaus teksto apimties.

Tekstyną sudaro keturios skirtingos dalys: informacinių technologijų (IT), teisės (teisė), medicinos (medicina) ir žiniasklaidos (žiniasklaida). Proporcijos: 1. teisės tekstai – 668 276 žodžiai (apie 38 proc. tekstyno), 2. medicinos tekstai – 371 611 žodžių (apie 21 proc.), 3. žiniasklaidos tekstai – 354 012 žodžių (apie 20 proc.), 4. informacinių technologijų tekstai – 344 710 žodžių (apie 20 proc.).

Pagal tekstų skaičių dominuoja informacinių technologijų sritis (689 tekstai), toliau: žiniasklaida (568), medicina (550) ir teisė (533).

Tekstų šaltiniai. Informacinių technologijų dalies tekstai surinkti iš IT tinklaraščių (pvz., technologijos.lt), studentų bakalauro ir magistro baigiamųjų darbų (pvz., VDU CRIS) bei Vilniaus universiteto IT mokslo žurnalų (zurnalai.vu.lt). Teisės dalies tekstai paimti iš Lietuvos teismų informacinės sistemos LITEKO, Lietuvos Respublikos teisės aktų registro, Lietuvos Aukščiausiojo Teismo jurisprudencijos, teisės publikacijų (pvz., teise.pro) ir mokslinių straipsnių (pvz., elaba.lt). Medicinos dalies tekstai – Valstybės duomenų agentūros parengti anonimizuoti vaistinių dokumentai ir gydytojų diagnozės. Žiniasklaidos dalies tekstai – Lietuvos nacionalinio transliuotojo LRT.lt portale publikuoti straipsniai.

Projekto tikslas. Parengti ir validuoti mišrius lietuvių kalbos tekstų santraukų / abstraktų tekstynus, skirtus automatinio sudarymo giliojo mokymo pagrindu veikiančių sistemų apmokymui. Projektas vykdomas Vytauto Didžiojo universiteto kartu su partneriu Vilniaus universitetu pagal planą „Naujos kartos Lietuva“ (komponentas „Skaitmeninė transformacija ekonomikos augimui“), projekto Nr. 02-101-K-0001.

Tekstyno pagrindu parengti giliojo mokymosi sprendimai. Remiantis šio tekstyno duomenimis, parengti du automatinio santraukų sudarymo modeliai lietuvių kalbai: 1. ekstraktyvaus santraukų sudarymo modelis, paremtas XLM-RoBERTa architektūra: LT-ABS-extractive-xlm-roberta (https://huggingface.co/VytautoDidziojoUniversitetas/LT-ABS-extractive-xlm-roberta); 2. abstraktyvaus santraukų sudarymo modelis, paremtas Gemma 3 12B architektūra: LT-ABS-abstractive-Gemma3-12b (https://huggingface.co/VytautoDidziojoUniversitetas/LT-ABS-abstractive-Gemma3-12b).

26
1
0
Publikuota: 2026-05-22 Atnaujinta: 2026-06-04 Vytauto Didžiojo universitetas
Duomenų išteklius viešinamas: Taip Brandos lygis:

NextGenerationEU projektas „Nuasmeninimo tekstyno sukūrimas (NUS)“, Nr. 02-100-K-0001.

Apimtis. 41 312 įrašų (13 762 478 žodžiai, 520 904 sakiniai), kiekvienas tekstas anotuotas asmens duomenų (angl. personally identifiable information, PII) atžvilgiu — iš viso 1 487 589 anotacijos. Mokymo imtis — 41 189 įrašai (administraciniai, moksliniai ir žiniasklaidos tekstai), testavimo (validacijos) imtis — 123 įrašai. Duomenys pateikiami JSONL, CoNLL-2003 (BIO) ir TEI P5 XML formatais.

Tekstyno sandara. Asmens duomenų tekstynas priskirtinas specializuotiems lietuvių kalbos tekstynams, skirtiems automatinio asmens duomenų aptikimo ir nuasmeninimo (angl. de-identification) sistemų giliojo mokymo pagrindu apmokymui bei vertinimui. Tekstyną sudaro originalūs lietuvių kalba parengti tekstai kartu su rankiniu būdu pažymėtomis asmens duomenų anotacijomis. Iš viso išskirti 24 anotacijų tipai, suskirstyti į dvi grupes: 16 bendrųjų kategorijų (PER, LOC, ORG, ID_PER, ID_MISC, NUM_PHONE, NUM_CAR, MISC, OCC, EDU, AGE, DATE, TIME, DURATION, VALUE, NAT) ir 8 BDAR specialiosios kategorijos „jautrūs" duomenys (HEALTH, REL, POL, ETH, MAR, FAM, GENDER, SEX). Jautrių duomenų anotacijos sudaro apie 2,84 proc. visų anotacijų, atspindint jų faktinį pasiskirstymą realiuose tekstuose.

Tekstyną sudaro trys skirtingos teminės dalys ir stratifikuota validacijos imtis. Proporcijos pagal žodžių skaičių: 1. administraciniai tekstai — 11 487 490 žodžių (apie 83 proc. tekstyno), 2. moksliniai tekstai — 1 108 602 žodžiai (apie 8 proc.), 3. žiniasklaidos tekstai — 1 107 917 žodžių (apie 8 proc.), 4. validacijos imtis — 58 469 žodžiai (apie 0,4 proc.).

Pagal įrašų skaičių dominuoja administracinė sritis (38 468 įrašai), toliau: žiniasklaida (2 451), moksliniai tekstai (270) ir validacijos imtis (123).

Tekstų šaltiniai. Administracinės dalies tekstai surinkti iš 111 šaltinių — Lietuvos savivaldybių ir valstybės institucijų interneto svetainių (laikotarpis 2001–2025 m.); 3,8 proc. (1 480 įrašų) šios dalies sudaro sintetiniai tekstai, sugeneruoti Gemma 2 27B modeliu ir atitinkamai pažymėti (original_id prefiksas translated_synthetic_admin_texts_*). Mokslinės dalies tekstai paimti iš VDU CRIS (Lituanistikos duomenų bazės) ir atvirosios prieigos Vilniaus universiteto leidyklos žurnalų (laikotarpis 2000–2025 m.). Žiniasklaidos dalies tekstai — Lietuvos nacionalinio transliuotojo LRT.lt portale publikuoti straipsniai (2019–2020 m. archyvas ir 2024–2025 m. svetainės surinkimas). Validacijos imtis — filtruotas pirmiau išvardytų šaltinių poaibis, atspindintis visų trijų dalykinių sričių pasiskirstymą.

Projekto tikslas. Parengti ne mažiau kaip 10 mln. žodžių nuasmeninimo tekstyną, kuriame būtų sužymėtos BDAR aktualios įvardintos esybės (angl. named entities), atspindinčios bendrą asmeninę informaciją apie realaus pasaulio asmenis, tokiu būdu sudarant galimybes tekstyną naudoti automatizuotam duomenų anonimizavimui/ užkodavimui pagal BDAR reikalavimus ir mašininio arba giliojo mokymo technologijų sprendimų apmokymui.

Tekstyno pagrindu parengti giliojo mokymosi sprendimai. Remiantis šio tekstyno duomenimis, parengtas automatinis asmeninės informacijos aptikimo modelis lietuvių kalbai:

  1. Nuasmeninimo modelis, paremtas XLM-RoBERTa architektūra: NUS-LT-PII-xlm-roberta-large (https://huggingface.co/VytautoDidziojoUniversitetas/NUS-LT-PII-xlm-roberta-large).

26
1
0