Kokiais principais vadovautis formuojant atvirų duomenų rinkinį?

Atveriamas duomenų rinkinys neturi būti dirbtinai skaidomas į atskirus duomenų rinkinius pagal laiko, teritorijos ar pan. parametrus. Pavyzdžiui, duomenų rinkiniai, kurie yra tos pačios struktūros ir suskaidyti į atskiroms savivaldybėms, turi būti pateikiami viename rinkinyje su priskirta teritorinė savybe „visa Lietuva“; Toks pats principas turėtų būti taikomas ir laiko faktoriui, kai tos pačios struktūros duomenys suskaidomi pagal atskirus metus. Nesuskaidytuose rinkiniuose, laiko ir teritorinės charakteristikos yra duomenų rinkinio struktūriniai elementai;

Jeigu pirminio šaltinio tos pačios tematikos ir struktūros duomenys suskaidomi į atskirus failus, tai ADP jie priskiriami tam pačiam duomenų rinkiniui – kaip atskiros distribucijas. (daugiau informacijos - https://www.w3.org/TR/vocab-dcat-2/#dcat-scope) Išimtinais atvejais skaidyti galima tik dėl konfidencialumo, techninių ar kitokių apribojimų;

Atveriant duomenų rinkinius tikslinga maksimaliai išsaugoti pirminiame šaltinyje esančių duomenų ryšius net tik tarp objektų ir jų savybių, bet ir tarp pačių objektų.

 

Ką reiškia sąvoka Dokumentų rinkinys? Koks šios sąvokos santykis su samprata "atvirų duomenų rinkinys"?"

Teisės gauti informaciją iš valstybės ir savivaldybės institucijų ir įstaigų įstatyme pateikiamai sąvokų apibrėžimai: Dokumentas – institucijos veikloje užfiksuota informacija ar jos dalis, nepaisant jos pateikimo būdo, formos ir laikmenos, įskaitant registro duomenis, registro informaciją, registrui pateiktus dokumentus ir (arba) jų kopijas, valstybės informacinės sistemos duomenis. Skaitmeninių dokumentų rinkinys (toliau – dokumentų rinkinys) – informacinių technologijų priemonėmis sudarytų ir metodiškai susistemintų dokumentų visuma, įskaitant juos apibūdinančius duomenis (toliau – metaduomenys). Atvirų duomenų rinkinys tai Dokumentų rinkinys parengtas ir publikuotas atviram naudojimui.

 

Kas yra atvirų duomenų rinkinys?

Atvirų duomenų rinkinys – duomenys, kuriems suformuotas metaduomenų aprašymas, atitinkantis Duomenų katalogo žodyno (angl. Data Catalog Vocabulary (DCAT); https://www.w3.org/TR/vocab-dcat/) reikalavimus, atvertų duomenų struktūra yra aiškiai apibrėžta, o patys duomenys yra parengti ir teikiami naudojimui technologiškai atvirais formatais pagal rinkiniui taikomas naudojimo sąlygas.

 

Kas yra metaduomenys?

Metaduomenys tai duomenys apie duomenis. Metaduomenų aprašymui yra naudojamas DCAT žodynas, kuriame apibrėžta metaduomenų sudėtis. DCAT yra RDF žodynas, skirtas palengvinti žiniatinklyje skelbiamų katalogų sąveiką. Šis dokumentas apibūdina schemą ir pateikia jos naudojimo pavyzdžius.

DCAT suteikia leidėjui galimybę aprašyti duomenų rinkinius ir duomenų paslaugas kataloge, naudojant standartinį modelį ir žodyną, kuris palengvina metaduomenų naudojimą ir kaupimą iš kelių katalogų. Tai gali padidinti duomenų rinkinių ir duomenų paslaugų atradimą. Tai taip pat suteikia galimybę naudoti decentralizuotą metodą duomenų katalogų skelbimui ir leidžia duomenų rinkinius ieškoti skirtinguose svetainių kataloguose, naudojant tą patį užklausos mechanizmą ir struktūrą. Apibendrinti DCAT metaduomenys gali būti naudojami kaip skaitmeninio išsaugojimo proceso dalies failas.

 

Kas yra API?

Aplikacijų programavimo sąsaja (angl.Application Programming Interface, API) – tai sąsaja, kurią suteikia kompiuterinė sistema, biblioteka ar programa tam, kad per kitą programą programuotojas galėtų pasiekti jos funkcionalumą ar apsikeistų su ja duomenimis.