Dalinuosi klausimais bei pastebėjimais, susijusiais su šiuo duomenų rinkiniu. Kodą rasite šiame Jupyter Notebook: https://github.com/harismck/atviri-duomenys/blob/master/nmpp_rezultatai.ipynb Visų pirma, jeigu kas nors bandote atsidaryti šiuos duomenis naudodami Python bei pandas ar polars paketus, reikia naudoti kodavimą "windows-1257". Kodavimas galėtų būti paminėtas rinkinio aprašyme, išsiaiškinti užtruko. Yra duomenų kokybės bei dokumentacijos problemų. Pirma, neaišku kaip interpretuoti taškų stulpelį 2017-2018 mokslo metais. Keli reikšmių pavyzdžiai: "484,462", "552,044". Būtų gerai, jeigu atsakinga institucija sutvarkytų duomenis jeigu tai yra įvesties klaida, arba Struktūros skiltyje paaiškintų, kaip reikia interpretuoti reikšmes šiame stulpelyje skirtingiems mokslo metams, klasėms bei patikrinimo tipams. Antra, yra tik trys eilutės iš 2022 metų antros klasės, bei viena eilutė iš 2023 metų pirmos klasės. Panašu į įvesties klaidą. Trečia, vis dar nėra 2024 metų duomenų. Ketvirta, duomenimis būtų daug paprasčiau naudotis, jeigu jie būtų pateikti ne suagreguoti, o vieno patikrinimo lygmeniu. Dabartiniu formatu pateikti duomenys apsunkina kad ir paprastų vidurkių skaičiavimą, nes visada reikia pasverti pagal mokinių skaičių toje eilutėje, arba pačiam "prikurti" papildomų eilučių, kad viena eilutė atspindėtų vieną patikrinimą. Bet kuriuo atveju, gaunasi nereikalingas papildomas darbas. Tikiuosi, kad pavyks išspręsti šias kokybės problemas, patobulinti rinkinio dokumentaciją bei pagerinti vartotojo patirtį visiems, kam šie duomenys aktualūs. Ačiū!
Nerandate norimo duomenų rinkinio, o gal esamam duomenų rinkinui turite pastabų? Tuomet peržiūrėkite jau registruotus poreikius duomenų rinkiniams. Jeigu sąraše nerasite atitinkančio poreikio - registruokite naują.
Teikti poreikįŠioje portalo skiltyje yra publikuojami atvirų duomenų naudotojų pateikti poreikiai dėl atvirų duomenų rinkinių. Tai yra svarbu, nes atveriant duomenis yra siekiama duomenų atvėrimą vykdyti maksimaliai, atsižvelgiant į atvirų duomenų naudotojų poreikį (angl. demand driven approach) ir įvertinant jų teigiamą poveikį visuomeninio intereso tenkinimui, viešumui ir verslo plėtrai.