Szegedi Tudományegyetem Klebelsberg Kuno Könyvtára
A Research Data Management (RDM) összefoglaló kifejezést használjuk a kutatási adatokkal kapcsolatos tevékenységek leírására, magyarul pedig a kutatási adatok kezelése (ill. kutatási adatkezelés*, kutatási adatmenedzsment) kifejezéseket használják a terület megnevezésére.
A kutatási adatok kezelésének számos jó gyakorlata van, melyek követésével sok idő és energia takarítható meg. Fontos, hogy a szabályokat a kutatócsoport minden tagja a kutatás teljes időtartama alatt tartsa be.
Az SZTE Klebelsberg Könyvtár RDM tanácsadás szolgáltatásának keretében az alábbi témákban nyújt segítséget a kutatóknak:
A következő leckékben ezeket fogjuk részletesebben körbejárni.
A fájlok könnyű visszakereshetősége és rendszerezhetősége érdekében ajánlott egyezményes, informatív és egyértelmű fájlneveket alkalmazni. Ha csak egy ember foglalkozik az adott fájlokkal, akkor sem biztos, hogy 1-2 év elteltével emlékezni fog, milyen adatot tartalmaz egy fájl – ez a probléma a kutatásban résztvevők számával növekszik. Csoportos kutatások esetén különösen fontos a következetesség, hogy minden résztvevő ugyanazt a fájl-elnevezési gyakorlatot kövesse.
(pl.: ~! @ # $% ^ & * () `; ? , [] {} '"és | ) és szóközt, elválasztásra a _ karaktert alkalmazzuk
pl. name_date_v02.png
Az adatkezelési tervben tüntessük fel az fájlelnevezési metódust. Ez segít a saját kutatóinknak és az adatainkat felhasználni kívánó külsősöknek is az eligazodásban.
Amennyiben lehetőség van rá, törekedjünk a szoftverfüggetlen formátumok használatára, így biztosíthatjuk a fájlok mobilitását és egyszerűbb megosztását. Egyes esetekben hasznos lehet ugyanazt a fájlt többféle formátumban is tárolni, illetve ismerni az adott fájlformátum konvertálási lehetőségeit.
Például ne .xls formátumot használjunk hosszú távú tárolásra, hiszen ez szoftver és verziófüggő formátum, hanem csv-be mentsünk.
Sokan megszeppennek a metaadatolás kifejezéstől. A metaadat* jelentése pusztán „adat az adatról”, azaz az adatok leírására szolgáló dokumentáció. Olyan adatelemek, mint a cím, szerző, kiadási év, tárgyszavak, verziószám, hozzáférés módja stb. Ezek az adatok nélkülözhetetlenek ahhoz, hogy magát az adatot könnyen megtalálják a keresőmotorok és a humán kereső ezek alapján el tudja dönteni, hogy releváns számára maga az adat, vagy nem.
Kutatási adatok esetén az igazán alapos metaadatolás már tartalmazza azt is, hogy milyen mérőműszerrel, milyen körülmények közt születtek az adatok. Ezzel is az ellenőrizhetőséget és a reprodukálhatóságot biztosíthatjuk a későbbi felhasználóknak.
(Húzza az egeret az ikonra!)
A metaadat elválik magától az adattól olyan értelemben, hogy sokkal szabadabban kezelhető. Praktikus, hogy a metaadat nyilvánosan elérhető legyen mindenki számára, de ettől maga az adatcsomag kutatási és publikációs érdekeinknek megfelelően lehet akár zárt, embargós, engedélyhez kötött is. Teljes kontrollt gyakorlohatunk a kutatást követően is adataink felett.
Lassan minden pályázat esetén kötelező elem lesz a kutatási adatkezelési terv elkészítése.
A kutatási adatkezelési terv* (Data Management Plan – DMP) egy egyszerű, néhány oldalas összefoglaló dokumentum, amely meghatározza, hogy a kutatás alatt gyűjtött adatokat hogyan tervezik kezelni a kutatás során és annak lezárultával.
Az adatkezelési terv egy folyamatosan változó, a kutatási szakaszokhoz alkalmazkodó dokumentum, hiszen rengeteg dolog változhat a kutatás folyamán.
Általában az első verziót a kutatás elején kell elkészíteni, és folyamatosan frissíteni, ha kutatás közben jelentős változás történik. Legalább a kutatás közben és a végén el kell készíteni egy frissített verziót.
(Húzza az egeret az ikonra!)
A European Research Council adatkezelési terv mintáját ajánljuk, mert ez nagyon hasonló a 2024 óta az NKFIH által használt űrlaphoz és kérdésekhez.
Ha a finanszírózó által elvárt adatkezelési terv kitöltésében megakadunk, nem tudjuk milyen adatokat kell beírni az adott kérdéshez, használhatunk úgynevezett DMP online kitöltő eszközöket. Ezek az online alkalmazások vezetett kérdésekkel segítik az adatkezelési terv összeállítását, ismerve a kutatásfinanszírozó szervezetek sablonjait. Ilyenek például:
EU-s pályázatok esetén fontos kérdés az adatkezelés költsége. Járjunk utána alaposan, hiszen a tárolásnak, feldolgozásnak komoly költsége lehet, különösen az utóbbi években emelkedtek meg nagyon az árak. Ha szenzitív adatokkal dolgozunk, akkor különösen vigyázzunk, mert a GDPR-védett adatokkal való munka a sokszorosába kerülhet.
Adatkezelési terv konzultáció
A szolgáltatás keretében a Könyvtár kollégái segítenek a megfelelő DMP összeállításában és a már elkészült űrlapok utólagos ellenőrzésében.
A kutatási adatkezelés kritikus pontja az adattárolás kérdése, mely nemcsak akkor lesz időszerű, amikor lezajlott a kutatás és archiválni kellene a keletkezett adathalmazt, hanem már az első pillanattól fogva: amikor létrejön a nyers adat, érdemes megtervezni, hol és hogyan célszerű azt tárolni a kutatás során. Az adattárolás módjának kiválasztásakor több szempontot is figyelembe kell venni.
Adataink rövid és hosszú távú tárolásáról is gondoskodnunk kell. A rövid távú a kutatás folyamata alatti, a hosszú távú pedig a lezárulta utáni tárolásra vonatkozik.
Tartsuk be a „here, near and far” elvet az adatok mentése során. Vagyis ilyenkor három példányban mentjük az adatokat: az egyiket helyben szerkesztjük, egy másikat valamilyen közeli adathordozóra (pl. külső merevlemez) mentjük, a harmadikat pedig valamilyen távoli szerveren vagy felhőben helyezzük el.
A hosszú távú adattárolásra mindenképpen érdemes adatrepozitóriumot* használni.
Az adatrepozitóriumok a kutatási adatok hosszú távú megőrzésére, kereshetővé tételére és szolgáltatására alkalmas adatbázisok.
A megfelelő adatrepozitórium kiválasztásáról a kutató nem mindig dönthet. Sok esetben a kutatást finanszírozó szervezet vagy projekt előírja, hogy a finanszírozásában létrehozott adatokat hol és hogyan kell tárolni.
Számos kiadó is meghatározza azoknak az adatrepozitóriumoknak a körét, amelyben elfogadja a publikációk mellé feltöltött adatcsomagokat. Természetesen ez a repozitóriumi kör a folyóiratok különböző profilja miatt eltérő. Szűkebb szakterület esetén általában a vezető kutatóintézet által fenntartott nyilvános adatrepozitórium lesz a meghatározó, ahová érdemes a kutatási adatokat feltölteni a közös kereshetőség érdekében.
Ha nincs kiadói, finanszírozói megkötés, jelenleg számtalan általános és diszciplináris adatrepozitórium áll a kutatók rendelkezésére.
Az adatrepozitóriumok legjobb összesített keresője a DataCite által üzemeltetett adatbázis, mely a világ összes minősített adatrepozitóriumát tartalmazza és teszi visszakereshetővé minden létező szempont szerint.
Ha nem akarunk keresgélni és egy igazán jó multidiszciplináris repozitóriumban akarjuk elhelyezni adatcsomagjainkat akkor ezt ajánljuk. A European Open Science Cloud kínálatában szereplő adatrepozitórium viszonylag nagy fájlokat is ingyenesen befogad, az Európai Unió pedig kezeskedik hosszú távú működéséért.
A repozitált adatcsomag elérhető lesz-e a szakterület által leginkább használt föderatív keresőmotorok alatt? Sok tudományterületen ugyanis kialakultak a szinte kizárólagosan használt adatbázisok, keresőmotorok.
Az SZTE Klebelsberg Könyvtár adatrepozitórium ajánló szolgáltatásának keretében segítséget nyújtunk kutatóinknak az adatok közzétételéhez legmegfelelőbb repozitórium kiválasztásában.
Kattints az ikonra az adatbázis eléréséhez!
Jobb felső menüben lévő Search gombra kell kattintani.
Bal oldlai szűrkőknél be kell jelölni az alábbit: