Fórum:RDM

Z WikiSkript

Správa výzkumných dat[upravit | editovat zdroj]

Research Data Management (RDM)

Při velkých projektech, na kterých spolupracuje řada institucí je třeba sbírat, ukládat a vyhledávat řadu informací a dat: Zápisy z porad, výsledky pokusů, nahrávky meetingů, laboratorní deníky, obrázky, tabulky, ... Tuto správu dat je potřeba plánovat, řídit a koordinovat. Je potřeba (pokud možno předem) přijmout pravidla a zásady, které bude nutno v projektu dodržovat a najít technické nástroje, které tyto procesy umožní efektivně a dlouhodobě provádět.

Metodika správy vědeckých dat je popsána např. na stránkách Centra pro podporu Open Science (Ústřední knihovny UK):

Výzkumná data[upravit | editovat zdroj]

Výzkumná data lze obecně charakterizovat jako jakékoli údaje, které byly shromážděny či vytvořeny v průběhu výzkumného projektu za účelem zjištění, ověření nebo reprodukování výsledků výzkumu. Data mohou mít různou pobodu, může se jednat o data kvalitativní či kvantitativní, digitální nebo analogová. Výzkumná data mohou zahrnovat například:

  • Tabulky, dokumenty
  • Audio a video nahrávky
  • Obrázky, fotografie
  • Dotazníky, odpovědi na testové otázky, přepisy rozhovorů
  • Software, skript
  • Laboratorní deníky, terénní poznámky, diáře, číselníky
  • Vzorky, exempláře, artefakty

Kromě výzkumných dat samotných je při efektivní organizaci projektu také třeba pamatovat na další související dokumentaci a záznamy o výzkumu, mezi které mohou patřit například:

  • Vyjádření Komise pro etiku ve výzkumu
  • Podepsané informované souhlasy účastníků výzkumu
  • Grantové žádosti
  • E-mailová korespondence
  • Mediální výstupy

FAIR[upravit | editovat zdroj]

Principy FAIR data

Aby se zvýšila možnost opětovného využití výzkumných dat, měla by být spravována v souladu s principy FAIR. Principy FAIR popisují, jak by data měla být zpracována, aby byla lépe nalezitelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable), a jsou podporovány či dokonce vyžadovány některými významnými poskytovateli financí, jako např. Evropská komise, ale také některé české grantové agentury.

FAIR data mohou, ale nemusí být zároveň otevřená.

Principy FAIR[upravit | editovat zdroj]

  • Nalezitelnost (Findability)
    • Soubory dat by měly být popsány, identifikovány a registrovány nebo indexovány jasným a jednoznačným způsobem. Používání trvalých identifikátorů DOI, ORCID a dalších. Ukládání do repositářů, doplnění strojově čitelných metadat, indexace.
  • Dostupnost (Accessibility)
    • Soubory dat by měly být přístupné v důvěryhodných úložištích (repositářů) prostřednictvím jasně definovaného postupu přístupu, ideálně pomocí automatizovaných prostředků. Přístupy (ověřování a autorizce) musí být standardizované (jako např. EduID). I když je obsah neveřejný, metadata musí být veřejná.
  • Interoperabilita (Interoperability)
    • Data a metadata musí využívat akceptované standardy, oborové slovníky (MASH).
  • (Znovu)využitelnost (Reusability)
    • Data a jejich původ musí být podrobně popsány podle komunitních standardů s jasnými podmínkami pro použití (licence apod.)

Více o principech FAIR a jak je naplnit naleznete na stránkách Centra pro podporu open science: https://openscience.cuni.cz/OSCI-64.html

Perzistentní identifikátory[upravit | editovat zdroj]

  • ORCID - identifikátor osob
  • DOI - identifikátor prací
  • ROR - identifikátor institucí
  • ISSN - identifikátor sériových publikací

Jmenné konvence[upravit | editovat zdroj]

Pojmenování souboru by mělo zrcadlit informaci o jeho původu a obsahu. V ideálním případě by měl být název sestaven tak, abyste ho mohli zrekonstruovat z jeho metadat, pokud by se název sám ztratil (např. přejmenováním).

  • V názvech nepoužívejte mezery, tečky, speciální znaky a interpunkci.
  • Pro strukturování názvů souborů používejte pomlčku "-", spodní podtržítko "_" a velká písmena
  • V názvu souboru specifikujte údaje o výzkumu: např. "použitý přístroj", "stupeň dokončení", "autor", "tým", "jazyk".
  • Verzujte soubory

Příklad nastavení jmenné konvence (FAIR):

Project_YYYYMMDD_ContentDescription_Version.ext


Více informací např. na stránkách:

Archivační formáty souborů[upravit | editovat zdroj]

Doporučené formáty souborů pro FAIR ukládání (pro další použití) by měly umožnit dlouhodobý přístup a možnost sdílení dat. V procesu přípravy dat můžete používat nástroje jak jste zvyklí, ale v okamžiku, kdy se chystáte data uložit, je potřeba soubory převést do stabilních otevřených formátů souborů vhodných pro dlouhodobé uložení.

Doporučované vlastnosti formátů dat pro dlouhodobé uložení
  1. Neproprietární
  2. Bezztrátové
  3. Standard pro daný obor nebo běžně používaný výzkumnou komunitou
  4. Zahrnující metadata
  5. Otevřené, zdokumentované standardy
  6. Interoperabilní mezi různými platformami a aplikacemi
  7. Plně zveřejněné a dostupné zdarma
  8. Plně a nezávisle implementované více poskytovateli softwaru na více platformách bez jakýchkoli omezení duševního vlastnictví pro potřebnou technologii
  9. Vyvinuté a udržované organizací pro otevřené standardy s dobře definovaným inkluzivním procesem vývoje standardu.


Příklady
  • Obrazová data: TIFF, PDF/A, PNG, GIF, BMP, SVG
  • Tabulky : CSV, TXT
  • Texty : XML, PDF/A, HTML, JSON, TXT, RTF
  • Kontejnery : TAR, GZIP, ZIP
  • Databáze: XML, CSV, JSON, POR
  • Souřadnice : SHP, DBF, GeoTIFF, NetCDF
  • Video : MPEG, AVI, MXF, MKV
  • Zvuk : WAVE, AVI, MP3, MXF, FLAC
  • Statistické soubory : DTA, POR, SAS, SAV

Výzkumníci mohou při spolupráci používat aktuální soubory textových editorů, ale v okamžiku, kdy je soubor definitivní a je ukládán, či archivován, měl by mít některý z perzistentních formátů uvedených výše.

Licence[upravit | editovat zdroj]

Podmínkou opětovné využitelnosti je vymezení podmínek, za nichž mohou být naměřená data, či jiné výstupy vědecké práce znovu použity. Tyto podmínky specifikují licence. Nejrozšířenějším licenčním systémem je Creative Commons.

Přehled typů licencí[upravit | editovat zdroj]
Označení Popis Zkratka
CC0 icon Nejširší možné užití díla (i bez uvedení autorství) 0
CC by icon Pouze uvedení autora BY
CC-by-ND icon Uvedení autora + Žádná odvozená díla BY-ND
CC-by-SA icon Uvedení autora - týká se původního díla i jeho modifikací BY-SA
CC-by-NC icon Uvedení autora + Pouze nekomerční užití BY-NC
CC-by-NC-ND icon Uvedení autora + Pouze nekomerční užití + Žádné modifikace BY-NC-ND
CC-by-NC-SA icon Uvedení autora + Nekomerční užití + Zachovejte licenci BY-NC-SA

Například licence CC BY (Attribution) dovoluje sdílet (šířit) dílo a vytvářet díla z něj odvozená (deriváty díla), a to i ke komerčním účelům, pokud je uveden autor díla.

Metadata[upravit | editovat zdroj]

Aby bylo možné s výzkumnými daty dál efektivně pracovat (např. v nich vyhledávat) měla by být opatřena popisnými údaji (datum vzniku, autor, přístroj, ...). Těmto popisným údajům se říká metadata (data o datech). Nejběžnější standard pro metadatový popis digitálních objektů je tzv. Dublin Core Ve svém základu obsahoval sadu patnácti atributů, z nichž žádný není povinný a každý se může opakovat : autor, předmět, popis, vydavatel, přispěvatel, datum, typ, formát, identifikátor, zdroj, jazyk, vztah, pokrytí, práva.

Personální zajištění - správce dat (VO admin+Data Steward)[upravit | editovat zdroj]

S vědeckými daty pracují všichni členové projektového týmu, ale někdo musí být v týmu v centru těchto aktivit a odpovídat za výběr a používání správné metodiky. Optimální se jeví najít v každém projektovém týmu (nebo vědecké skupině) doktoranda, který částí své kapacity bude uvedené úkoly řešit (pozice Data Steward). V rámci organizace zastřešující více projektů pak může být ustanoven koordinátor, který zprostředkovává koordinaci technické podpory a společnou komunikaci s externími službami.

Data Steward zodpovídá za
nastavení (nikoliv dodržování) pravidel pro práci s výzkumnými daty v rámci výzkumného týmu
podporu výzkumníků při tvorbě a aktualizaci DMP
Data Steward nezodpovídá za
analýzu dat.
(Jeho zodpovědností je jen to, že data budou reprodukovatelná, dohledatelná a jednoznačná.)

Správcům dat je třeba poskytnout zdroje informací, zajistit školení a příklady dobré praxe.

Data Management Plan[upravit | editovat zdroj]

Data Management Plan (DMP, plán správy dat) je klíčovým dokumentem pro správu dat. Dokument specifikuje, jaká data a jakým způsobem budou během výzkumu vytvářena a obsahuje informace o jejich dostupnosti a využitelnosti. Konečným cílem je, aby výzkum poskytoval vysoce kvalitní data, která jsou snadno a konzistentně dostupná.

Neexistuje jediná striktně daná forma DMP – různé instituce, či poskytovatelé financí mohou klást důraz na různé části procesu správy dat a konečný DMP může vypadat jinak pro různé projekty. Obsah DMP se také odvíjí od typu výzkumu a sbíraných dat. Například pro data z medicinského nebo sociologického výzkumu mohou být důležité otázky týkající se etiky a zpracování osobních údajů. Pro výzkumníky v oblasti biologie nebo fyziky, kteří pracují s velkými objemy dat, mohou být zase důležité otázky týkající se jejich ukládání a zálohování.

Pro srovnání uvádíme příklad obecné šablony podle Digital Curation Centre a European Research Council. Pokud se podíváte na šablonu pro ERC, uvidíte, že ačkoli by se témata zmíněná v šabloně DCC měla objevit i zde, struktura se trochu liší a dává větší důraz na principy FAIR (Findable, Accessible, Interoperable, Reusable).

Digital Curation Centre

  1. Administrativní data o projektu
  2. Jak a jaká data se projektu sbírají
  3. Dokumentace dat a příslušná metadata
  4. Etické a právní otázky
  5. Skladování a zálohování
  6. Dlouhodobá ochrana
  7. Sdílení dat
  8. Zodpovědnost a zdroje


European Research Council

  1. Summary
  2. Making data findable
  3. Making data openly accessible
  4. Making data interoperable
  5. Increase data reuse
  6. Allocation of resources and data security


Proč DMP potřebujeme?[upravit | editovat zdroj]

  1. Pomáhá včas odhalit potenciální problémy, kontrola, že máte vše potřebné vybavení a podporu
  2. Zajištění kvality dat - tj. že data jsou přesná, úplná a spolehlivá, snížení rizika duplicitní práce, ztráty dat a narušení bezpečnosti
  3. Zajištění kontinuity a konzistence dlouhodobých projektů
  4. Pomoc při sdílení dat
  5. Splnění podmínek poskytovatelů financí


Pokud pracujete na projektu, který trvá několik let a podílí se na něm velký tým, musíte mít jasné a jednotné pokyny pro práci s daty. Plán je "živý" dokument, který se mění a průběžně aktualizuje spolu s potřebami projektu a jeho účastníků. Je aktualizován v průběhu projektu, aby bylo zajištěno, že tyto změny v průběhu času sleduje a že odráží aktuální stav projektu.

DMP je užitečný nástroj k přemýšlení o budoucnosti. Můžete naplánovat zdroje, nástroje a odborné znalosti, které budou potřebné k ukládání, zpracování, a správu daných typů a objemů dat. Díky němu si uvědomíte možné problémy v rané fázi, abyste je mohli předejít. Např. vám připomíná, že je třeba získat souhlas autorů s budoucím opakovaným použitím nasbíraných dat. Strukturovaná a dobře zdokumentovaná data umožňují materiály snáze pochopit. To následně usnadňuje přípravu materiálu pro publikaci a archivaci pro další výzkum po skončení projektu.

DMP slouží jako jednotné kontaktní místo pro vyhledávání informací souvisejících s projektem. Budou zde informace o umístění souborů, konvence pojmenování, standardy, popis projektu, projektové role, zálohovací režimy, verzování, jména a identifikátory ORCID členů projektu, informace o tom, která instituce je vlastníkem projektu, registrační čísla pro financování a informace o schválení etickou komisí. DMP odkazuje na deníky, technické zprávy a dalších dokumenty, které se projektu týkají.


Další informace najdete například zde:

Data Stewardship Wizard[upravit | editovat zdroj]

Data Stewardship Wizard

Data Stewardship Wizard je jedním z doporučených nástrojů pro tvorbu Data Managment Plan (DMP). Pomáhá výzkumníkům vytvořit si vlastní plány správy dat a podporuje naplňování principů FAIR. Je to Open Source nástroj, který vznikl na ČVUT. Data Stewardship Wizard je poskytován pouze v angličtině.

Uživatel zde nevyplňuje celou konkrétní šablonu, ale prochází okruhy správy výzkumných dat prostřednictvím chytrých stromových dotazníků (tzv. znalostní modely), které zobrazují jen relevantní otázky na základě předchozích odpovědí. Plány je možné následně exportovat podle šablon některých poskytovatelů financí (Horizon Europe, Horizon 2020, Science Europe) do řady formátů (HTML, LaTEX, PDF, DOC). V této centrální instanci wizardu nejde editovat znalostní model a šablony s otázkami. Pokud to bude omezovat uživatele a potřebovali by se šablonami či modelem aktivně pracovat, je třeba požádat autorský team na ČVUT o vytvoření vlastní instance (např. pro UK), v níž pak jsou i šablony (a stromová struktura otázek) editovatelné.

DMPonline[upravit | editovat zdroj]

Jiným užitečným on-line nástrojem pro tvorbu DMP je DMPonline. Nástroj obsahuje přednastavené šablony nejvýznamnějších poskytovatelů financí (např. Horizon 2020, Horizon Europe, ERC a další) a vytváří DMP (tzn., klade otázky) přímo pro zvolenou šablonu, na které může uživatel odpovídat volným textem.

Náklady na dlouhodobou údržbu dat[upravit | editovat zdroj]

Správa dat má nezanedbatelné náklady. Důležitou rolí DMP je proto jeho využití při výpočtu, kolik peněz bude potřeba na správu výzkumných dat v průběhu projektu. V projektu je třeba mít nejen zdroje na sběr, analýzu a publikování dat, ale také na pečlivou dokumentaci, místo na serveru, řešení zálohování a dokumentační software.

Pro odhad nákladů na správu dat je možné použít "Data Management costing tool" od UK Data Service. V průměru se doporučuje, aby v typickém dvouletém výzkumném projektu byly vyčleněny na dva až tři týdny na přípravu a shromažďování materiálů k uložení.

Další nástroj pro odhad nákladů na dlouhodobou archivaci dat najdete na stránkách o nástroji Data Stewarship .

Technologie[upravit | editovat zdroj]

Technologie pro ukládání, archivaci, indexování, zápis metadat a vyhledávání dat jsou nezbytnou součástí palety nástrojů pro správu vědeckých dat.

Na stránkách Centra pro podporu open science je k dispozici metodický materiál k bezpečnému nakládání s daty.

Ukládání dat[upravit | editovat zdroj]

  • Pro ukládání dat je vhodné využít služby Cesnetu OwnCloud a S3. Informace ke službám je k dispozici na adrese https://du.cesnet.cz.
  • Pro sdílení běžných dokumentů v rámci týmu používá zejména nástroj OwnCloud od Cesnetu.
  • Pro uchovávání velkých objemů (read only) vědeckých dat pak cloudové úložiště Simple Storage Service (S3).
  • Pro využití služeb pro ukládání dat od Cesnetu je nutné požádat o vytvoření virtuální organizace (VO) a nechat pro ni zpřístupnit a nastavit úložiště.
    • Administrátor VO pak může spravovat uživatele, skupiny a přidělovat jim skupiny pomocí webového rozhraní Perun.
    • Návody ZDE

OwnCloud[upravit | editovat zdroj]

OwnCloud

OwnCloud (a ostatní cloudové služby Cesnetu) mohou pro vzdělávací a výzkumné účely použít akademičtí pracovníci, studenti a pracovníci výzkumných organizací v ČR s účtem ve federaci identit eduID.cz.

  • Cloudové úložiště s prostorem 100 GB per uživatel (je možné po domluvě navýšit, ale maximálně na 300GB)
  • Uživatelské klienty pro operační systémy Windows, Linux , OS X, iOS, Android
  • Automatická synchronizace dat mezi několika zařízeními (na mobilní zařízení dle potřeby)
  • Přístup přes webové rozhraní
  • Nastavitelné sdílení se skupinou osob nebo na základě odkazu. Je možné sdílet i veřejně (a definovat přístupové heslo).
  • Verzování dokumentů v rámci jednoho účtu
  • Uložení dat v rámci e-infrastruktury CESNET na území České republiky
  • Detailní návod ZDE.

Každý uživatel v ownCloudu má základni kvótu 100 GB. Každý uživatel VO by měl tudíž osobní účet, kde by následně mohl editovat nasdílené soubory. Přihláseni je standardní pomocí instituciálni identity na https://owncloud.cesnet.cz/.

Scénáře použití[upravit | editovat zdroj]
  • Standard: každý uživatel (s kvótou 100G) může mít na svém účtu nějaké složky projektu, a sdílet je dalším členům VO.
  • Jeden sdílený účet: pokud budeme mít např. jeden osobní účet, ze kterého budeme data sdílet ostatním, je možné kvótu navýšit až na 300 GB. Sdílená data se vždy počítají do kvóty uživatele, který tato data sdílí.
Přístup k datům[upravit | editovat zdroj]
  • Pro přístup k datům doporučujeme použití klienta OwnCloudu. Po instalaci aplikace se ve správci souborů objeví nová složka se soubory, které se budou synchronizovat s cloudem. V nastavení klienta můžete určit, které přesně složky si přejete synchronizovat.
  • Další možností je připojení síťového disku. Pak můžete se soubory v cloudu pracovat stejným způsobem, jaky byste je měli lokálně na počítači. Postup:
    • přihlásit se na https://owncloud.cesnet.cz/
    • vlevo dole "Nastavení", zkopírovat adresu v poli WebDAV.
    • otevřít správce souborů Windows
    • stisknout pravé tlačítko myši nad položkou "Síť" a zvolit "Připojit síťovou jednotku"
    • Kliknout na odkaz "Připojit k webovému serveru, na který lze ukládat soubory a obrázky"
    • "Vybrat vlastní umístění v síti"
    • vložit adresu, kterou jsme zkopírovali v poli WebDAV a následně zadat přístupové údaje k OwnCloudu. Jste-li např. zaměstnancem UK, bude loginem číslo_zaměstnance@cuni.cz.
ONLYOFFICE[upravit | editovat zdroj]
  • OwnCloud má možnost editovat office dokumenty pomocí ONLYOFFICE.
  • Integrovaný ONLYOFFICE poskytuje přívětivý způsob pro kolaborativní spolupráci při úpravě dokumentů v prostředí ownCloud. ONLYOFFICE je výkonný online editor pro textové dokumenty, tabulky nebo prezentace a je kompatibilní se všemi soubory MS Office.
  • Tato služba je momentálně dostupná zaměstnancům sdružení CESNET. Je možné ji ale po domluvě zapnout pro uživatele projektu, VO.

Simple Storage Service[upravit | editovat zdroj]

  • Simple Storage Service, neboli S3, je cloudové prostředí pro ukládání velkých objemů dat.
  • Úložiště S3 nabízí CESNET zdarma o jakékoliv kapacitě pro subjekt s registrací organizace v aplikaci PERUN. Viz: https://du.cesnet.cz/cs/navody/object_storage/cesnet_s3/start.
  • Služba S3 běží na infrastruktuře CESNETu, všechna data leží v ČR na úložištích CESNETu.
  • Data se ukládají do tzv. bucketu a následně se vytvářejí adresářové struktury s daty. Buckety je možné sdílet mezi uživateli, data se dají sdílet pomocí linku, případně vytvářet veřejne buckety, kde jsou data dostupná veřejně.
Přístup k datům[upravit | editovat zdroj]
  • Pro přístup k datům je možné využít buď grafické klienty jako S3 Browser anebo Cloudberry Explorer, stejně tak klienty pro příkazovou řádku - AWS CLI, rclone, s3cmd.
  • S3 browser zřejmě nenabízí možnost automatické synchronizace lokální složky s cloudem. Je tam ale možnost Tools - Folder Sync Tools, kde je možné porovnat a synchronizovat vybrané složky jako job.
  • Jako vhodné řešení se jeví nabízená možnost připojit si bucket jako síťový disk, více na https://tntdrive.com/?s3b.

RBD[upravit | editovat zdroj]

  • Úložiště RBD je další možností datového úložiště, které Cesnet nabízí
  • Funguje vlastně jako sdílený síťový disk, který je možné namapovat do filesystemu serveru. Správa přístupů pak probíhá už na úrovni linuxových práv.
  • Je vhodné spíše k archivaci dat. Neobsahuje jednoduché možnosti sdílení a práce se soubory.
  • Bližší informace ZDE.

Virtuální organizace na Cesnetu[upravit | editovat zdroj]

Pro týmové využívání cloudových služeb Cesnetu je vhodné požádat Cesnet o vytvoření "virtuální organizace" (VO). Virtuální organizace slouží především k tvorbě a správě uživatelských skupin, kterým následně budeme přidělovat práva ke sdíleným cloudovým prostředkům na Cesnetu. Také je možné povolit skupině nebo virtuální organizaci cloudový ONLYOFFICE, tedy možnost online spolupráce nad sdíleným office dokumentem. Základní návody týkající se správy VO a skupin jsou k dispozici zde:

Sdílení výzkumných dat[upravit | editovat zdroj]

Sdílení výzkumných dat patří mezi základní stavební kameny otevřené vědy (open science). Díky sdílení dat je snazší ověřit výsledky výzkumu a publikovaný výzkum se tak stává transparentnější a důvěryhodnější. Pro sdílení dat platí obecně princip "as open as possible, as closed as necessary", tedy co nejotevřenější, ale uzavřená dle potřeby.

Výzkumná data je možné sdílet mnoha různými způsoby. Častou, avšak nepříliš vhodnou metodou sdílení výzkumných dat je jejich zasílání e-mailem na vyžádání. Tento postup jednak komplikuje přístup k datům pro uživatele a jednak zatěžuje samotného autora dat, který musí žádosti o poskytnutí dat individuálně vyřizovat. Kromě toho hrozí také riziko, že vědec o svá data přijde například v důsledku selhání hardwaru, kde jsou data uchovávána, či vlivem lidské chyby. Sdílení výzkumných dat prostřednictvím e-mailu také neumožňuje uživateli data řádně citovat. Proto je vhodnější zvolit jiný způsob sdílení.

Supplementary Materials[upravit | editovat zdroj]

Některá vydavatelství nabízí možnost přiložit k článku doplňující materiály (Supplementary Materials). Autoři takto mohou k článku přiložit například podkladová data nebo skript, který použili ke zpracování dat, a vydavatel tyto materiály následně publikuje online a k článku přidá odkaz. Nevýhodou tohoto modelu je, že data není možné samostatně citovat.

Datové repozitáře[upravit | editovat zdroj]

Nejvhodnějším způsobem, jak uchovat svá data, je jejich uložení do datového repozitáře. Pro tyto účely je nejvhodnější využít oborový repozitář (pokud existuje), který můžete vyhledat např. prostřednictvím Registru datových repozitářů re3data.org. Nenajdete-li vhodný oborový repozitář, můžete využít obecné repozitáře jako např. Zenodo nebo Figshare.

Zenodo[upravit | editovat zdroj]

Zenodo

Zenodo je univerzální (oborově nespecifické) otevřené úložiště provozované CERNem. Umožňuje výzkumníkům ukládat výzkumné dokumenty, soubory dat, výzkumný software, zprávy a jakékoli další digitální artefakty související s výzkumem. Pro každou uloženou datovou sadu se vytváří perzistentní digitální objektový identifikátor (DOI), díky kterému lze uložené položky snadno citovat. Z hlediska priorit je Zendo dobrou volbou, pokud pro danný výzkum neexistuje oborově specifické (nebo institucionální) úložiště.

Datové časopisy[upravit | editovat zdroj]

Datové časopisy odráží model klasického vědeckého publikování prostřednictvím článku a kombinují sdílení dat v repozitáři s publikováním recenzovaného datového článku (také tzv. data paper, data descriptor, data note). Datový článek je analogický s tradičními vědeckými publikacemi, lze jej citovat a také je možné jej vykázat v OBD (systém pro vykazování tvůrčí činnosti na UK). Datové články popisují určitý online dostupný dataset, nikoli analýzu na něm provedenou. Článek by měl poskytovat informace o tom, co je to za data, kdy, kde a jakým způsobem vznikla atd., a také by měl obsahovat odkaz na daný dataset.

Příklady datových časopisů:


Více informací o sdílení výzkumných dat:

Otevřené publikování[upravit | editovat zdroj]

Výsledky výzkumu financovaného z veřejných prostředků musí být publikovány v režimu OpenAccess. Open access (otevřený přístup) je forma publikování výsledků vědy a výzkumu, která zajišťuje okamžitý, bezplatný, trvalý a svobodný přístup k publikovaným výsledkům.

Poznámka: Jedním z problémů, které se otevřený přístup snaží řešit, je omezování dostupnosti vědeckých výstupů zpoplatněním vědeckých publikací nikoli donory výzkumu, ale nakladatelstvími. Zejména dvojí zpoplatnění (platí jak publikující autor, tak čtenář) bývá u výzkumu hrazeného z veřejných prostředků považováno za "poněkud" neetické.

Charakteristiky open access[upravit | editovat zdroj]

  1. okamžitý = přístup k publikovaným výsledkům má být zajištěn nejpozději ve chvíli, kdy je článek publikovaný, jde tedy o přístup bez časového embarga, které by např. zvýhodňovalo publikující nakladatelství.
  2. bezplatný = přístup k výsledkům má být dostupný zdarma pro koncové uživatele
  3. trvalý = přístup má být zajištěn dlouhodobě – výsledky musí být archivovány
  4. svobodný = výsledky mají být dostupné tak, aby mohly být opětovně využité (např. díky publikování pod svobodnou licencí)


Existují dva základní modely open access – zlatá a zelená cesta.

Zlatá cesta open access[upravit | editovat zdroj]

Zlatá cesta otevřeného přístupu je cestou publikování v otevřených recenzovaných časopisech. Přístup k plným textům nezajišťuje sám autor, ale vydavatel. Některé časopisy mohou být plně otevřené a bez poplatků, kde náklady spojené s vydáváním nese vydavatel (např. univerzitní vydavatelství, vědecká komunita), u jiných časopisů je třeba za zpřístupnění článku zaplatit tzv. APC poplatek (article processing charge). Autoři Univerzity Karlovy mají možnost využívat některé slevy či plné odpuštění poplatků.

Pro nalezení vhodného otevřeného časopisu ke zveřejnění svého článku mohou uživatelé využít databázi otevřených časopisů DOAJ (Directory of Open Access Journals).

Více informací :

Zelená cesta open access[upravit | editovat zdroj]

Zelená cesta otevřeného přístupu je nadstavbou k tradičnímu způsobu publikování prostřednictvím vědeckých časopisů. Autor dál publikuje své články v časopisech s přístupem založeným na předplatném nebo v otevřených časopisech, ale zároveň plné texty ukládá a zpřístupňuje v otevřeném repozitáři (tzv. je autoarchivuje). Přístup k plým textům tak v tomto případě zajišťuje autor. Nezapomeňte, že při podepisování smlouvy s vydavatelstvím můžete udělit vydavateli pouze nevýhradní licenci ke zveřejnění vašeho díla.

Repozitáře[upravit | editovat zdroj]

Pro nalezení vhodného repozitáře ke zveřejnění svého článku využijte databázi otevřených repozitářů OpenDOAR, nebo vám rádi pomohou knihovníci. V listopadu 2022 byl spuštěn Repozitář publikační činnosti UK, který můžete pro autoarchivaci rovněž využít. Publikace se do Repozitáře publikační činnosti UK vkládají prostřednictvím modulu OBD IS Věda.

Odkazy na užitečné zdroje informací[upravit | editovat zdroj]


Obě cesty je možné kombinovat. Můžete tedy publikovat článek prostřednictvím otevřeného časopisu (zlatá cesta) a následně jej uložit do otevřeného repozitáře (zelená cesta), kde můžete např. přidat odkazy na související výstupy a zajistíte také jeho dlouhodobé uchování nezávisle na komerčním vydavateli.

Odkazy a literatura[upravit | editovat zdroj]

Okazy na UK[upravit | editovat zdroj]