Spis Treści
- Aktualności
- Idea Open Access
- Drogi publikowania w Otwartym Dostępie
- Dane badawcze i plan zarządzania danymi (DMP)
- Plan S
- Licencje Creative Commons
- Zagrożenia
- Koszty
- Wsparcie finansowe
- Cyfrowe identyfikatory naukowca
- Materiały Informacyjne
- CESAER
- Bazy
Dane badawcze i plan zarządzania danymi (DMP)
Czym są dane badawcze?
Dane badawcze (ang. Research Data)- dane zebrane i opracowane w ramach procesu badawczego uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych.
Danymi badawczymi mogą być:
- dane liczbowe (np. pomiarowe)
- dokumenty tekstowe, notatki
- kwestionariusze, ankiety, wyniki badań ankietowych
- nagrania audio i wideo, obrazy
- zawartość baz danych
- modele matematyczne, algorytmy
- oprogramowanie (skrypty, pliki wejściowe)
- wyniki symulacji komputerowych
- protokoły laboratoryjne
- opisy metodologiczne
- próbki, artefakty, obiekty
Dane powinny być tak otwarte, jak to możliwe i na tyle zamknięte, na ile to jest konieczne.
Udostępnianie danych umożliwia innym naukowcom ponowne wykorzystanie wyników badań i wspiera tworzenie nowej nauki, która opiera się na wcześniejszych ustaleniach, zwiększając efektywność procesu badawczego. Udostępnianie danych wspiera również przejrzystość i odtwarzalność, budując zaufanie do nauki.
Dane należy udostępnić możliwie szybko. NCN (Narodowe Centrum Nauki) wymaga udostępnienia danych najpóźniej w momencie publikacji wyników badań.
Plan zarządzania danymi
Plan zarządzania danymi (Data Management Plan - DMP) to dokument opisujący dane, które naukowiec zamierza pozyskać lub wygenerować w trakcie projektu badawczego, sposób zarządzania, opisywania, analizowania i przechowywania tych danych oraz mechanizmy, z których korzystamy na zakończenie projektu, aby udostępnić i archiwizować swoje dane.
Co powinien zawierać plan?
- Jakie dane zostaną wytworzone lub zebrane? (rodzaje danych, formaty plików,
szacunkowa objętość danych) - W jaki sposób będą pozyskiwane lub wytwarzane dane? (standardy, metody,
oprogramowania, narzędzia) - Jak zostaną uporządkowane i opisane? (metadane, dokumentacja)
- Kwestie etyczne i prawne (kwestie związane z ochroną danych osobowych,
danych niejawnych, etc.) - W jaki sposób dane zostaną udostępnione? (jak, kiedy, komu),
- Które dane będą przechowywane długoterminowo? (gdzie, jak długo)
Przykładowe miejsca udostępniania
- Repozytorium Zenodo (https://zenodo.org/) to multidyscyplinarne repozytorium opracowane w ramach europejskiego programu OpenAIRE i obsługiwane przez CERN. Umożliwia ono deponowanie artykułów naukowych, zbiorów danych, oprogramowania badawczego, raportów i wszelkich innych artefaktów cyfrowych związanych z badaniami.
- Repozytorium Otwartych Danych Badawczych RepOD (https://repod.icm.edu.pl/) - To polskie repozytorium otwartych danych badawczych, stworzone z myślą o naukowcach i instytucjach zainteresowanych udostępnieniem swoich zasobów. Każdy zdeponowany zbiór danych opatrzony zostaje numerem DOI. Prowadzone jest przez zespół Platformy Otwartej Nauki Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego.
Wyszukiwarka zaufanych repozytoriów
Wiarygodne repozytoria są zgłaszane do wykazu Registry of Research Data Repositories https://www.re3data.org/
Repozytoria spełniające najwyższe kryteria mogą również aplikować o certyfikat CoreTrustSeal – są widoczne w pod adresem https://amt.coretrustseal.org/certificates
Zalecane formaty plików
Wybierając format zapisu danych badawczych warto ograniczyć się do tzw. formatów otwartych, czyli takich, które można otworzyć przy użyciu darmowego oprogramowania.
Dobór formatów plików do archiwizacji:
Typ danych | Zaleca się | Nie zaleca się |
---|---|---|
Tabele | CSV, TSV, SPSS portable | XLS, XLSX |
Teksty | HTML, RTF, PDF | DOC, DOCX |
Media | MP4, FLAC | QTFF |
Obraz | TIFF, JPGE2000, PNG | GIF, JPG |
Dane uporządkowane | XML, RDF | RDBMS |
Nazewnictwo
Nazwy plików powinny być krótkie, ale opisowe bez znaków specjalnych i lub spacji.
W nazwie należy umieścić: nazwę projektu, datę zebrania lub przetworzenia danych (dobrym formatem oznaczeń dat jest RRRRMMDD) , identyfikator lub wersja pliku.
Co to są metadane?
Metadane czyli dane o danych. Służą do podsumowania podstawowych informacji o konkretnym zbiorze danych badawczych
- Tytuł
- Źródło danych
- Opis danych
- Twórca lub autor danych
- Format
- Język
- Sposoby tworzenia danych
- Cel powstania danych
- Data powstania
- Licencja
- Oświadczenie o finansowaniu
- Rozmiar pliku
- Jakość danych
- Proces używany do tworzenia danych
Zasady FAIR – niezbędne wytyczne dla udostępnianych danych
-
Findable - żeby było łatwo je znaleźć
- Zbiór danych opatrzony jest metadanymi, które umożliwiają
odnalezienie tego zbioru - Do zbioru przypisany jest unikalny identyfikator (np. DOI)
- Metadane są indeksowane w ogólnodostępnych bazach danych
umożliwiających ich przeszukiwanie.
- Zbiór danych opatrzony jest metadanymi, które umożliwiają
-
Accessible - żeby były dostępne dla wszystkich
- Metadane są zawsze dostępne, nawet jeśli sam zbiór danych
został już usunięty lub przeniesiony. - Dostęp do zbioru danych, a przynajmniej do metadanych,
możliwy jest bezpośrednio poprzez unikalny identyfikator i nie
wymaga dodatkowych narzędzi ani oprogramowania
- Metadane są zawsze dostępne, nawet jeśli sam zbiór danych
-
Interoperable - żeby można było je połączyć z innymi danymi
- Zbiory danych i opisujące je metadane zawierają odnośniki do
innych powiązanych z nimi zbiorów. - Dane oraz metadane są dostarczone w formacie zapewniającym
łatwy odczyt i przetwarzanie zarówno przez ludzi jak i
komputery
- Zbiory danych i opisujące je metadane zawierają odnośniki do
-
Reusable - żeby dało się je ponownie wykorzystać
- Metadane zawierają liczne atrybuty dokładnie opisujące zbiór danych
i uławiające użytkownikom określenie ich przydatności dla ich
własnych badań - Zbiór danych zawiera licencję określającą jednoznacznie warunki
ponownego wykorzystania i przetwarzania danych; - Metadane wyraźnie określają autora oraz miejsce powstania danych;
- Metadane są skonstruowane według ogólnie przyjętych standardów
specyficznych dla danej dyscypliny oraz rodzaju danych.
- Metadane zawierają liczne atrybuty dokładnie opisujące zbiór danych
Źródła:
Dane badawcze w pigułce. Poradnik
Szuflita-Żurawska M., Plan Zarządzania Danymi
Milewska A., Zarzadzanie danymi badawczymi
Kontakt w sprawie deponowania danych badawczych oraz przygotowywania Planów Zarządzania Danymi
mgr Łukasz Jeszke
Biblioteka PP
Oddział Informacji Naukowej
tel. 61 665 3521, e-mail: lukasz.jeszke@put.poznan.pl