Dane badawcze i plan zarządzania danymi (DMP)

Spis Treści

Dane badawcze i plan zarządzania danymi (DMP)

Czym są dane badawcze?

Dane badawcze (ang. Research Data)- dane zebrane i opracowane w ramach procesu badawczego uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych.

Danymi badawczymi mogą być:

  • dane liczbowe (np. pomiarowe)
  • dokumenty tekstowe, notatki
  • kwestionariusze, ankiety, wyniki badań ankietowych
  • nagrania audio i wideo, obrazy
  • zawartość baz danych
  • modele matematyczne, algorytmy
  • oprogramowanie (skrypty, pliki wejściowe)
  • wyniki symulacji komputerowych
  • protokoły laboratoryjne
  • opisy metodologiczne
  • próbki, artefakty, obiekty

 

Dane powinny być tak otwarte, jak to możliwe i na tyle zamknięte, na ile to jest konieczne.

Udostępnianie danych umożliwia innym naukowcom ponowne wykorzystanie wyników badań i wspiera tworzenie nowej nauki, która opiera się na wcześniejszych ustaleniach, zwiększając efektywność procesu badawczego. Udostępnianie danych wspiera również przejrzystość i odtwarzalność, budując zaufanie do nauki.

Dane należy udostępnić możliwie szybko. NCN (Narodowe Centrum Nauki) wymaga udostępnienia danych najpóźniej w momencie publikacji wyników badań.


Plan zarządzania danymi

Plan zarządzania danymi (Data Management Plan - DMP) to dokument opisujący dane, które naukowiec zamierza pozyskać lub wygenerować w trakcie projektu badawczego, sposób zarządzania, opisywania, analizowania i przechowywania tych danych oraz mechanizmy, z których korzystamy na zakończenie projektu, aby udostępnić i archiwizować swoje dane.

 

Co powinien zawierać plan?

  • Jakie dane zostaną wytworzone lub zebrane? (rodzaje danych, formaty plików,
    szacunkowa objętość danych)
  • W jaki sposób będą pozyskiwane lub wytwarzane dane? (standardy, metody,
    oprogramowania, narzędzia)
  • Jak zostaną uporządkowane i opisane? (metadane, dokumentacja)
  • Kwestie etyczne i prawne (kwestie związane z ochroną danych osobowych,
    danych niejawnych, etc.)
  • W jaki sposób dane zostaną udostępnione? (jak, kiedy, komu),
  • Które dane będą przechowywane długoterminowo? (gdzie, jak długo)

 

Przykładowe miejsca udostępniania

  • Repozytorium Zenodo (https://zenodo.org/) to multidyscyplinarne repozytorium opracowane w ramach europejskiego programu OpenAIRE i obsługiwane przez CERN. Umożliwia ono deponowanie artykułów naukowych, zbiorów danych, oprogramowania badawczego, raportów i wszelkich innych artefaktów cyfrowych związanych z badaniami.

 

  • Repozytorium Otwartych Danych Badawczych RepOD (https://repod.icm.edu.pl/) - To polskie repozytorium otwartych danych badawczych, stworzone z myślą o naukowcach i instytucjach zainteresowanych udostępnieniem swoich zasobów. Każdy zdeponowany zbiór danych opatrzony zostaje numerem DOI. Prowadzone jest przez zespół Platformy Otwartej Nauki Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego.

 

Wyszukiwarka zaufanych repozytoriów

Wiarygodne repozytoria są zgłaszane do wykazu Registry of Research Data Repositories https://www.re3data.org/

Repozytoria spełniające najwyższe kryteria mogą również aplikować o certyfikat CoreTrustSeal – są widoczne w pod adresem https://amt.coretrustseal.org/certificates
 

Zalecane formaty plików

Wybierając format zapisu danych badawczych warto ograniczyć się do tzw. formatów otwartych, czyli takich, które można otworzyć przy użyciu darmowego oprogramowania.

Dobór formatów plików do archiwizacji:

Typ danych Zaleca się Nie zaleca się
Tabele CSV, TSV, SPSS portable XLS, XLSX
Teksty HTML, RTF, PDF DOC, DOCX
Media MP4, FLAC QTFF
Obraz TIFF, JPGE2000, PNG GIF, JPG
Dane uporządkowane XML, RDF RDBMS

 

Nazewnictwo

Nazwy plików powinny być krótkie, ale opisowe bez znaków specjalnych i lub spacji.

W nazwie należy umieścić: nazwę projektu, datę zebrania lub przetworzenia danych (dobrym formatem oznaczeń dat jest RRRRMMDD) , identyfikator lub wersja pliku.


Co to są metadane?

Metadane czyli dane o danych. Służą do podsumowania podstawowych informacji o konkretnym zbiorze danych badawczych

  • Tytuł
  • Źródło danych
  • Opis danych
  • Twórca lub autor danych
  • Format
  • Język
  • Sposoby tworzenia danych
  • Cel powstania danych
  • Data powstania
  • Licencja
  • Oświadczenie o finansowaniu
  • Rozmiar pliku
  • Jakość danych
  • Proces używany do tworzenia danych

 

Zasady FAIR – niezbędne wytyczne dla udostępnianych danych

  • Findable - żeby było łatwo je znaleźć

     

    • Zbiór danych opatrzony jest metadanymi, które umożliwiają
      odnalezienie tego zbioru
    • Do zbioru przypisany jest unikalny identyfikator (np. DOI)
    • Metadane są indeksowane w ogólnodostępnych bazach danych
      umożliwiających ich przeszukiwanie.

     

  • Accessible - żeby były dostępne dla wszystkich

     

    • Metadane są zawsze dostępne, nawet jeśli sam zbiór danych
      został już usunięty lub przeniesiony.
    • Dostęp do zbioru danych, a przynajmniej do metadanych,
      możliwy jest bezpośrednio poprzez unikalny identyfikator i nie
      wymaga dodatkowych narzędzi ani oprogramowania

     

  • Interoperable - żeby można było je połączyć z innymi danymi

     

    • Zbiory danych i opisujące je metadane zawierają odnośniki do
      innych powiązanych z nimi zbiorów.
    • Dane oraz metadane są dostarczone w formacie zapewniającym
      łatwy odczyt i przetwarzanie zarówno przez ludzi jak i
      komputery

     

  • Reusable - żeby dało się je ponownie wykorzystać

     

    • Metadane zawierają liczne atrybuty dokładnie opisujące zbiór danych
      i uławiające użytkownikom określenie ich przydatności dla ich
      własnych badań
    • Zbiór danych zawiera licencję określającą jednoznacznie warunki
      ponownego wykorzystania i przetwarzania danych;
    • Metadane wyraźnie określają autora oraz miejsce powstania danych;
    • Metadane są skonstruowane według ogólnie przyjętych standardów
      specyficznych dla danej dyscypliny oraz rodzaju danych.

 

Źródła:

Dane badawcze w pigułce. Poradnik

Szuflita-Żurawska M., Plan Zarządzania Danymi

Milewska A., Zarzadzanie danymi badawczymi

 

Kontakt w sprawie deponowania danych badawczych oraz przygotowywania Planów Zarządzania Danymi

 

mgr Łukasz Jeszke

Biblioteka PP

Oddział Informacji Naukowej

tel. 61 665 3521, e-mail: lukasz.jeszke@put.poznan.pl