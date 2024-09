Un piano di gestione dei dati, normalmente, è suddiviso in cinque componenti:

1. Una dichiarazione di intenti

2. Definizioni dei dati

3. Raccolta e accesso ai dati

4. Domande frequenti (FAQ)

5. Limitazioni dei dati della ricerca

Ognuna di queste aree di interesse consentono alle agenzie di ricerca e ai finanziatori della ricerca (oppure al tuo team di gestione dei dati) di valutare la quantità di rischio associata a un determinato progetto. Inoltre, il piano di gestione dei dati determina come gestire tale rischio. Ad esempio, se in un progetto vengono utilizzati dati sensibili, è appropriato riutilizzare quei dati per futuri progetti? A seconda della sensibilità di quei dati, potrebbe non essere appropriato; oppure, potrebbe essere necessario ottenere ulteriori consensi da parte degli utenti.

Ogni componente di un piano di gestione dei dati è incentrato su una specifica porzione di informazioni; approfondiremo ulteriormente ciascuna di esse.

1. Dichiarazione di intenti: Spiega il motivo per cui il team necessita di acquisire specifici tipi di dati nel corso del progetto. Deve delineare in modo chiaro la domanda a cui il team sta tentando di dare una risposta con questo dataset.

2. Definizioni dei dati: Le descrizioni dei dati consentono agli utenti finali e ai loro destinatari di comprendere le convenzioni di denominazione e le loro corrispondenze con dataset specifici. Alcune di queste informazioni potrebbero essere contenute anche dai metadati, normalmente etichettando i dati in base alle loro origini dati e ai formati dei file. La creazione e l'osservanza di tali standard dei metadati predefiniti durante l'intero processo di acquisizione dei dati garantirà anche una raccolta più coerente e un processo di integrazione più fluido.

3. Raccolta e accesso ai dati: Questa sezione di un DMP illustra in che modo i dati verranno raccolti, memorizzati e come verrà effettuato l'accesso ad essi da un repository di dati. Con tutta probabilità, indicherà l'origine dati di eventuali dati esistenti o l'approccio che verrà intrapreso per creare nuovi dati, ad esempio un esperimento. Inoltre, deve contenere informazioni relative alle tempistiche dei dati, ovvero quanto spesso verranno aggiornati e durante quale periodo di tempo. Il tipo e le tempistiche dei dati, generalmente, ne determineranno la memorizzazione e l'accesso a terze parti. Ad esempio, i dati non strutturati richiederanno un sistema non relazionale rispetto a uno relazionale e i dataset di grandi dimensioni richiederanno una maggiore potenza di calcolo rispetto a quelli di piccole dimensioni. Inoltre, potrebbero esistere delle limitazioni alla condivisione dei file a causa di diritti alla privacy o alla proprietà intellettuale. Poiché le parti interessate al progetto si aspettano che i dati sensibili, ad esempio le informazioni di identificazione (PII, Personally Identifiable Information) vengano trattati con la massima attenzione e sicurezza, è importante che i proprietari dei dati siano chiari in merito alle loro pratiche di gestione dei dati, particolarmente in quest'area. Ciò includerà le risposte alle domande relative alla conservazione a lungo termine dei dati, ad esempio l'archiviazione o il riutilizzo dei dati. Per i dati che non hanno una natura sensibile, vi sarà un'aspettativa di fornire un percorso che consenta alle terze parti di accedere ai dati non elaborati e ai risultati della ricerca.

4. Domande frequenti (FAQ): Questa sezione può essere considerata un punto centrale per tutte le altre domande comuni relative ai progetti di gestione dei dati, ad esempio la condivisione dei piani, le preferenze per le citazioni e i metodi di backup dei dati. I ricercatori o i proprietari dei dati potrebbero voler evidenziare i DOI (Digital Object Identifier, identificativi degli oggetti digitali) per i proprietari di progetti adiacenti o correlati. Inoltre, se i proprietari dei progetti archiviano i dati, dovranno occuparsi della durata dell'esistenza dell'archivio. Avrà una durata di un anno, cinque anni o forse indefinita?

5. Limitazioni dei dati della ricerca: Questa sezione tratta le limitazioni applicate in fase iniziale al dataset, che ne limiteranno la capacità di effettuare generalizzazioni più ampie sulle popolazioni. Ad esempio, i dati potrebbero essere incentrati su uno specifico gruppo demografico, ad esempio relativo a un'area geografica, un genere, un'etnia, una fascia di età e così via.