HUB

Buenas Prácticas

Fuentes de datos

Planificar la gestión de datos

Buenas Prácticas

 

Como investigadores o gestores forestales en nuestro trabajo estamos acostumbrados a tratar con datos diversos, tanto cuantitativos como cualitativos. Sin embargo, habitualmente no disponemos de formación adecuada sobre este tema.

Conocer más...

La gestión efectiva y eficiente de datos es una de las actividades críticas en cualquier organización. . Una buena planificación en la gestión de datos puede ayudar al desarrollo de nuestro trabajo.

Conocer más...

El almacenamiento de datos es una fase clave para que estos sean reutilizables y puedan enriquecer nuestro trabajo futuro. 

Conocer más...

La recolección, revisión y mantenimiento de bases de datos a largo plazo son claves en la investigación forestal y de otros ecosistemas por ello los conjuntos de datos son cada vez más reconocidos como productos académicos por derecho propio, y como tal, ahora se pueden presentan para su publicación de forma independiente de los análisis científicos.

Conocer más...

El desarrollo de aplicaciones informáticas se ha convertido en una fase clave en el proceso de difusión de resultados y transferencia de conocimiento en investigación. Nuevas habilidades en programación y comunicación digital efectiva son cada día más necesarias para dar a conocer investigaciones basadas en Ciencia de Datos.. 

Conocer más...

La gestión efectiva y eficiente de datos es una de las actividades críticas en cualquier organización. . Una buena planificación en la gestión de datos puede ayudar al desarrollo de nuestro trabajo.

1. Plan de Gestión de Datos

1. Plan de Gestión de Datos

¿Qué es el plan de gestión de datos -PGD-?
Es el documento que describe de forma específica como serán tratados los datos generados en un proyecto de investigación. Actualmente existen muchas herramientas que ayudan a los investigadores a crear su plan de gestión de datos.

¿Por qué debo planificar la gestión de datos?
Los datos deben ser planificados porque:

  • Ayuda a darle organización, de modo que todos los miembros del equipo investigador sepan la ubicación exacta del dato y todos sepan las condiciones de recolecta o como se generó dicho dato
  • Contribuye a generar una investigación mucho más participativa, ya que ayuda a validar resultados de la propia investigación o demás investigaciones. Mejora la visibilidad de la investigación en el mundo científico, dando la posibilidad a los datos de ser utilizados de otras formas que el investigador o grupo investigador no habían imaginado.
  • Además, es obligatorio.

Algunas herramientas para crear el plan de gestión de datos:

  • Plantilla H2020

Ayuda a los usuarios de Horizonte 2020 a hacer que sus datos de investigación puedan ser encontrados, accesible, interoperable y reutilizable (FAIR), garantizando que esté bien administrados.
¿Cómo funciona? Consta de un cuestionario sencillo que orienta al usuario por medio de preguntas a resolver su PGD bajo los requerimientos de la Unión Europea.
Idioma: Ingles
Desarrollado por: Unión Europea
http://ec.europa.eu/programmes/horizon2020/
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/h...

  • DMPTool

Esta plantilla ayuda a crear, revisar y compartir los planes de administración de datos y que estos cumplan con los requisitos de los financiadores e instituciones.
¿Cómo funciona? Los diseñadores han creado una serie de plantillas donde están representados los principales requerimientos de los principales financiadores. Solamente se debe responder una serie de preguntas orientadoras que permitirán construir el PGD
Idioma: Ingles
Desarrollado por: Digital Curation Centre (DCC) and the University of California Curation Center (UC3).
https://dmponline.dcc.ac.uk/
http://www.dcc.ac.uk/sites/default/files/documents/resource/DMP/DMP_Chec...

  • Research data management plan

Es una herramienta que ayuda a describir su plan de gestión de datos de forma rápida.
¿Cómo funciona? Consta de una plantilla breve con una serie de epígrafes que solicitan al usuario que responda de manera breve los requerimientos del PGD. Tiene varios ejemplos al finalizar cada epígrafe que orientan al investigador. Este recurso resulta muy interesante pues tiene una herramienta que ayuda al grupo a encontrar el repositorio más adecuado según sus datos y el tipo de investigación
Idioma: Catalán. Traducido y adaptado por: el Consorci de Serveir Universitaris de Cataluya
https://dmp.csuc.cat/
http://hdl.handle.net/2072/266522
http://www.recercat.cat/bitstream/handle/2072/273194/PlansdeGestiodeDade...

  • PGDonline

Esta es la herramienta diseñada por DCC traducida y adaptada por el consorcio madroño. Cuenta con un video tutorial que da las instrucciones desde el registro hasta la creación del plan.
Idioma: Español
Traducido y adaptado por: Consorcio Madroño
http://dmp.consorciomadrono.es/

2. ¿Por qué hacer un plan de gestión de datos? Beneficios para los investigadores.

2. ¿Por qué hacer un plan de gestión de datos? Beneficios para los investigadores.

Organizar y describir tus datos hará más fácil entender los detalles y procedimientos relacionados con tus datos y su obtención a lo largo de todo el ciclo de vida de tu proyecto. Además, una correcta gestión de datos es clave para el éxito del proyecto y la investigación.

La importancia de hacer un PGD radica en que si organizas bien los datos:

  • garantizarás la integridad de la investigación.
  • tu investigación podrá ser reproducida por otro investigador.
  • cumplirás los requisitos de buenas prácticas y de agencias de financiación.
  • podrás verificar tu investigación.
  • podrás evitar su duplicación y evitar gasto de tiempo y recursos a largo plazo.
  • aumentarás la eficiencia y la calidad de la investigación.
  • podrás mejorar la protección de datos y minimizar el riesgo de pérdida de los mismos, al tomar medidas y planificar acciones de antemano para su resguardo y anonimización, y podrás depositarlos en entornos seguros con respaldo institucional.
  • garantizarás la conservación y preservación de los datos de investigación.
  • podrás evitar duplicación al volver disponibles los recursos para su reutilización por otros.
  • conseguirás reconocimiento en tu disciplina por preservar y compartir tus datos.

Fuente:

Plan de Gestión de Datos en CONICET

3. Cumplir los requerimientos de las entidades financiadoras de proyectos.

3. Cumplir los requerimientos de las entidades financiadoras de proyectos.

En los últimos años se está haciendo un esfuerzo para que las instituciones financiadoras de proyectos establezcan una política sobre datos con un marco para gestionar y conservar datos, estipulando las obligaciones que deben cumplir los investigadores al recibir financiación. De forma que cada vez son más instituciones financiadoras de proyectos (especialmente las gubernamentales) las que exigen un Plan de gestión de datos (PGD) como parte del proceso de las solicitudes con subvención.

El PGD debe describir cómo la propuesta se ajustará a las políticas en relación a la organización y acceso a los datos y los resultados de la investigación. Su elaboración se convierte en un instrumento esencial de buenas prácticas que eleva los estándares de calidad, la transparencia y la ética del proceso de investigación. Una primera versión del PGD debe ser entregada durante los 6 primeros meses del proyecto. Se ha de actualizar al menos dos veces, a mitad del proyecto y a la finalización del mismo. Además se deberá hacer una nueva versión si hay cambios importantes de los datos durante el proyecto.

La elaboración del plan de gestión de datos, desde el punto de vista de las instituciones donde se desarrollan actividades de investigación, es clave porque no son solo espacios de creación de los datos sino que pueden volverse usuarias de los mismos, adquiriendo:

  • Conocimiento previo de necesidades que surgirán en la gestión de datos a las que por ley se debe dar respuesta.
  • Información más clara y estandarizada -machine readable, y con potencial aplicación de técnicas de minería de texto y datos- de las líneas de investigación y proyectos en desarrollo, para la asignación de recursos de forma más estratégica.
  • Potencialidad de vinculación con el medio socio-productivo y/o actores gubernamentales, tanto al volver disponible la información que es base de desarrollos científicos y tecnológicos.

La mayoría de las instituciones europeas dedicadas a la investigación coinciden en que los principales motores para impulsar la elaboración de los planes de gestión son los requisitos de las instituciones financiadoras incluidos en las convocatorias de financiación de proyectos, y la existencia de códigos nacionales de conducta disciplinares. Los elementos que generalmente se incluyen en sus planes de gestión, y que coinciden básicamente con los elementos considerados más importantes por los investigadores en sus proyectos, se refieren a: definición de las responsabilidades y roles implicados en la gestión de los datos; formación y apoyo; acceso y reutilización; seguridad y preservación; acceso y disponibilidad de los datos en abierto. Puedes encontrar un ejemplo de esto en la Guía H2020 para la gestión de datos.

Mientras que en España, el segundo principio de gestión del Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020 es la transparencia y rendición de cuentas. Esto se traduce en un acceso abierto a resultados y datos de investigación de las actividades subvencionadas con recursos públicos. Los trabajos publicados en revistas científicas financiados a través del Plan Estatal se depositarán en repositorios en abierto teniendo en cuenta las características específicas de las distintas materias. Los proyectos de I+D+i financiados incluirán un plan de gestión de los datos de investigación que se generen y se depositarán en repositorios institucionales, nacionales e internacionales con la excepción de datos protegidos o necesarios para la explotación comercial de los resultados obtenidos.

Finalmente, en la evaluación curricular de los investigadores, así como en la evaluación ex post de las actuaciones financiadas se tendrán en cuenta los trabajos publicados en abierto en repositorios institucionales y temáticos, nacionales e internacionales.

Aquí encontrarás algunos ejemplos de políticas institucionales y otras entradas relacionadas con la política de datos en investigación.

Fuentes

http://www.ub.edu/blokdebid/es/content/mecanismos-de-intervencion-para-la-gestion-de-datos

Plan de Gestión de Datos en CONICET

Biblioguias.cepal.org-gestión de datos y entidades financiadoras

Plan Estatal de Ciencia y Tecnología y de Innovación 2017-2020.

4. ¿Cómo se escribe un plan de gestión de datos?

4. ¿Cómo se escribe un plan de gestión de datos?

Los planes de gestión de uso de datos describen tu plan para conseguir muchos aspectos relacionados con el trabajo con datos. Generalmente incluyen la siguiente información, aunque no están limitados, son dinámicos, y puedes incluir toda la información relevante para que alguien puede utilizar esos datos y pueda reproducir tu proyecto.

Para redactar el Plan de tu proyecto de investigación es necesario que al menos registres la siguiente información:

  1. Proporciona la información básica de tu proyecto: título, cualquier número de seguimiento de proyectos, punto de contacto, etc. A continuación identifica el marco temporal del proyecto y las actividades de colección de datos (ejemplo: fecha de inicio y fin del proyecto los periodos de recogida de datos). Debes proporcionar también información de contacto para la plantilla de trabajo y los colaboradores involucrados en el proyecto; e identificar a la persona responsable en general del manejo de los datos, la adquisición, el procesamiento, control de calidad, documentación y almacenamiento. Si puedes, proporciona tu presupuesto estimado para las actividades de manejo de datos. Y si procede, identifica un acuerdo para compartir datos que defina los roles y las responsabilidades para la recogida de datos y para compartirlos (estas últimas etapas se definen conforme evoluciona el proyecto).
  2. Los tipos de datos. Describe cuál es la fuente o el origen de tus datos. El formato. Qué volumen de datos esperas que produzca tu proyecto, y si tus datos serán definitivos o podrán cambiar con el tiempo.
  3. Detalles del contexto de los datos (metadatos). Especifica cómo vas a documentar y describir tus datos.
  4. Almacenamiento, recuperación y seguridad de los datos. Cómo, dónde y quién se encargará de almacenar tus datos con seguridad y calidad.
  5. Protección y privacidad de datos. Identifica la persona a la que pertenecen los datos y cualquier cláusula de confidencialidad y privacidad de los datos.
  6. Política de uso de los datos. Identifica cualquier restricción inherente al uso de los datos del proyecto y cómo podrán otros investigadores usar tus datos.
  7. Acceso y publicación de los datos. Explica aquí como otros investigadores podrán descubrir tus datos y cómo les proporcionarás acceso a ellos. Archivos y permisos de acceso a los datos. Indica cuál es tu plan para preservar los datos y proporcionar acceso a largo plazo.

Otros enlaces interesantes para hacer tu PGD:

Fuentes:

https://guides.library.harvard.edu/c.php?g=471243&p=3223045

https://library.uoregon.edu/research-data-management/create-data-management-plan

5. Guías para hacer un plan de gestión de datos.

5. Guías para hacer un plan de gestión de datos.

El PGD es un documento sobre los datos de los proyectos que los investigadores deben cumplimentar, y que describe la propiedad, el origen, el formato, el tratamiento, la conservación, la seguridad y el uso de los datos a lo largo de todo el ciclo de vida de los datos en el proyecto de investigación. Este plan ha de detallar numerosos aspectos relacionados con:

  1. Los datos que se ofrecerán en abierto, con una descripción detallada de los mismos.
  2. El acceso a los datos, para su posible verificación y reutilización.
  3. La conservación de los datos, indicando el nombre y tipo de repositorio donde se depositarán

 

Una primera versión del PGD debe ser entregada durante los 6 primeros meses del proyecto. Pero como el Plan de Gestión de Datos no es un documento estático sino que evoluciona con el proyecto, se ha de actualizar al menos dos veces, a mitad del proyecto y a la finalización del mismo. Además se deberá hacer una nueva versión si hay cambios importantes de los datos durante el proyecto. La creación de un plan de gestión de datos es la mejor práctica para los proyectos de investigación que implican la colección y diseminación de datos. Los planes ayudan a asegurar que los datos que serán reunidos o generados por el proyecto tendrán la integridad, calidad y la procedencia adecuada para validar la investigación propuesta. Además, permitirá la replicación del proyecto y evitará la replicación. Además, cada vez más instituciones encargadas de financiar proyectos de investigación exigen un plan formal de gestión de datos.

Aquí tienes algunas fuentes que te ayudarán a crear tu propio plan.

Guidance for Creating a Data Management Plan in Horizon 2020 Projects–Version July 2018

https://dataverse.org

Dataverse.org/data-management/#template-for-data-management-plan

Data Management & Curation-DMP-Template

BestPracticesDataManagement-Oregon

DMP-Oregon

DMP-Odum

6. Protocolo. Modelo de plan de gestión de datos.

6. Protocolo. Modelo de plan de gestión de datos.

Esta es una guía básica con ocho tablas a la que puedes añadir más campos.

Tabla 1. DATOS ADMINISTRATIVOS

Información básica para identificar, reconocer y contextualizar el PGD

ID (código asignado por el financiador o la institución)

 

Agencia de financiación (nombre de quién sufraga el proyecto de investigación)

 

Número de referencia del proyecto

 

Nombre del proyecto (tal cual se ha solicitado/ concedido la subvención)

 

Descripción del proyecto (breve resumen de la investigación en la que se obtienen los datos, su naturaleza y objetivos)

 

Investigador(es) principal(es) (nombre del responsable del proyecto)

 

ID del investigador principal (preferiblemente ORCID)

 

Datos de contacto del proyecto (nombre de persona responsable, si difiere de los anteriores; e-mail y teléfono)

 

Fecha de la primera versión del PGD

 

Fecha de la última actualización del PGD

 

Política (directrices de gestión del proyecto, reglamentaciones o procedimientos emitidos por la institución propia, la agencia de financiación, la administración, etc.)

 

 

 

Tabla 2. DESCRIPCIÓN DE LOS DATOS

Información sobre cómo se obtienen los datos y cómo se lleva a cabo el proceso

Resumen de los datos (breve descripción de la naturaleza, contenido y alcance de los datos)

 

Propósito (finalidad de reunir o generar los datos y explicación de la relación con los objetivos del proyecto de investigación)

 

Origen (si se trata de datos reunidos o reutilizados, o consignación de que son generados en el proyecto)

 

Métodos (técnicas y procedimientos usados para reunir o generar los datos )

 

Tipo, formato y volumen (de los datos reunidos o generados, justificando las decisiones adoptadas respecto a formatos y tipos, sopesando las implicaciones del tamaño previsible o efectivo en almacenamiento, seguridad y accesibilidad)

 

Estructura (forma de organizar, jerarquizar y nombrar los datos en carpetas, archivos, etc., para que la información sea accesible

 

Control de versiones (convenciones y prácticas para controlar e identificar con claridad las sucesivas versiones de los datos)

 

Control de calidad (descripción de los procesos para asegurar la fiabilidad de los datos a largo de la investigación: calibración, repetición de mediciones, validación de entrada de datos, captura estandarizada, vocabulario controlado, etc.

 

 

Tabla 3. DOCUMENTACIÓN Y METADATOS

Información y documentación necesarias para entender y reutilizar los datos

Metadatos (esquema de los datos, índices o información que describen o localizan a los principales datos (recursos) que se reúnen o generan en el proyecto; es la información que ayudará a ubicar los datos)

 

Terminología e identificadores (sistemas de identificación, etiquetado de los datos que se empleará, vocabulario, léxico, ontologías o clasificaciones que se utilizarán para describir los datos

 

Documentación adicional (que acompañará a los datos para asegurar que sus usuarios comprendan, interpreten y puedan reutilizar, como metodología, definición de variables, unidades de medida, procedimientos, supuestos implícitos, programas, etc.)

 

 

 

 

Tabla 4. REQUERIMIENTOS ÉTICOS Y LEGALES

Aspectos éticos y legales que repercuten en restricciones sobre compartir datos

Privacidad (información sobre el cumplimiento de requisitos como consentimiento para conservar y compartir datos, protección de la privacidad de las personas, anonimización, seguridad en el almacenamiento y transferencia de la información, uso de imágenes, etc.)

 

Propiedad intelectual (quién es el titular de la propiedad intelectual de los datos. Tener en cuenta las directrices institucionales al respecto y aclarar bien en los casos de investigación cooperativa, consorciada, contratada, etc.)

 

Licencia de reutilización de datos (bajo qué licencia no restrictiva se va a permitir la reutilización de los datos: CC0, PDDL, CC-BY-4.0, etc.)

 

Restricciones (a terceras partes sobre la reutilización de los datos)

 

Embargos temporales (y razones; por ejemplo por publicación, patentes, etc.)

 

 

 

 

Tabla 5. ALMACENAMIENTO Y COPIAS DE SEGURIDAD

Información el almacenamiento de datos y su seguridad durante el proyecto

Almacenamiento (previsiones de almacenamiento de datos, capacidad necesaria e infraestructuras disponibles, medios con los que se cuentan y que se puedan seguir pagando)

 

Copias de seguridad (cómo se realizan y mantienen las copias de seguridad de los datos, procedimientos, frecuencia, localización, número de copias, soportes, etc.

 

Restauración de datos (cómo se recuperan los datos en caso de pérdida o accidente)

 

Responsabilidad (persona encargada de salvaguardar y restaurar los datos)

 

Gestión de riesgos (identificar los riesgos potenciales para la seguridad o integridad de los datos y medidas previstas de protección y gestión de riesgos)

 

Acceso a los datos (cómo se gestiona y controla el acceso de los colaboradores para trabajar con los datos o las transferencias de datos manteniendo la seguridad, integridad y confidencialidad (si es el caso) de los mismos

 

 

 

 

Tabla 6. SELECCIÓN Y PRESERVACIÓN DE LOS DATOS

Declaración de qué datos tienen valor a largo plazo y dónde deben conservarse

Preservar y compartir datos (identificación de los datos que tienen que ser retenidos o destruidos por razones contractuales, y cuáles pueden ser reutilizados para otra función: investigación, enseñanza, etc.)

 

Reutilización potencial (indicar cuáles son los usos previsibles de los datos para investigaciones futuras; para quién son útiles y para qué)

 

Plazo de conservación (previsible de los datos)

 

Repositorios (archivo o sistema de conservación y preservación a largo plazo de los datos. Especificar, si no, la forma en que se articulará la conservación y acceso público a los datos y los recursos implicados

 

Presupuesto para la conservación (costes del repositorio y tareas de preparación de datos para su conservación a largo plazo)

 

 

 

 

Tabla 7. COMPARTIR LOS DATOS

Información sobre cómo se comparten los datos públicamente

Localización (métodos o vías para descubrir, encontrar y acceder a los datos públicamente; a través de buscadores, bases de datos, repositorios, enlaces, webs, etc.)

 

Disponibilidad (previsión de fecha o momento en que los datos van a estar disponibles públicamente)

 

Identificadores (sistemas de identificación persistente, si se usa)

 

Condiciones (requisitos o procedimientos necesarios para consultar o utilizar los daos, formas de atender a los interesados, etc.

 

Restricciones (plazos de tiempo u otras restricciones sobre la disponibilidad y acceso a los datos)

 

Citación (forma recomendada de citar los datos que se comparten)

 

 

 

 

Tabla 8. RESPONSABILIDADES Y RECURSOS

Roles, responsabilidades y recursos en la gestión de datos

Funciones y responsabilidades (descripción de los roles y responsabilidades en la gestión de los datos (obtención, metadatos, fiabilidad, seguridad, colaboración, etc.) e identificación de las personas encargadas de cada función)

 

Recursos humanos (previsión del personal adicional especial para la gestión de datos)

 

Recursos tecnológicos (previsión de programas, discos duros, etc. adicionales y especiales para la gestión de datos)

 

Recursos económicos (previsión de gastos adicionales especiales para la gestión de datos)

 

 

Fuente:

Biblioteca de la Universidad de Cantabria

7. Recursos para gestionar datos.

7. Recursos para gestionar datos.

Existen muchos recursos concebidos para ayudar a los investigadores con la organización, la gestión y la conservación de datos. Desde la creación de un plan de gestión, y encontrar los tipos de datos adecuados para sus proyectos, hasta programas y manuales de formación en gestión y análisis de datos.

Aunque aquí te dejamos algunos enlaces útiles, no olvides consultar otras entradas en esta web para tener acceso a más recursos específicos sobre la gestión de datos.

  • Plan, Gestión y Organización de datos
  • Guías y documentos sobre programas informáticos para gestionar datos

Aquí te dejamos un enlace al directorio de la Universidad de Stanford de guías y documentos sobre los programas informáticos más populares empleados para la organización y análisis de datos. Entre ellos tienes: R, SAS, SPSS and Stata. En este otro enlace encontrarás mucha más información sobre estos y otros programas (como RStudio, Excel, MATLAB, S-PLUS, Minitab, QGis, GRASS, Data Description, etc.). Por otro lado, los sistemas de información geográfica son un ejemplo de recurso para organizar y gestionar los datos espaciales, así como para gestionar mapas, bases de datos climáticos, de inventarios forestales, etc.

Aquí te dejamos una muestra de este tipo de recursos:

 

 

Fuentes:

https://library.uoregon.edu/data-services

http://biblioteca.uoc.edu/es/investigacion/gestion-de-los-datos-de-investigacion

http://biblioteca.uoc.edu/es/investigacion/herramientas

https://www.usgs.gov/products/data-and-tools/data-management/data-lifecycle

https://www.usgs.gov/products/data-and-tools/data-management/overview-data-management

https://guides.library.oregonstate.edu/research-data-services/lifecycle

https://library.uoregon.edu/research-data-management/best-practices

https://biblioguias.unex.es/datos_de_investigacion/gestion#s-lib-ctab-14467661-1

DÓNDE ESTAMOS

ETS Ingenierías Agrarias Universidad de Valladolid - Avd. Madrid s/n
34004 - PALENCIA - Localización
www5.uva.es/etsiiaa/


INIA-CIFOR - Ctra. A Coruña km 7,5
28040 - MADRID - Localización
www.inia.es