HUB

Buenas Prácticas

Fuentes de datos

Fundamentos

Buenas Prácticas

 

Como investigadores o gestores forestales en nuestro trabajo estamos acostumbrados a tratar con datos diversos, tanto cuantitativos como cualitativos. Sin embargo, habitualmente no disponemos de formación adecuada sobre este tema.

Conocer más...

La gestión efectiva y eficiente de datos es una de las actividades críticas en cualquier organización. . Una buena planificación en la gestión de datos puede ayudar al desarrollo de nuestro trabajo.

Conocer más...

El almacenamiento de datos es una fase clave para que estos sean reutilizables y puedan enriquecer nuestro trabajo futuro. 

Conocer más...

La recolección, revisión y mantenimiento de bases de datos a largo plazo son claves en la investigación forestal y de otros ecosistemas por ello los conjuntos de datos son cada vez más reconocidos como productos académicos por derecho propio, y como tal, ahora se pueden presentan para su publicación de forma independiente de los análisis científicos.

Conocer más...

El desarrollo de aplicaciones informáticas se ha convertido en una fase clave en el proceso de difusión de resultados y transferencia de conocimiento en investigación. Nuevas habilidades en programación y comunicación digital efectiva son cada día más necesarias para dar a conocer investigaciones basadas en Ciencia de Datos.. 

Conocer más...

Como investigadores o gestores forestales en nuestro trabajo estamos acostumbrados a tratar con datos diversos, tanto cuantitativos como cualitativos. Sin embargo, habitualmente no disponemos de formación adecuada sobre este tema.

01. Ciclo de vida de los datos en proyectos de investigación

01. Ciclo de vida de los datos en proyectos de investigación

Los modelos de ciclo de vida de datos en proyectos de investigación ilustran las etapas del manejo de datos y describen como fluyen los datos durante el proyecto de investigación de inicio a fin.

En cada etapa hay que definir la propiedad de los datos, la documentación de los datos, el almacenamiento, la seguridad y el control de calidad de los datos. Todas pueden ocurrir simultáneamente (Figura 1).

 

Data Management

Figura 1: Manejo de datos durante el ciclo de vida de los proyectos de investigación (fuente: https://www.usgs.gov/datamanagement/)

 

Aquí tienes una lista de las etapas o componentes del ciclo de vida de los datos, y de la información básica que tendrás que identificar en cada una de ellas (https://www.usgs.gov/datamanagement/):

 

  • Elaboración de un Plan de Gestión de Datos (PGD) en proyectos de investigación:

Un PGD es un documento formal que describe qué vas a hacer con los datos durante el proyecto y después de que finalice el proyecto. La mayoría de los investigadores obtienen sus datos en base a un plan, un cronograma y unos objetivos. El mayor beneficio de tener un plan de gestión de datos es el reconocimiento, su reproducibilidad.

Proporciona la información básica de tu proyecto: título, cualquier número de seguimiento de proyectos, punto de contacto, etc. a continuación identifica el marco temporal del proyecto y las actividades de colección de datos (ejemplo: fecha de inicio y fin del proyecto los periodos de recogida de datos). Debes proporcionar también información de contacto para la plantilla de trabajo y los colaboradores involucrados en el proyecto; e identificar a la persona responsable en general del manejo de los datos, la adquisición, el procesamiento, control de calidad, documentación y almacenamiento.

Si puedes, proporciona tu presupuesto estimado para las actividades de manejo de datos. Y si procede, identifica un acuerdo para compartir datos que defina los roles y las responsabilidades para la recogida de datos y para compartirlos (estas últimas etapas se definen conforme evoluciona el proyecto).

  • Adquisición de los datos:

Durante la etapa de adquisición de datos del proyecto, proporciona información básica para identificar cada base de datos (título, descripción, fuente, punto de contacto). Describe el objetivo de cada base de datos en el contexto del proyecto de investigación. Identifica cualquier restricción inherente al uso de las bases de datos. Identifica el formato de cada base de datos y los requerimientos de almacenamiento de cada base de datos.

  • Durante el procesamiento y análisis de los datos:

Registra las transformaciones de los datos, acciones y cualquier paso en el procesamiento para producir las bases de datos final (destinada al análisis). Describe también las tecnologías y modelos que se usarán durante el procesamiento de los datos.

En el caso de los modelos, programas y código, haz una lista de entradas y salidas de datos y detalles de calibración.

  • Almacenamiento de datos:

Para guardar los datos, documenta quién será el responsable de asegurar la conservación de los datos. Indica también los formatos de los datos y el volumen indicado de las bases de datos finales. También es importante que definas los repositorios donde se van a almacenar tus datos y las bases de datos que proporcionaran tus bases de datos finales, los programas, modelos o código.

  • Publicación y distribución de datos:

Proporciona información sobre una identificación preliminar de las publicaciones que puedan surgir de esa base de datos (título, descripción, lista de autores, etc.). Describe el formato anticipado de cada publicación (revistas, tipos de datos, modelos, etc.). Indica como planeas mantener y actualizar los registros de metadatos en formatos estándar FGDC o ISO XML. Describe cómo (herramienta, persona encargada, etc.) se asignará un número de objeto identificador digital (DOI) a cada base de datos aprobada para distribuir. Indica también cualquier restricción inherente que pueda ser impuesta en el producto derivado en el uso de salidas de datos con propietario u otros factores.

  • Descripción de los metadatos, manejo de la calidad, recuperación y seguridad de datos:

Describe las herramientas o procesos que se usarán para crear los metadatos, e identifica a la persona responsable de crear los archivos de metadatos. Documenta las responsabilidades y roles del equipo del proyecto y todos los procedimientos operacionales. Identifica la localización de los recursos internos de almacenamiento para proporcionar una réplica y la capacidad de recuperación de datos, y que será empleada para almacenar los datos obtenidos durante el proceso de análisis. Indica el contacto de la persona que se encargará de los dispositivos de almacenamiento.

Fuentes:

https://www.usgs.gov/products/data-and-tools/data-management/data-lifecycle

https://www.usgs.gov/products/data-and-tools/data-management/overview-data-management

https://guides.library.oregonstate.edu/research-data-services/lifecycle

https://library.uoregon.edu/research-data-management/best-practices

02. Los datos en Ciencia

02. Los datos en Ciencia

Un dato es la representación simbólica de un hecho, atributo o característica de una entidad. En ciencia, los datos se recogen o recolectan para validar hipótesis o describir la naturaleza o propiedad de “algo”. En función del investigador y su disciplina, este te dirá que los datos son más importantes que comprobar las hipótesis, o que las hipótesis son más importantes que los datos. La realidad es que las hipótesis sin datos no tienen sentido y los datos sin hipótesis al final se desperdician.

Algunas de las razones por las que un dato puede ser inservible son que no sea probable o plausible, o que no sea repetible. O puede suceder que sean datos que tengan valor y precisión pero que sean irrelevantes para solucionar el problema de estudio para el que se tomaron. O puede que el diseño experimental no sea el adecuado y que no se pueda emplear la técnica estadística apropiada para el análisis de los datos. Por eso, es importante que valores como investigador/profesional que no todo lo que se puede medir debería medirse, y que a la hora de diseñar un experimento y a la hora de elegir los datos que vas a coger, consideres también qué técnica estadística vas a emplear para comprobar tus hipótesis o conseguir tu objetivo.

A la hora de diseñar tu estudio y tomar los datos que te interesan, sé consciente de la naturaleza de tu objeto de estudio y del fenómeno que quieres estudiar para elegir bien el método de muestreo más adecuado, el tamaño de la muestra, el número de repeticiones y las escalas de medida. No des nunca una estimación sin una medida de error, y sé escéptico con los resultados de la significación de los test estadísticos. Y recuerda: significación estadística no implica significación biológica.

Una vez que tienes tus datos toca volcarlos a una hoja de cálculo u hoja de datos en un ordenador. El formato va a depender del programa que elijas para hacer tu investigación. La estructura de la hoja o base de datos la tendrás que diseñar en función de la naturaleza de tu estudio. Lo que sí tienes que organizar bien es el número de dígitos y decimales de cada medida, y guardar siempre una copia de los datos en bruto para poder recalcular o volver a los datos originales siempre que puedas. Mantén siempre los casos, tratamientos o áreas de estudio bien identificadas en esos datos en bruto.

Y por último, pero no menos importante, intenta conseguir buenos datos y anticiparte a los problemas técnicos e instrumentales para no perder datos o tener datos malos (recuerda la regla de Krebs: “garbage in, garbage out”).

Fuentes:

Krebs, Ch. J. 1999. Ecological methodology. 2nd Edition. Addison-Welsey Educatioal Publishers, Inc. California.

03. Registro de datos en los cuadernos de laboratorio/campo.

03. Registro de datos en los cuadernos de laboratorio/campo.

Una documentación detallada y consistente de tus métodos de investigación, cálculos y resultados es importante no sólo para tu uso personal sino también para publicar tus resultados u otra forma de compartir tu investigación. Y es especialmente importante para otras-os investigadores que quieren reproducir lo que tú has hecho.

Los cuadernos de laboratorio y de campo, en formato papel o electrónico, son un componente crítico de la toma de datos en investigación y de su seguimiento en el tiempo. Son los documentos que explican el origen de la investigación, cómo se llevó a cabo y los resultados obtenidos. Son un legado del laboratorio o departamento en el que se realizan las investigaciones y un documento legal para probar patentes y defender tus datos. Se trata de un diario de investigación. Recoge todos y cada uno de los experimentos realizados con las incidencias de todo tipo que se hayan producido durante su realización. Debe decir exactamente lo que se hizo y cuándo para permitir que otra persona en el futuro haga lo mismo. Si se puede extraer un protocolo, hazlo. Anota la fecha, el título del experimento y los objetivos, métodos y toda la información relativa al tipo, entrada y registro de los datos, formato, modificación y todo lo que creas necesario para almacenar, gestionar y compartir tu investigación: las unidades, características, material empleado, equipo, modelos, etc.

El cuaderno de laboratorio/campo en formato físico debe ser un cuaderno de tapa dura, con hojas numeradas. Se debe escribir con material indeleble (nunca con lápiz). Nunca debe borrarse nada. Si se comenten errores, se tachan de forma que aun pueda leerse lo que se hizo. En la actualidad existen cuadernos en formato electrónico digital que son básicamente un programa especializado con el que llevar un completo registro de la actividad investigadora, pudiendo el investigador acceder desde un portátil, teléfono móvil o una tablet.

El propietario del cuaderno, aunque lo inicies tú, es la persona encargada de financiar la investigación, la universidad, el departamento o tu supervisor. Puedes hacer una copia para acabar tus publicaciones

Aquí tienes una lista de enlaces y guías que te ayudarán a organizar tu cuaderno de laboratorio/campo:

Si optas por un cuaderno de laboratorio electrónico, echa un vistazo a la comparación de características y especificaciones de los diferentes cuadernos compilados por la Universidad de Harvard.

Fuente:

Texto adaptado a partir de contenidos de la Universidad de Oregón.

04. Gestor de referencias bibliográficas

04. Gestor de referencias bibliográficas

Es un software que permite crear, almacenar, organizar, compartir e insertar referencias bibliográficas, las cuales recoge de las fuentes de información. Existen multitud de gestores de referencias bibliográficas de software gratis como de pago.

Características
- Incorporar y almacenar referencias: La entrada de datos en los gestores bibliográficos puede darse de distintas maneras:

  • Automática: el gestor bibliográfico es capaz de extraer la información desde la propia fuente de información, para esto en la actualidad un gran número de revistas electrónicas, bases de datos, catálogos y repositorios disponen de formatos de salida a gestores de referencias.
  • Directa: Mediante el método directo los datos se incluyen desde el propio gestor de manera manual rellenando cada uno de los campos de descripción habituales (autor, título, etc.).
  • Indirecta: Mediante el método indirecto en las webs que así lo disponen es posible generar un formato RIS que posteriormente es importado por el propio gestor bibliográfico.

- Organizar y describir listados bibliográficos: Este tipo de gestores permiten organizar toda su información mediante un sistema de carpetas y subcarpetas generadas por el propio usuario “ad hoc” además de un exhaustivo control de autoridades para permitir una adecuada recuperación de la información junto con un control de duplicados. Las referencias pueden ser descritas de manera individual o colectiva para su posterior recuperación.
- Salida de datos: Los gestores bibliográficos permiten citar y la creación de bibliografías exportando las referencias bibliográficas individualmente o en listados, en distintos formatos (.rif, .txt, .html, .bib, .ris, .xml, etc.) integrándose en procesadores de textos y mediante envío de ficheros.
 

05. Cómo documentar bases de datos y metadatos.

05. Cómo documentar bases de datos y metadatos.

Para asegurar que los datos pueden ser compartidos y reusados por otros agentes o investigadores, sea cual sea el objetivo de estos, es necesario hacer un esfuerzo para que sean entendibles, accesibles y usables. Esto requiere una descripción detallada y clara de los datos, más una información del contexto y documentación de los datos que explique cómo se crearon o digitalizaron los datos. Qué significado tienen, qué contienen, cómo es su estructura y cualquier manipulación o transformación que hayan recibido para llegar al dato final (trazabilidad del dato). Se debe hacer una descripción a varios niveles: estudios/ensayos/proyectos, bases de datos, datos/items, etc.

Por ejemplo, para las bases de datos, los metadatos tienen que describir el contenido, el contexto y el origen de las bases de datos de forma estructurada y estandarizada. En este caso, generalmente describen el objetivo, el origen, características temporales, localización geográfica, autores, condiciones de acceso y términos de uso. Esta descripción proporciona información estructurada y que se puede buscar, que ayuda a los usuarios a encontrar fuentes de datos y que les permite decidir si una base de datos es útil para su investigación u objetivo, y proporciona un registro bibliográfico para citar los datos.

Tienes más información para documentar tus proyectos, bases de datos y datos, así como herramientas y recursos que te ayudarán en la documentación, en las siguientes fuentes.

Fuentes:

https://www.ukdataservice.ac.uk/manage-data/document/study-level.aspx

https://www.ukdataservice.ac.uk/manage-data/document/data-level.aspx

https://www.ukdataservice.ac.uk/manage-data/document/metadata.aspx

https://www.ukdataservice.ac.uk/manage-data/document/resources.aspx

https://mantra.edina.ac.uk/documentation_metadata_citation/

https://www.fgdc.gov/metadata/

06. Definición de dato

06. Definición de dato

The United States Office of Management and Budget defines data in the following way: 

"Research data is defined as the recorded factual material commonly accepted in the scientific community as necessary to validate research findings, but not any of the following: preliminary analyses, drafts of scientific papers, plans for future research, peer reviews, or communications with colleagues. This "recorded" material excludes physical objects (e.g., laboratory samples). Research data also do not include:

(A) Trade secrets, commercial information, materials necessary to be held confidential by a researcher until they are published, or similar information which is protected under law; and
(B) Personnel and medical information and similar information the disclosure of which would constitute a clearly unwarranted invasion of personal privacy, such as information that could be used to identify a particular person in a research study.”

Basado en Oregon State University Research Data Services

07. Tipos de datos

07. Tipos de datos

Los datos que se pueden encontrar en un trabajo o investigación son, en escasas ocasiones, de un único tipo. Debido a la naturaleza, el origen y otras características de los datos, podemos encontrar en la mayoría de los estudios multitud de tipos de datos, y múltiples clasificaciones. Según su origen pueden ser:

  • Observacionales: son registrados in situ, e imposibles de volver a tomar.
  • Experimentales: registrados en condiciones controladas, en laboratorio o in situ, y pueden ser reproducidos (algo que puede ser costoso).
  • Derivados o compilados: proceden de la integración de datos (compilados) de otras fuentes o creados a partir de otros existentes (derivados).
  • Simulaciones: estos datos se obtienen a través de usos de modelos que representan un fenómeno.
  • Canónicos: se trata de una colección de datos estática, mantenida de alguna u otra manera.

Según su naturaleza, los datos también se pueden clasificar en:

  • Cualitativos: son medidas categóricas que se expresan en lenguaje natural descriptivo.
  • Cuantitativos: son medidas que se expresan en forma de números.
  • Espaciales: incluyen referencias geográficas o geoespaciales, donde la vinculación con otras variables es crítica.
  • Fotografías, vídeos y registros de audio (multimedia).
  • Documentación y scripts.

08. Más información sobre Tipos de Formatos de Datos

08. Más información sobre Tipos de Formatos de Datos

La elección del tipo de formato viene determinada, por una parte, por el objetivo de conseguir la máxima accesibilidad, es decir, la compatibilidad del archivo con la mayor cantidad de programas posibles; y por otra parte, por la calidad con la que permite ser guardado y descargado, esto es, que no tenga pérdidas de información cada vez que se abre y se cierra, o se comprime y descomprime, puesto que de esta manera se evita la modificación o eliminación de los datos con el uso. Esta última característica permite reconstruir exactamente los datos originales cuando se va a hacer uso de ellos. Otro aspecto a tener en cuenta es el tamaño del fichero y la posibilidad de compresión. A tener en cuenta que esta compresión está unida al uso y compatibilidad con unos codecs (programa encargado de comprimir y descomprimir la información del archivo), por lo que la accesibilidad se puede ver mermada, especialmente en el caso de archivos de vídeo comprimidos (que puede necesitar codecs específicos para cada tipo de información almacenada).

Formatos de imágenes:

  • GIF: formato que compone las imágenes para mapas de bits de hasta 256 colores (8 bits), lo que limita la calidad de la imagen. Como punto positivo destacar la posibilidad de generar animaciones, zonas transparentes, y la posibilidad de compresión sin pérdidas en un archivo ligero.
  • PNG: Es un formato que compone imágenes para mapas de 24 bits (16777215 colores), por lo que la paleta de colores es mucho mayor que el GIF. Permite crear zonas transparentes, y la compresión sin pérdidas ni generación de ruido al descomprimir.
  • JPEG o JPG: formato de almacenamiento de imágenes de alta resolución con posibilidad de alta compresión en un archivo muy ligero. La desventaja es que al descomprimir genera ruido (bordes y áreas de coloración difusa) y esta compresión es con pérdidas de matices (es decir, los píxeles no se guardan exactamente con las mismas características originales sino parecidas, por lo que la imagen va cambiando con sucesivos guardados).
  • TIFF: formato sin pérdidas en la calidad de la imagen al abrir el archivo y permite ser usado por prácticamente todos los programas de edición, diseño y visualización de imágenes. También cabe destacar que, además de los datos de la imagen, contiene información de las características de la imagen, muy útil para su tratamiento posterior. Ocupa un gran tamaño. Actualmente, existen algoritmos para la compresión de este tipo de archivos aunque no se aplican a nivel de archivado de imágenes en bancos de datos.

Formatos de sonido:

  • MP3: formato con una alta capacidad de compresión y alta calidad, aunque con una pequeña pérdida de calidad en el proceso y pérdida de matices sonoros fuera de las frecuencias de 15-200 Hz (poco o nada audibles para el oído humano).
  • OGG: formato de compresión de archivos de audio con pérdidas de calidad, aunque tiene mayor calidad que los anteriores. Tiene la ventaja de que es libre y abierto.
  • MIDI: formato que almacena sonidos procedentes de un instrumento musical gracias a un sintetizador. Tiene herramientas específicas de edición. Permite guardar secuenciasde sonido largas en un archivo de poco peso, pero no composiciones con riqueza de matices sonoros.
  • FLAC: formato que permite cierta compresión de audio (entre un 30 y un 50%) sin pérdida de calidad, por lo que mantiene una calidad alta pero con un peso de archivo considerable.
  • WAV: formato con excelente calidad de audio pero genera archivos de mucho peso, incluso se utiliza un sistema de compresión. Puede soportar prácticamente todos los codecs de audio.
  • AIFF: formato de sonido sin compresión y con alta calidad de almacenamiento de audio pero, como en este tipo de archivos, su tamaño es considerable. Es muy utilizado para su uso en aplicaciones musicales.

Formatos de vídeo: Este tipo de archivo es más complejo que los dos anteriores porque puede almacenar uno o varios tipos de datos (audio, vídeo, subtítulos, imágenes 3D, etc) en un mismo archivo.

  • AVI: formato que permite canales de audio y vídeo; es prácticamente compatible con cualquier códec, pero no tiene alta resolución como otros formatos.
  • MOV: formato de vídeo de usado en muchas cámaras digitales, pero poco reproducido por dispositivos y programas.
  • MKV, MK3D: formato de código abierto que permite canales de vídeo, audio y subtítulos (.mkv), o vídeo 3D (.mk3d). Sin embargo, necesita de unos codecs específicos para poder ser reproducidos.
  • ASF (.wmv): formato de alta resolución de vídeo y audio multicanal.
  • VOB: formato que permite audio y vídeo para su almacenamiento, preferiblemente, en CD o DVD. Para extraer los archivos almacenados de esta forma en CD o DVD necesita de un programa especial para que puedan ser utilizados por otras aplicaciones.
  • MPEG: formato de audio y vídeo usado por la televisión digital y en DVD. Su resolución es limitada aunque tiene una alta compatibilidad con todo tipo de reproductores.
  • MP4: formato que permite canales de vídeo, imágenes, subtítulos, audio y otros descriptores. Tiene gran capacidad de compresión y un pequeño tamaño, por lo que es muy usado en dispositivos portables y en Blue-ray.
  • MXF-JPEG2000 (.mj2): formato de vídeo con compresión y sin pérdidas, que permite además mostrar imágenes en diferentes resoluciones.
  • ASF: Formato creado para archivos de vídeo en “streaming”.

09. Datos relacionados con Identificadores de Investigadores.

09. Datos relacionados con Identificadores de Investigadores.

Un identificador de autor es un código único que pertenece al investigador y que permite reunir su labor investigadora y profesional, distinguiéndose de forma unívoca de otros investigadores y asociando sus publicaciones científicas. Mientras que un perfil de autor es una página web donde aparecen asociados el nombre del investigador y un número que lo identifica de forma unívoca. La información sobre el autor se completa añadiendo datos biográficos, palabras clave de su área de investigación, instituciones para las que investigan, listado de publicaciones y proyectos de investigación. Los identificadores únicos de autor sirven para evitar confusiones de autoría, aumentar la visibilidad del investigador, para garantizar la conexión entre diferentes sistemas de información, mejorar la comunicación científica y participar en convocatorias nacionales e internacionales. En cuanto a los perfiles, hay perfiles que son completamente públicos y otros permiten que el autor decida la información que será pública y cuál de consulta privada. Los principales son:

  • Orcid
  • ResearcherID
  • Scholar Google Citations
  • Publons
  • Scopus Author ID
  • Autor Dialnet
  • My Citations
  • Academia.edu
  • Mendeley

Fuentes:

https://orcid.org

http://biblioguias.biblioteca.deusto.es/c.php?g=155486&p=1839875

http://guiasbuh.uhu.es/firmacientifica/pefilesautor

10. Datos abiertos y enlazados (vinculados)

10. Datos abiertos y enlazados (vinculados)

Nos encontramos en la era del Big Data y la creciente generación de datos necesita herramientas para almacenarlos, conectarlos y utilizarlos. Desde hace unos años, la Comisión Europea está apostando por un acceso abierto a los datos públicos (financiados con fondos públicos), tanto por la ciudadanía como por las empresas, ya que esto supone un motor al desarrollo de la sociedad de la información y el conocimiento y de la economía, muy especialmente para aquellas empresas del sector de la tecnología y la información. Ahora bien, para conseguir el máximo nivel de reutilización de la información se debe utilizar la tecnología Linked Open Data, en adelante LOD, lo que implica tener que realizar un esfuerzo en transformar y catalogar los datos para que estos sean útiles, identificables e interoperables. En informática, los datos enlazados o datos vinculados (a menudo referidos en inglés como Linked Data) describe un método de publicación de datos estructurados para que puedan ser interconectados y más útiles. Se basa en tecnologías Web estándar, tales como HTTP, RDF y los URI, pero en vez de utilizarlos para servir páginas web para los lectores humanos, las extiende para compartir información de una manera que puede ser leída automáticamente por ordenadores. Esto permite que sean conectados y consultados datos de diferentes fuentes. Es decir, la tecnología LOD vincula los datos con los de otras personas, dotándolos de contexto (la información entregada también apunta a otras fuentes de datos).

Son muchos los beneficios que organizaciones y ciudadanos pueden obtener de los datos LOD. Échales un vistazo en el siguiente enlace: Guía Linked Open Data para Archivos Universitarios-2017-CRUE.pdf

Fuentes:

https://es.wikipedia.org/wiki/Datos_enlazados

Recomendación_EU_acceso a la información científica y su preservación_2018

11. Cómo citar datos y bases de datos.

11. Cómo citar datos y bases de datos.

Desde hace unos años, la necesidad de citar las fuentes de datos (datasets) de los trabajos académicos ha cobrado importancia. La cita permitiría identificar fácilmente los datasets que articulan estos trabajos, así como recuperar e incluirlos en indicadores y sistemas de evaluación (Figura 2); siendo así más fácil la divulgación de los resultados de la investigación a la sociedad. Además, los investigadores podrían beneficiarse del reconocimiento profesional a través de la medición del impacto de los datasets. El impacto de los datasets podría medirse de la misma manera que una publicación científica. Visita el enlace de la Declaración Conjunta de los Principios de Citación de Datos (DC) para leer sobre la importancia de la citación de datos de investigación. Los datos básicos que se deberían incluir son:

  • La referencia bibliográfica con los metadatos para su identificación.
  • Identificador persistente tipo Handle o DOI.

Figura 2. Información y ejemplo para citar datos en investigación (Fuente: Cita tus datos de investigación-CRUE-REBIUN)

Aquí tienes otros ejemplos de citación bibliográfica:

  1. Mazarrasa, Inés; Marbá, Nuria; Hendriks, Iris E.; Losada, I.J.; Duarte, Carlos, M. 2013. Sediment accretion and soil elevation rates of vegetated coastal sediments [Dataset] https://digital.csic.es/handle/10261/77396 (ejemplo tomado de Digital CSIC).
  2. DOI Citation Formatter. Es un servicio ofrecido por Data Cite (datacite.org/dois) que construye automáticamente las citas conforme al estilo que seleccionemos. Recomiendan el siguiente formato:

Creator (PublicationYear): Title. Version. Publisher. Resource Type. Identifier (DOI)

  • Creator/ Autor: puede ser un autor individual, colectivo (grupo de personas) o una organización.
  • Fecha de publicación: año de publicación del dataset o fecha en que fue accesible online
  • : denominación del dataset
  • : etapa del procesamiento de datos, indicando si son datos en bruto o refinados
  • : aumenta de número según cambian los datos, fruto de revisiones y actualizaciones
  • : entidad responsable de producir y/o distribuir el dataset. El productor es la organización que patrocina la investigación; y el distribuidor es la organización que da accesibilidad al dataset para su descarga y uso.
  • Tipo de recurso: “database”, “dataset”
  • Ubicación: URL persistente que permita acceder al conjunto o subconjunto de datos (DOI, Handle …).

Fuentes:

Universidad de Alcalá.

https://guiasbuh.uhu.es/c.php?g=498100&p=3943722).

12. Propiedad intelectual y autoría de los datos, bases de datos y programas de ordenador y propiedad intelectual.

12. Propiedad intelectual y autoría de los datos, bases de datos y programas de ordenador y propiedad intelectual.

La propiedad intelectual de una obra literaria, artística o científica corresponde al autor por el sólo hecho de su creación. De esta forma, muchos tipos de datos creados como parte de los proyectos de investigación están sujetos a las mismas leyes y adquieren derechos como el copyright o de Propiedad Intelectual. Este hecho permite al autor controlar el acceso y la explotación de su trabajo. Por ejemplo a través de la copia y la adaptación, el préstamo o alquiler, y le da el derecho a comunicarlo a la sociedad y el derecho a obtener una licencia de explotación y distribución.

Si hablamos de los derechos sobre bases de datos, podemos decir que el derecho “sui generis” sobre una base de datos protege la inversión sustancial, evaluada cualitativamente o cuantitativamente, que realiza su fabricante ya sea de medios financieros, empleo de tiempo, esfuerzo, energía u otros de similar naturaleza, para la obtención, verificación o presentación de su contenido. De forma que, el fabricante/creador de la base de datos puede prohibir la extracción y/o reutilización de la totalidad o de una parte sustancial del contenido de ésta, evaluada cualitativa o cuantitativamente. Este derecho podrá transferirse, cederse o darse en licencia contractual.

En España, la ley más importante que regula todos estos aspectos nombrados es el Real Decreto Legislativo 1/1996, de 12 de abril, de la Ley de Propiedad Intelectual. El derecho de autor sobre los programas de ordenador y toda su documentación preparatoria (manuales y documentación técnica) también se rige por varias disposiciones recogidas en el Real Decreto Legislativo 1/1996, de 12 de abril, de la Ley de Propiedad Intelectual.

Fuentes:

Ley 24/2015, de 24 de julio, de Patentes

Ley 1/1996, de 12 de abril, de la Propiedad Intelectual

https://www.bibliopos.es/derecho-sui-generis-sobre-las-bases-de-datos/

https://www.ukdataservice.ac.uk/manage-data/rights/other-rights.aspx

https://guides.library.oregonstate.edu/research-data-services/data-licensing-ip

DÓNDE ESTAMOS

ETS Ingenierías Agrarias Universidad de Valladolid - Avd. Madrid s/n
34004 - PALENCIA - Localización
www5.uva.es/etsiiaa/


INIA-CIFOR - Ctra. A Coruña km 7,5
28040 - MADRID - Localización
www.inia.es