Ir ao contido principal
BIBLIOGUÍAS
Universidade de Vigo

Datos de investigación

Recursos para localizar datos

Existen diferentes ferramentas para localizar datos de investigación que poden ser reutilizados, entre eles:

Formatos dos datos

Todos os datos de investigación xerados dun proxecto de investigación deben almacenarse en diferentes formatos e arquivos. Nun Plan de Xestión de Datos débese detallar o formato no que os datos da investigación serán recollidos e almacenados. 
É recomendable que o almacenamento destes datos se realice en formatos estándar, en aberto, sen cifrar e sen comprimir, garantindo o seu acceso a longo prazo.
Denomínase formato estándar aquel que a maioría dos softwares son capaces de interpretar e que é adecuado para o intercambio e a transformación dos datos.

Cada tipo de datos de investigación ten formatos recomendados e non recomendados (DANS). De forma xeral, cada convocatoria soe indicar os formatos axeitados para cada tipo de datos.

Nomear arquivos

A nomenclatura utilizada para nomear estes ficheiros debe plasmar o seu contido e ser inequívoca.
Existen algunhas recomendacións para nomear os arquivos:

  • Crear nomes identificativos pero curtos (ex. usar acrónimos).
  • Conservar as extensións dos códigos de aplicacións (.pdf, .wrl, .tif).
  • Usar o guión baixo (_) no canto de espazos en branco entre palabras.
  • Evitar o uso de caracteres especiais (:;/=$|[]*<>”¿).
  • Plasmar a actividade ou o proxecto no nome do arquivo. Poden conter o acrónimo do proxecto, o nome dos investigadores, o tipo de datos e o lugar de estudo.
  • Evitar denominar os ficheiros por un número, non é descritivo do contexto do rexistro.
  • Non superar os 25 caracteres.
  • En rexistros onde haxa varias versións é recomendable diferencialas unhas das outras indicando v01, v02 etc.
  • Definir a diferenza entre as distintas versións (novos parámetros, novos formatos, cambios na cobertura espacial e/ou cronolóxica...).
  • A versión definitiva pódese chamar “versión FINAL”. Para estes casos é aconsellable unha coherencia interna e un mesmo criterio de denominación para cada ficheiro.

Metadatos

Cómpre describir os datos para poder identificalos e organizalos. Esta descrición faise a través dos metadatos, conxunto de información estruturada que ha de recoller a orixe, propósito, referencia temporal, localización xeográfica, creador, condicións de acceso e termos de uso dun dataset.

Os metadatos estrutúranse en rexistros conforme a esquemas normalizados que deben utilizarse para unha correcta descrición, interpretación e reutilización dos datos de investigación. Existen varios estándares de metadatos, normalmente cada área de coñecemento ten o seu estándar propio e as súas ferramentas (que facilitan a creación e/ou captura de metadatos), e no caso de que non existan para unha disciplina pódense usar outros esquemas xenéricos:  

Datos persoais

Os datos sensibles son datos que deben protexerse contra unha divulgación non desexada.  A protección de datos sensibles pode ser necesaria por motivos legais ou éticos. 
Exemplos de datos sensibles son:

  • Datos persoais: nomes ou números de identificación, características físicas, fisiolóxicas, xenéticas, mentais, económicas, culturais ou sociais, tamén inclúe datos de localización de GPS ou teléfonos móbiles.
  • Datos confidenciais: segredos comerciais, investigacións, datos protexidos por dereitos de propiedade intelectual, contrasinais, información financeira, seguridade nacional etc.
  • Datos biolóxicos: especies (vexetais ou animais) en perigo, cuxa supervivencia depende da protección dos seus datos de localización.

En particular, deben tratarse con coidado os datos de investigación que conteñan datos persoais cos que poida identificarse, directa ou indirectamente, a unha persoa. A protección de datos persoais é unha cuestión prioritaria, polo que se debe planificar desde o comezo do proxecto de investigación xa que afecta ao medio de almacenamento elixido, ao acceso aos datos, á compartición de copias, aos protocolos de seguridade, ao tratamento de datos persoais etc.

Cando se almacenan datos sensibles, se resulta necesario os datos serán: 

  • Seudonimizados: substitúe a identidade da persoa de tal maneira que se require información adicional para volver identificalo. Seguen sendo datos persoais pero que non permiten identificar a un suxeito, xa que a información adicional que permitiría dita identificación mantense por separado.

Técnicas para a seudonimización dos datos:

  • Anonimizados: referidos a información que non pode asociarse a unha persoa identificable, destrúe irreversiblemente calquera forma de identificar a persoa.

Técnicas para a anonimización dos datos:

  • Cifrados: cifrar os datos sensibles antes de compartilos, empregando un cifrado potente e unha xestión adecuada das claves. 

Ademais, debe obterse consentimento informado das persoas implicadas no proxecto para o tratamento dos seus datos. Consentimento informado é o procedemento mediante o cal se garante que o suxeito expresou voluntariamente a súa intención de participar na investigación, despois de comprender  a información que se lle deu, acerca dos obxectivos do estudo, os beneficios, as molestias, os posibles riscos, os seus dereitos e responsabilidades.

Normativa: