Série 1 | Curso 1

O que é Ciência Aberta?

Aula 3

Dados de pesquisa abertos

O compartilhamento e a gestão dos dados de pesquisa é outro dos componentes fundamentais da ciência aberta.

Nesta aula você poderá compreender:

  • Em que consistem dados de pesquisa
  • O que são dados abertos
  • Em que medida gerenciar os dados produzidos é uma boa prática que reforça a integridade da pesquisa
  • Quais são e o que significam os princípios FAIR

Dados de pesquisa

Os dados de pesquisa incluem todos os registos produzidos, obtidos ou usados durante o processo de pesquisa que possam validar os seus resultados. Podem assumir várias formas: registos de texto, imagem, vídeo, áudio, tabelas, resultados de questionários, entrevistas, observações, simulações, experiências, artefactos, fotografias, contribuições em redes sociais, entre outros.

É importante referir que apesar de se advogar a abertura dos dados de pesquisa sempre que possível, existem boas razões para não compartilhar dados: razões de privacidade ou segurança de indivíduos ou entidades envolvidos na investigação, propriedade intelectual ou condicionalismos legais.

Dados Abertos

Segundo a Open Definition dados abertos são dados que podem ser livremente utilizados, reutilizados e redistribuídos por qualquer pessoa – sujeitos, no máximo, à exigência de atribuição à fonte original e ao compartilhamento pelas mesmas licenças em que as informações foram apresentadas.

O Open Data Institute (ODI) define os dados abertos como aqueles que qualquer pessoa pode acessar, usar e compartilhar. De acordo com o ODI, os dados abertos devem ser licenciados para deixar claro que qualquer um pode usar os dados da maneira que quiserem, incluindo transformá-los, combiná-los e compartilhá-los com outros, mesmo para fins comerciais.

Existem 5 níveis de abertura de dados - do menos para o mais aberto (interoperável):

Imagem ilustrando pódium com 5 níveis: o mais baixo (1 estrela) é o menos aberto, enquanto o mais alto (5 estrelas) é o mais aberto.

Fonte: 5 ★ Open Data.

O nível mais básico - para serem considerados dados abertos, estes devem estar disponíveis na internet sob uma licença aberta (independentemente do formato).
★★ No segundo nível, os dados devem ser estruturados e legíveis por máquina (por exemplo, um arquivo de excel em vez da imagem digitalizada da tabela).
★★★ No terceiro nível, para além de legíveis por máquina, devem ser usados formatos não-proprietários (ex. CSV em vez de excel).
★★★★ Adicionalmente, devem ser usados formatos abertos do W3C (RDF e SPARQL) para identificar os dados, para que outros possam referenciá-los.
★★★★★ Todas as opções acima, e ainda vincular seus dados aos dados de outras pessoas para fornecer contexto.

Gestão de dados

O que é:

Processo contínuo, associado aos vários momentos de investigação.

Planejar antecipadamente como os dados serão coletados, documentados, geridos e preservados no início do projeto de pesquisa tem muitos benefícios. Irá permitir poupar tempo mais tarde e será mais fácil para toda a equipe encontrar, entender e analisar os dados. A longo prazo, seguir boas práticas de gestão de dados significa que pesquisadores não envolvidos com o projeto podem encontrar, entender os dados e usá-los no futuro. Ao documentar os dados providenciando a forma adequada de citá-los, será mais fácil obter crédito pelo reuso dos seus dados.

Dados FAIR

Princípios FAIR:

As boas práticas associadas à gestão e partilha de dados, que são fundamentais para a ciência aberta, foram resumidas e conceitualizadas recentemente num conjunto de princípios FAIR. Para serem FAIR os dados devem ser:

Findable (Localizáveis) O primeiro passo para tornar seus dados reutilizáveis é garantir que eles possam ser encontrados tanto por seres humanos quanto por máquinas.
Acessíveis Depois que alguém encontrar seus dados, eles precisam saber como podem acessá-los. Isso pode incluir passar por um processo de autorização e / ou autenticação.
Interoperáveis Para tornar seus dados reutilizáveis, você deve garantir que eles possam ser integrados a outros dados e que eles possam ser utilizados por aplicativos ou fluxos de trabalho para análise, armazenamento e processamento.
Reutilizáveis Para maximizar a potencial reutilização de seus dados, verifique se eles - e seus metadados relacionados - estão bem descritos para que possam ser replicados e / ou combinados em diferentes configurações.

Vídeo 4 - Pedro Príncipe

Fonte: Ciência Aberta SECTES.

Vídeo 5 - Dados Abertos (CONFOA)

Fonte: Projeto RCAAP.

Pode saber mais sobre os dados abertos e a gestão de dados de pesquisa no curso 2 - Dados abertos

Parceiros:
Logo da Escola Corporativa da Fiocruz
Logo da Universidade do Minho