Sobre dados abertos

Dados abertos, de acordo com a Open Definition, são

"dados que qualquer pessoa pode aceder, utilizar, modificar e partilhar, para qualquer propósito".

Representam um subconjunto muito importante do vasto domínio de informação do setor público, cuja reutilização é promovida por uma diretiva europeia (transposta em Portugal pela Lei n.º 26/2016, de 22 de Agosto).

O movimento dos dados abertos, que é parte integral das políticas dedicadas ao Governo Aberto (Open Government), combina os princípios da transparência, participação e colaboração, assim como o potencial de desenvolvimento económico que o digital trouxe.

A enorme quantidade de dados que é gerada e centralizada pela Administração Pública congrega em si um enorme potencial de utilização e de desenvolvimentos que podem ser úteis e importantes tanto para o Estado como para a sociedade civil e mundo empresarial.

A grande maioria desses dados já são, por lei, considerados públicos. O grande desafio (e a maior preocupação das iniciativas de dados abertos como o dados.gov) passa por facilitar o seu acesso e reutilização, beneficiando vários grupos e sectores da sociedade:

  • os cidadãos, que passam a ter um acesso mais imediato a informação que lhes pertence por direito, reforçando a visão de transparência e prestação de contas do Estado perante os eleitores;
  • as instituições governamentais, que se tornam mais transparentes e têm a oportunidade de se tornarem mais eficientes e eficazes, reforçando também o seu papel de serviço público e o próprio acesso a dados de outros organismos;
  • o setor empresarial, que pode reutilizar informação pública para criar aplicações, plataformas ou serviços com elevado potencial comercial;
  • e muitos outros setores como o jornalismo, a investigação universitária ou mesmo organizações não-governamentais com preocupações cívicas.

Esse desafio passa por disponibilizar os dados em formatos passíveis de serem lidos por mecanismos automatizados, através de formatos e ferramentas abertas, para que possam ser reutilizados, transformados ou integrados por qualquer cidadão ou entidade, por norma disponibilizados sob a forma de conjuntos de dados.

Conjuntos de dados abertos

Um conjunto de dados, publicados ou geridos por um único agente, e disponibilizado para acesso ou download através de um ou mais formatos.

--W3C Data Catalogue Vocabulary (DCAT)

Conjuntos de dados, no contexto dos dados abertos públicos, são agrupamentos de dados em formato digital, dedicados a um tema específico. Uma lista de moradas de serviços de atendimento ao público, por exemplo, ou dados mensais sobre práticas de gestão ou contratação de um organismo público.

Dados sem restrições de reutilização

Um dos pontos fundamentais dos dados abertos é a ideia de que qualquer pessoa ou entidade pode utilizar, transformar ou adaptar os dados públicos para rentabilizar num contexto de negócio.

Quando falamos em dados abertos públicos, podemos considerar dados relativos a: contratação pública, gestão de organismos públicos, estatísticas económicas e financeiras, despesas e receitas públicas, resultados eleitorais, georreferenciação de moradas e serviços públicos, horários de transportes, indicadores de qualidade de serviço, entre muitos outros.

Grande parte desta informação pode até já estar disponível publicamente, mas para que um determinado conjunto de dados governamentais possa ser classificado como Aberto é necessário que não existam restrições ao seu acesso, sejam estas legais ou políticas, tecnológicas ou financeiras.

Assim, distingue-se dados abertos de dados que sejam apenas disponibilizados ao público. Os dados abertos são sempre abrangidos por licenças abertas, que permitem reutilização comercial. Se assim não for – não poderão ser considerados dados abertos.

Privacidade e dados abertos

Nem toda a informação do sector público deve ser tornada pública. Há um vasto conjunto de dados na Administração Pública que deve continuar na esfera de acesso restrito, seja por razões de segurança, razões legais, ou direito à privacidade dos cidadãos. As políticas de dados abertos não estipulam que se “abra” toda a informação do Estado, apenas aquela que pode ser considerada pública.

As considerações relativamente à abertura de dados de sectores específicos cabem às entidades que os gerem em consonância com organismos como a Comissão Nacional de Proteção de Dados.

Quando se fala de dados abertos fala-se sobretudo em dados governamentais que já estão ou deveriam estar disponíveis para a sociedade e que, assim, têm o potencial de se tornarem abertos, garantindo sua reutilização em novos projetos.

Como identificar conjuntos de dados para publicação?

No caso de não existirem ainda vários conjuntos de dados delimitados e estruturados num organismo, que possam ser imediatamente abertos, podemos começar por abrir apenas um subconjunto desses dados.

Podemos começar por considerar disponibilizar informação que já está disponível ao público, seja sob a forma de conteúdos num site ou através de pedidos à organização, sob a forma menos "tratada" de conjuntos de dados. Aqui é patente a vantagem de disponibilizar dados em bruto, em formatos abertos e lidos por máquina, de forma a privilegiar a sua reutilização de forma livre.

Regra geral, são especialmente apreciados pelos reutilizadores de dados que privilegiem preocupações como:

  • Acesso às entidades, serviços disponíveis e pontos de atendimento;
  • Transparência das contas, atividades e recursos da entidade;
  • Monitorização de um tema, setor ou área de interesse público.

É muito importante estabelecer também um compromisso de manutenção e atualização dos dados. Nesse sentido, e embora o esforço inicial seja um pouco mais elevado, é recomendável a utilização de mecanismos automatizados (ex. API), para garantir que o processo decorra de forma regular.

Dados com informação geográfica

Nos dados a abrir deverá ser dedicada uma atenção e esforço especiais à georreferenciação da informação, porque eleva significativamente o interesse e o potencial de utilização dos dados abertos. Ao enriquecer um conjunto de dados com campos de referência geográfica, a entidade está a abrir o potencial para o desenvolvimento de aplicações que permitem visualizar os dados sobre um mapa. E estas são aplicações bastante apreciadas quer por utilizadores finais quer pela comunidade de desenvolvimento, porque permitem navegar nos dados de forma mais intuitiva e agradável e porque impulsionam a criação de apps para dispositivos móveis.

Interagir com os reutilizadores

A interação com a comunidade de reutilizadores poderá fornecer pistas preciosas sobre o tipo de dados a disponibilizar.

O organismo poderá fazer algum tipo de consulta pública e perguntar aos seus interlocutores mais frequentes, ou a outras partes interessadas, a que tipo de dados gostaria de ter acesso.

A AMA também poderá ajudar neste processo, incluindo colaborar na organização de workshops / eventos com vista a promover estas interações, contacte-nos em dados@ama.pt.