Eleições Europeias 2019. Recolha de conteúdos Web para preservação no Arquivo.pt

Metadata quality: 1.0/1
Metadata quality:
Data description filled
Resources documented
License filled
Update frequency followed
File formats are open
Temporal coverage filled
Spatial coverage filled
Updated on August 29, 2022 — Creative Commons Attribution 4.0 - CC BY 4.0

Arquivo.pt - pesquise páginas do passado

O Arquivo.pt permite pesquisar e aceder a páginas da web preservadas desde 1996. O Arquivo.pt é um serviço público gerido pela Fundação para a Ciência e a Tecnologia (FCT) que arquiva continuamente os conteúdos de websites de interesse para a comunidade portuguesa. O Arquivo.pt disponibiliza…

48 datasets

Informations

License
Creative Commons Attribution 4.0 - CC BY 4.0
ID
630c91ad07819028088b6452

Temporality

Temporal coverage
2019/05/22 to 2019/07/17
Frequency
Punctual
Creation date
August 29, 2022
Latest resource update
August 29, 2022

Geographic dimensions

Territorial coverage granularity
Country
Territorial coverage
European Union

Embed

Permalink

Description

No dia 26 de maio de 2019 realizaram-se as Eleições Europeias em Portugal.

O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais e expandiu a recolha a todos os países da União Europeia por via da língua.

Começou-se por definir uma lista de termos de pesquisa (keywords). Os termos de pesquisa foram traduzidos para 24 línguas oficiais. Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa.

Além da identificação automática de conteúdos, lançou-se uma lista colaborativa para recolher sugestões nacionais e internacionais de conteúdos eleitorais.

A recolha ou crawl teve várias etapas:

  • recolha pré-eleitoral (1) - 1º crawl - testou a identificação e recolha em outras línguas além do português
  • recolha pré-eleitoral (2) - 2º crawl - gerou termos nas 24 línguas oficiais da União Europeia
  • recolha pós-eleitoral (3) - 3º crawl - usou uma lista de termos com a tradução revista pel Publications Office da UE
  • recolha pós-eleitoral (4) - 4º crawl - uma recolha final pós-eleitoral que reune os resultados do Bing e os contributos da comunidade

Mais informação:
Os conteúdos gravados foram reunidos na coleção EAWP23 que tem como datas limite 2019-05-22 e 2019-07-17 e um volume de informação de 4.8 Terabytes (ver https://arquivo.pt/collections).
Notícia no site informativo do Arquivo.pt: https://sobre.arquivo.pt/pt/colecao-sobre-as-eleicoes-europeias-2019/
Pesquisa no Arquivo.pt: https://arquivo.pt/ee2019

Files 5

Pré-Visualização 5

     


  • Os ficheiros JSON e XML descarregados a partir deste painel de pré-visualização são gerados a partir do ficheiro selecionado e podem não corresponder aos recursos originais alojados na plataforma com o mesmo formato.

Community resources 0

You have built a more comprehensive database than those presented here? This is the time to share it!

Reuses 0

Explore the reuses of this dataset.

Did you use this data ? Reference your work and increase your visibility.

Discussion between the organization and the community about this dataset.