Conjuntos de dados
Explore conjuntos de dados abertos de diversas origens, temas e em diferentes formatos, e utilize-os como base para novos estudos e insights.
Exemplos: "educação", "saúde pública", "ambiente"
17 Resultados
4 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2015. Recolha de conteúdos Web para preservação no Arquivo.pt
Este conjunto contém uma lista de 125 endereços (URLs) sobre a as Eleições Legislativas 2015.
As Eleições Legislativas 2015 realizaram-se no dia 4 de outubro de 2015. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos a recolher foram obtidos a partir de uma lista colaborativa, através de um formulário aberto à participação dos cidadãos para sugestão páginas e websites relacionados com o evento eleitoral.
A recolha realizou-se antes e após as eleições, entre setembro e dezembro de 2015.
A recolha correponde à coleção especial EAWP7, que tem um volume de 0.27 Terabytes (ver https://arquivo.pt/collections/).
Mais informação:
Notícia no site informativo do Arquivo.pt:
- https://arquivo.pt/wayback/20170224234941/http://sobre.arquivo.pt/news/recolhas-legislativas-2015
- https://sobre.arquivo.pt/wp-content/uploads/arquivo-das-eleicoes-2015.pdf
89% Qualidade dos metadados
1
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2016. Recolha de conteúdos Web para preservação no Arquivo.pt
As Eleições Presidenciais 2016 realizaram-se no dia 24 de janeiro.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos recolher foram obtidos a partir de lista colaborativa, ou seja, de formulário aberto à participação dos cidadãos para sugestão páginas e websites relacionados com o evento eleitoral.
Resultou na sugestão de 284 endereços que serviram de ponto de partida (seeds).
Os conteúdos foram recolhidos antes e após as eleições, entre 21 e 28 de janeiro de 2016.
Mais informação:
A recolha pré-eleitoral correponde à coleção especial EAWP9 que um volume de 7 Gigabytes (ver https://arquivo.pt/collections/).
Notícia no site informativo do Arquivo.pt:
- https://arquivo.pt/wayback/20170224220059/http://sobre.arquivo.pt/noticias/recolhemos-os-sites-das-eleicoes-presidenciais-de
67% Qualidade dos metadados
0
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Europeias 2019. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 26 de maio de 2019 realizaram-se as Eleições Europeias em Portugal.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais e expandiu a recolha a todos os países da União Europeia por via da língua.
Começou-se por definir uma lista de termos de pesquisa (keywords). Os termos de pesquisa foram traduzidos para 24 línguas oficiais. Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa.
Além da identificação automática de conteúdos, lançou-se uma lista colaborativa para recolher sugestões nacionais e internacionais de conteúdos eleitorais.
A recolha ou crawl teve várias etapas:
- recolha pré-eleitoral (1) - 1º crawl - testou a identificação e recolha em outras línguas além do português
- recolha pré-eleitoral (2) - 2º crawl - gerou termos nas 24 línguas oficiais da União Europeia
- recolha pós-eleitoral (3) - 3º crawl - usou uma lista de termos com a tradução revista pel Publications Office da UE
- recolha pós-eleitoral (4) - 4º crawl - uma recolha final pós-eleitoral que reune os resultados do Bing e os contributos da comunidade
Mais informação:
Os conteúdos gravados foram reunidos na coleção EAWP23 que tem como datas limite 2019-05-22 e 2019-07-17 e um volume de informação de 4.8 Terabytes (ver https://arquivo.pt/collections).
Notícia no site informativo do Arquivo.pt: https://sobre.arquivo.pt/pt/colecao-sobre-as-eleicoes-europeias-2019/
Pesquisa no Arquivo.pt: https://arquivo.pt/ee2019
89% Qualidade dos metadados
3
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Autárquicas 2021. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 26 de setembro de 2021 realizaram-se as Eleições Autárquicas em Portugal.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Começou-se por identificar endereços de conteúdos eleitorais para a recolha recorrendo a informação de diversas fontes:
- site EyeData de onde obteve os nomes dos candidatos e o respetivo concelho (Social Data Lab)
- página da Wikipédia dedicada às elelições
- sites dos partidos políticos
- site da Comissão Nacional de Eleições
- lista colaborativa para sugestão de conteúdos eleitorais a preservar (formulário aberto à participação de todos os cidadãos)
Utilizou-se diversos métodos:
- identificação manual e sistemática de conteúdos
- pesquisa automática sobre uma lista de termos de pesquisa utilizando o Bing Search API (motor de busca)
A gravação de conteúdos aconteceu em três momentos:
- recolha pre-eleitoral (1), primeiro ensaio, a fim de testar a pesquisa de páginas e as ferramentas de gravação
- recolha pré-eleitoral (2)
- recolha pós-eleitoral (3)
Estes endereços (URLs) foram o ponto de partida para a gravação de conteúdos eleitorais para serem preservados pelo Arquivo.pt.
Mais informação
Os conteúdos, depois de gravados, foram agregados numa coleção dedicada às eleições autárquicas, a EAWP39 (ver em https://arquivo.pt/collections).
A coleção especial EAWP tem como datas limite 2021-07-23 e 2021-10-07, recolheu 31,266,653 ficheiros, 118,440 URLs, tendo resultado em 2.7 Terabytes de informação.
89% Qualidade dos metadados
9
0
0
0
3 mesesArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2026: lista de páginas web com conteúdos eleitorais para preservação no Arquivo.pt
A Eleição para o Presidente da República em 2026 realizou-se entre 18 de janeiro e 15 de fevereiro. O Arquivo.pt recolheu 2.3 Terabytes de conteúdos eleitorais e disponibiliza agora o conjunto de dados relativos a todo o processo, tais como termos de pesquisa, conteúdos identificados e conteúdos arquivados.
Neste conjunto encontra os seguintes dados:
- lista de termos de pesquisa
- resultados da pesquisa antes da 1ª volta das eleições
- resultados da pesquisa depois 1ª volta das eleições
- resultados da pesquisa antes da 2ª volta das eleições
- resultados da pesquisa depois da 2ª volta das eleições
- resultados da pesquisa depois da 2ª volta, segundo turno
Mais informação: https://sobre.arquivo.pt/pt/recolha-especial-de-conteudos-web-sobre-as-eleicoes-presidenciais-precisamos-da-sua-ajuda/
100% Qualidade dos metadados
2
9
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Autárquicas 2017. Recolha de conteúdos Web para preservação no Arquivo.pt
Este conjunto refere-se às duas recolhas de conteúdos Web realizadas antes e depois das Eleições Autárquicas 2017, a 27 de setembro e a 10 de outubro de 2017, e contém:
- URLs da lista colaborativa que recolheu sugestões dos cidadãos de conteúdos a preservar
- URLs resultantes da pesquisa automática utilizando o Bing Search API, por concelho
Adicionou-se em cada resultado respetivo link para o Arquivo.pt.
As Eleições Autárquicas de 2017 realizaram-se no dia 1 de outubro e o Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos a gravar foram identificados a partir de duas fontes:
- lista colaborativa - formulário aberto à participação dos cidadãos para sugestãos de conteúdos a preservar
- pesquisa automática utilizando o Bing Search API
A pesquisa automática combinou palavras-chave (keywords) tais como ""autárquicas"" com o nome dos concelhos,
a fim de obter os resultados apresentados pelo motor de busca como mais relevantes, em geral os 20 primeiros.
Os URLs obtidos serviram de ponto de partida ou ""seeds"" para a gravação dos conteúdos eleitorais.
A recolha foi feita em dois momentos:
- pré-eleitoral - 27 e 28 de setembro de 2017
- pós-eleitoral - 10 e 11 de outubro de 2017
Os URLs de redes sociais, tais como o Facebook e Youtube, podem não ter sido gravados, pois usam uma tecnologia diferente dos sítios Web.
Mais informação:
A recolha pré-eleitoral correponde à coleção especial EAWP16 com um volume de 0.13 Terabytes.
A recolha pós-eleitoral correponde à coleção especial EAWP17 com um volume de 0.23 Terabytes.
Ver em https://arquivo.pt/collections/
89% Qualidade dos metadados
8
0
0
0
8 mesesArquivo.pt - pesquise páginas do passado
Eleições Autárquicas 2025: lista de páginas web com conteúdos eleitorais para preservação no Arquivo.pt
Neste conjunto de dados pode encontrar:
- Lista de termos de pesquisa
- Resultados da pesquisa antes das eleições
- Resultados da pesquisa depois das eleições
Os endereços obtidos foram o ponto de partida (seeds) para a recolha realizada pelo Arquivo.pt.
Além destes endereços foram utilizados na recolha a lista de websites das freguesias, municípios e partidos políticos.
Mais informação em https://arquivo.pt/noticias
89% Qualidade dos metadados
2
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2022. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 30 de janeiro de 2022 realizaram-se em Portugal as Eleições Legislativas.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Começou-se por definir uma lista de termos de pesquisa (keywords). Utilizou-se o Bing Search API para realizar as pesquisas de forma automática.
Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa. Os dados mais importantes para a recolha são os endereços (URLs), pois são o ponto de partida (seeds) para a gravação de conteúdos.
A recolha foi realizada teve duas fases:
- recolha pré-eleitoral (1)
- recolha pós-eleitoral (2)
Mais informação
"Os conteúdos gravados foram reunidos na coleção EAWP40 que tem como datas limite 2022-01-25 e 2022-02-10 e um volume de informação de 0.24 Terabytes (ver em https://arquivo.pt/collections).
A disponibilização dos conteúdos acontece, habitualmente, passado um ano sobre a recolha do Arquivo.pt."
89% Qualidade dos metadados
1
0
0
0
8 mesesArquivo.pt - pesquise páginas do passado
Partidos políticos em Portugal: websites e histórico no Arquivo.pt
Este documento contém a lista dos partidos políticos em atividade em outubro de 2025, os seus websites oficiais e as redes sociais que indicam.
A identificação dos endereços dos websites e redes sociais foi feita pelo arquivo.pt para incluir na gravação de conteúdos, principalmente em datas próximas a eventos eleitorais.
Nota acerca das redes sociais. A redes sociais são pouco preserváveis no arquivo.pt, na medida em que acabamos por não conseguir reproduzir o conteúdo no ambiente arquivo da Web. Os conteúdos estão atrás de login, são dinâmicos e algumas plataformas dificultam a sua captura.
Recomenda-se às entidades que publicam os conteúdos que publiquem uma cópia dos mesmos conteúdos numa secção do website, em formatos abertos ou conhecidos (imagens, texto e vídeo). Dessa forma será possível preservar esses conteúdos para acesso futuro no arquivo da Web.
Fonte para a lista dos Partidos, em outubro de 2025: Comissão Nacional de Eleições, https://www.cne.pt/content/partidos-politicos-1
A primeira versão desta lista foi feita a partir dos dados disponibilizados no website da Comissão Nacional de Eleições, em setembro de 2021 (https://arquivo.pt/wayback/20210923155125/https://www.cne.pt/content/partidos-politicos-1).
100% Qualidade dos metadados
327
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2021. Recolha de conteúdos para preservação no Arquivo.pt
A 24 de janeiro de 2021 realizaram-se em Portugal as Eleições Presidenciais.
O Arquivo.pt lançou uma recolha especial de conteúdos publicados na Web relacionados com este evento. A pesquisa e identificação de conteúdos foi feita de forma automática, utilizando o serviço Bing Search API.
A partir de palavras-chave o motor de busca devolveu os resultados mais relevantes da sua lista. Os endereços (URLs) resultantes o ponto de partida para a gravação de conteúdos.
A recolha teve duas fases:
- pré-eleitoral (1)
- pós-eleitoral (2)
Mais informação
Os conteúdos gravados correspondem à coleção EAWP37 que tem como datas limite 2021-01-18 e 2021-02-11 e um volume de 0.626 Terabytes (ver em https://arquivo.pt/collections).
89% Qualidade dos metadados
3
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2019. Recolha de conteúdos para preservação no Arquivo.pt
No dia 6 de outubro de 2019 realizaram-se em Portugal as Eleições Legislativas. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Começou-se por definir uma lista de termos de pesquisa (keywords). Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa.
A recolha foi realizada em duas fases:
- recolha pré-eleitoral (1)
- recolha pós-eleitoral (2)
A gravação dos conteúdos em páginas de Facebook e Youtube foi feita com as ferramentas Brozzler e Browsertrix. A reprodução deste tipo de conteúdos apresenta dificuldades. Para estes conteúdos a gravação foi feita a título exploratório.
Mais informação
Os conteúdos gravados foram reunidos na coleção EAWP26. Tem como datas limite 2019-09-30 e 2019-10-31 e um volume de informação de 0.54 Terabytes (ver em https://arquivo.pt/collections).
89% Qualidade dos metadados
3
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
Eleições Europeias 2024: lista de páginas web com conteúdos eleitorais para preservação no Arquivo.pt
As Eleições Europeias 2024 realizaram-se em Portugal a 9 de junho. O Arquivo.pt realizou uma recolha especial aos conteúdos eleitorais.
Neste conjunto de dados pode encontrar:
1) termos de pesquisa nas 24 línguas utilizados para encontrar contéudos web sobre as Eleições Europeias 2024
2) lista de endereços obtidos antes das eleições
3) lista de endereços obtidos depois das eleições.
89% Qualidade dos metadados
0
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
Street art: recolha temática de páginas web para preservação no Arquivo.pt
Neste conjunto encontra a lista de endereços (URLs) sobre street art, com o foco em Portugal e nos artistas portugueses, mas incluindo conteúdos internacionais.
Em Agosto de 2023, o Arquivo.pt começou por identificar páginas existentes na Web sobre a temática "Street Art" para posterior gravação e preservação no Arquivo.pt. O objetivo é enriquecer o acervo preservado sobre este tema e promover entre os investigadores o estudo de conteúdos antigos da Web. Lisboa é por vezes apelidada de capital da "Street Art" e um pouco por todo o país esta manifestação cultural está presente.
Para identificar os conteúdos o Arquivo.pt experimentou diversas técnicas, começando pela utilização manual de motores de busca até à utilização de ferramentas automáticas, tais como o serviço Bing Search API. Esta prática foi utilizada em coleções temáticas realizadas anteriormente, como por exemplo, nas Eleições Europeias 2019 e na coleção de páginas sobre o 25 de Abril.
English:
In this set you will find a list of addresses (URLs) on street art, with a focus on Portugal and Portuguese artists, but including international content.
In August 2023, Arquivo.pt began identifying existing web pages on the subject of "Street Art" for subsequent recording and preservation at Arquivo.pt. The aim is to enrich the preserved collection on this topic and promote the study of old web content among researchers. Lisbon is sometimes called the capital of "Street Art" and this cultural manifestation is present all over the country.
In order to identify the content, Arquivo.pt experimented with various techniques, starting with the manual use of search engines to the use of automatic tools, such as the Bing Search API service. This practice has been used in previous thematic collections, such as the 2019 European Elections and the collection of pages on April 25th.
100% Qualidade dos metadados
0
0
0
0
1 anoArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2025: lista de páginas web com conteúdos eleitorais para preservação no Arquivo.pt
Neste conjunto de dados pode encontrar:
- Lista de termos de pesquisa
- Resultados da pesquisa automática antes e depois das eleições
- Resultados da pesquisa automática antes das eleições
- Resultados da pesquisa automática depois das eleições.
Mais informação: https://sobre.arquivo.pt/
100% Qualidade dos metadados
1
1
0
0
2 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2024: lista de páginas web com conteúdos eleitorais para preservação no Arquivo.pt
As Eleições Legislativas em Portugal realizaram-se a 10 de março de 2024. O Arquivo.pt identificou páginas com conteúdos eleitorais e gravou-as para memória futura e para a investigação. Nem todas as páginas identificadas foram gravadas por não ser possível a sua gravação e posterior reprodução, como é o caso por exemplo de páginas de redes sociais.
Este conjunto de dados contém:
1) lista de termos de pesquisa
2) resultados da pesquisa antes das eleições
3) resultados da pesquisa depois das eleições
4) lista de endereços identificadas de forma manual pela comunidade
5) sites dos partidos políticos.
89% Qualidade dos metadados
0
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
Eleições para a Assembleia Legislativa da Madeira 2024: lista de páginas web com conteúdos eleitorais para preservação no Arquivo.pt
As Eleições para a Assembleia Legislativa da Madeira 2024 realizaram-se a 26 de Maio de 2024. O Arquivo.pt realizou uma recolha especial aos conteúdos eleitorais.
Neste conjunto de dados pode encontrar:
- termos de pesquisa utilizados para encontrar conteúdos publicados na Web
- lista de endereços obtidos no dia das eleições
- lista de endereços obtidos depois das eleições
- lista final de endereços únicos.
89% Qualidade dos metadados
0
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2016. Recolha de conteúdos Web para preservação no Arquivo.pt
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos recolher foram obtidos a partir de lista colaborativa, um formulário aberto à participação dos cidadãos para sugestão páginas e websites.
Resultou na sugestão de 285 endereços que serviram de ponto de partida (seeds).
Os conteúdos foram recolhidos antes e após as eleições, entre 21 e 28 de janeiro de 2016.
89% Qualidade dos metadados
3
1
0
0