Conjuntos de dados
Explore conjuntos de dados abertos de diversas origens, temas e em diferentes formatos, e utilize-os como base para novos estudos e insights.
Exemplos: "educação", "saúde pública", "ambiente"
68 Resultados
5 anosArquivo.pt - pesquise páginas do passado
Arquivo.pt API (Full-text & URL search)
The TextSearch API allows full-text search and access preserved web content and related metadata. It is also possible to search by URL, accessing all versions of preserved web content.
This API returns a JSON object.
EndPoint: https://arquivo.pt/textsearch
Note: a text search query returns a maximum of 2000 response results
Full documentation: https://github.com/arquivo/pwa-technologies/wiki/Arquivo.pt-API
67% Qualidade dos metadados
4
0
11
0
3 anosArquivo.pt - pesquise páginas do passado
Arquivo do Parlamento: notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt
[Arquivo do Parlamento](https://arquivo-parlamento.pt/) é uma aplicação Web que agrega e categoriza notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt. Este trabalho, da autoria de Tiago Santos, foi [1º classificado do Prémio Arquivo.pt 2022](https://arquivo.pt/vencedores2022).
Este conjunto de dados contém 217 mil artigos e notícias, desde 1996, que alimentam a aplicação [Arquivo do Parlamento](https://arquivo-parlamento.pt/), à data de 18 de maio de 2022. Cada linha tem os seguintes dados: data, título da notícia, link para a Web, link para a versão arquivada.
A base de dados será atualizada com novas notícias, à medida que estiverem acessíveis no Arquivo.pt.
Mais informação: https://arquivo.pt/vencedores2022
100% Qualidade dos metadados
1
0
0
0
6 mesesArquivo.pt - pesquise páginas do passado
Websites do Governo e histórico no Arquivo.pt
Este documento contém uma lista de websites governamentais do Governo XXV tendo em vista a preservação de um histórico no arquivo da Web portuguesa, o Arquivo.pt. A identificação dos websites fez-se a partir da identificação das entidades governamentais, durante o mês de agosto de 2025.
O objetivo desta lista é identificar o maior número possível de websites relativos a uma Legislatura. As entidades, por vezes, mudam de nome ou são extintas dando lugar a novas entidades e a novos endereços de websites. O que se pretende é identificá-los para serem gravados no Arquivo.pt.
Para o Arquivo.pt bastaria apenas a coluna dos endereços ou URLs. Manteve-se, porém, os outros dados para dar contexto a cada website e facilitar o processo de curadoria e preservação. Se alguma informação não estiver correta, por favor, contacte o Arquivo.pt. Há URLs repetidos uma vez que há entidades relacionadas com mais de uma tutela. Na gravação os endereços repetidos são removidos. Há entidades que não têm website.
A lista é um ponto de partida para identificar e gravar os conteúdos web e, sempre que possível, para ser melhorada.
No caso de um determinado website não ter uma versão histórica no Arquivo.pt, qualquer utilizador pode fazer a gravação utilizando o serviço https://arquivo.pt/archivepagenow ou contactar o arquivo.pt pedindo a sua gravação.
Na procura e identificação dos websites seguiu-se as áreas de governação do Governo XXV, que são as seguintes:
Estado e Negócios Estrangeiros
Estado e Finanças
Estado e Finanças
Estado e Finanças
Presidência
Economia e Coesão Territorial
Reforma do Estado
Assuntos Parlamentares
Defesa Nacional
Infrestruturas e Habitação
Justiça
Administração Interna
Educação, Ciência e Inovação
Saúde
Trabalho, Solidariedade e Segurança Social
Ambiente e Energia
Cultura Juventude e Desporto
Agricultura e Mar
Referências
https://www.portugal.gov.pt/pt/gc25
https://www.gov.pt/entidades/
100% Qualidade dos metadados
5
2
0
0
2 mesesArquivo.pt - pesquise páginas do passado
Para Sempre: Arte Contemporânea no Arquivo.pt
Este conjunto de dados documenta a recolha, estruturação e análise de conteúdos web associados à produção cultural contemporânea em Portugal, desenvolvida no âmbito do projecto Para Sempre - Preservação da Memória Digital da Arte Portuguesa Contemporânea na Web.
Este é um projecto de curadoria digital que resulta do encontro de missões de duas organizações: o Arquivo.pt e a Biblioteca de Arte e Arquivos da Fundação Calouste Gulbenkian (FCG).
Incide sobre websites e blogues de artistas, galerias e espaços culturais, preservados através da infraestrutura de arquivo da web portuguesa em 2021.
Inclui:
1. um conjunto de dados (CSV) que descreve os websites e blogues de artistas preservados numa primeira fase, reunindo informação sobre diversas das suas características, incluindo a presença de copyright, domínios, as datas da primeira e da última captura no Arquivo.pt, bem como a frequência, quantidade e grau de completude das mesmas; integra ainda indicadores de alterações estruturais e visuais ao longo do tempo, a disponibilização no Internet Archive e respectivos endereços. EN.
2. um conjunto de dados (XLSX) equivalente ao dataset em CSV descrito acima, fornecendo a mesma informação sobre os websites e blogues de artistas preservados na fase inicial. EN.
3. documentação visual (PNG): capturas de ecrã de secções seleccionadas dos websites e blogues de artistas preservados numa primeira fase, no Arquivo.pt (página inicial, biografia, obras e exposições)
4. um documento metodológico (README) que explicita os critérios de selecção, os procedimentos de recolha e o quadro tipológico utilizado na classificação do segundo conjunto de dados. EN.
5. um conjunto de dados (XLSX) que comporta a lista de websites, blogues e redes sociais recolhidos pelo Arquivo.pt - URL original e preservado - entre 29 de Abril e 5 de Dezembro de 2021, bem como a indicação da ferramenta de recolha. PT.
Estes recursos apoiam a investigação em humanidades digitais, estudos de media e arte contemporânea, permitindo uma análise diacrónica da presença cultural online, da evolução das respectivas interfaces e das estratégias de auto-representação no ambiente web.
O projecto inscreve-se no âmbito da Infraestrutura ROSSIO - Ciências Sociais, Artes e Humanidades, cujo consórcio é coordenado pela Faculdade de Ciências Sociais e Humanas da Universidade NOVA de Lisboa (NOVA FCSH) e integra o Roteiro Nacional de Infraestruturas de Interesse Estratégico da Fundação para a Ciência e a Tecnologia.
Contou com a orientação científica da Doutora Amélia Aurora de Aguiar Andrade (NOVA FCSH), coordenação do Doutor Paulo Leitão e da Doutora Filipa Medeiros (FCG), bem como com a preciosa ajuda do Doutor Daniel Gomes e do Doutor Ricardo Basílio (Arquivo.pt).
Este trabalho foi desenvolvido entre Junho de 2020 e Dezembro de 2021, no âmbito de uma Bolsa de Gestão de Ciência e Tecnologia com a referência ROSSIO_BI2019_7. A pesquisa foi levada a cabo pela investigadora Rita Cêpa, com afiliação ao IHA-NOVA FCSH/IN2PAST (ID ORCID: 0000-0003-2113-5484 | Ciência ID: 2118-A60F-C035).
O financiamento foi assegurado pelo Programa Operacional de Lisboa, com apoio do Fundo Europeu de Desenvolvimento Regional e da FCT, através de fundos nacionais.
Apesar do seu término, o projecto Para Sempre mantém-se activo, procurando aprofundar e expandir a presente investigação a outros agentes do panorama artístico português.
Outputs:
- Webinar Arquivar a Web: faça-você-mesmo! Ciclo "Arte para sempre na Web" (PT, 2021-06-01, ZOOM) | https://youtu.be/mFgYc1RkWW8
- Slides Arquivar a Web: faça-você-mesmo! Ciclo "Arte para sempre na Web" (PT) | https://sobre.arquivo.pt/wp-content/uploads/curadoria-sobre-arte-portuguesa-contemporanea-rita-cepa.pdf
- Exposição Digital Memória de Festivais e Eventos de Arte (PT) | https://sobre.arquivo.pt/pt/memoria-de-festivais-e-eventos-de-arte-para-sempre/
- Cronologia Festivais e Eventos de Arte (PT) | https://arquivo.pt/festivaisdearte/
- Abstract Encontro Novos Caminhos para a Preservação e o Acesso à Informação (PT) | https://sobre.arquivo.pt/wp-content/uploads/02-wdpd-rita-cepa-nova-fcsh.pdf
- Apresentação Encontro Novos Caminhos para a Preservação e o Acesso à Informação (PT, 2024-11-07, Torre do Tombo - Lisboa) | https://comum.rcaap.pt/entities/publication/e81e215c-a65a-4d3a-81aa-5fb153b621a4
- Abstract BDCAM25: Born-Digital Collections, Archives and Memory (EN, 2025-04-03, Senate House - University of London) | https://easychair.org/smart-program/BDCAM25/2025-04-03.html#talk:272721
- Dataset @ Zenodo |
100% Qualidade dos metadados
29
0
0
1
3 anosArquivo.pt - pesquise páginas do passado
Viagem de Circum-Navegação. Conteúdos Web para preservação no Arquivo.pt
A [Estrutura de Missão do V Centenário da Primeira Viagem de Circum-Navegação (EMCFM)](https://magalhaes500.pt/) foi [criada pelo Conselho de Ministros em 2017](https://arquivo.pt/wayback/20190907111108/https://www.portugal.gov.pt/pt/gc21/comunicacao/noticia?i=20170119-mm-fmagalhaes).
Entre 2019 e 2022, a EMCFM desenvolveu um programa de comemorações promovendo colaborações com diversas entidades e serviços.
O Arquivo.pt (FCT, I.P.) contribuiu com a gravação de conteúdos temáticos sobre Fernão de Magalhães e a demonstração do seu uso para a memória institucional através da exposição online [Viagem no tempo com o Arquivo.pt](https://arquivo.pt/magalhaes500/).
Pretende-se aumentar os conteúdos relacionados com Fernão de Magalhães e a Viagem de Circum-navegação no acervo do Arquivo.pt de modo a servirem para a memória e para a investigação.
100% Qualidade dos metadados
3
4
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2015. Recolha de conteúdos Web para preservação no Arquivo.pt
Este conjunto contém uma lista de 125 endereços (URLs) sobre a as Eleições Legislativas 2015.
As Eleições Legislativas 2015 realizaram-se no dia 4 de outubro de 2015. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos a recolher foram obtidos a partir de uma lista colaborativa, através de um formulário aberto à participação dos cidadãos para sugestão páginas e websites relacionados com o evento eleitoral.
A recolha realizou-se antes e após as eleições, entre setembro e dezembro de 2015.
A recolha correponde à coleção especial EAWP7, que tem um volume de 0.27 Terabytes (ver https://arquivo.pt/collections/).
Mais informação:
Notícia no site informativo do Arquivo.pt:
- https://arquivo.pt/wayback/20170224234941/http://sobre.arquivo.pt/news/recolhas-legislativas-2015
- https://sobre.arquivo.pt/wp-content/uploads/arquivo-das-eleicoes-2015.pdf
89% Qualidade dos metadados
1
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Europeias 2019. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 26 de maio de 2019 realizaram-se as Eleições Europeias em Portugal.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais e expandiu a recolha a todos os países da União Europeia por via da língua.
Começou-se por definir uma lista de termos de pesquisa (keywords). Os termos de pesquisa foram traduzidos para 24 línguas oficiais. Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa.
Além da identificação automática de conteúdos, lançou-se uma lista colaborativa para recolher sugestões nacionais e internacionais de conteúdos eleitorais.
A recolha ou crawl teve várias etapas:
- recolha pré-eleitoral (1) - 1º crawl - testou a identificação e recolha em outras línguas além do português
- recolha pré-eleitoral (2) - 2º crawl - gerou termos nas 24 línguas oficiais da União Europeia
- recolha pós-eleitoral (3) - 3º crawl - usou uma lista de termos com a tradução revista pel Publications Office da UE
- recolha pós-eleitoral (4) - 4º crawl - uma recolha final pós-eleitoral que reune os resultados do Bing e os contributos da comunidade
Mais informação:
Os conteúdos gravados foram reunidos na coleção EAWP23 que tem como datas limite 2019-05-22 e 2019-07-17 e um volume de informação de 4.8 Terabytes (ver https://arquivo.pt/collections).
Notícia no site informativo do Arquivo.pt: https://sobre.arquivo.pt/pt/colecao-sobre-as-eleicoes-europeias-2019/
Pesquisa no Arquivo.pt: https://arquivo.pt/ee2019
89% Qualidade dos metadados
1
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
Turismo em Portugal: Websites e histórico de versões no Arquivo.pt
Este conjunto de dados contém uma lista de Websites e páginas Web relacionadas com o setor do turismo em Portugal e, para cada item, um link para uma versão preservada no Arquivo.pt.
A lista é o resultado da colaboração entre o [Museu Virtual do Turismo (MUVITUR)](https://muvitur.eshte.pt/), através da Biblioteca Celestino Domingues da Escola Superior de Hotelaria e Turismo do Estoril, e o Arquivo.pt.
A iniciativa tem por objetivo preservar e divulgar os conteúdos publicados na Web sobre turismo, desde 1996. A lista deve ser aumentada com novos itens.
Foram adicionados dados descritivos a cada idem. Neste conjunto encontram-se os seguintes:
- Denominação - geralmente o título do website
- Organização - a entidade a quem pertence a publicação
- Endereço do sítio Web na Internet
- Endereço para versão no Arquivo.pt
- Momento(s) para recordar
- Link para miniatura no Arquivo.pt
- Descritores
- Dados geográficos (localização, coordenadas, nome geográfico)
Estes dados serviram para criar uma [coleção de registos de sítios Web no MUVITUR](http://arquivodigital.eshte.pt/Nyron/Museum/Catalog/winlib.aspx?skey=&option=Destaques&dtype=mosaico) relacionados com o setor do turismo em Portugal.
A identificação dos Websites e das páginas Web relacionadas com o turismo ajuda o Arquivo.pt a melhorar a preservação e aos investigadores a aceder a conteúdos históricos que já não se encontram online.
78% Qualidade dos metadados
1
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2016. Recolha de conteúdos Web para preservação no Arquivo.pt
As Eleições Presidenciais 2016 realizaram-se no dia 24 de janeiro.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos recolher foram obtidos a partir de lista colaborativa, ou seja, de formulário aberto à participação dos cidadãos para sugestão páginas e websites relacionados com o evento eleitoral.
Resultou na sugestão de 284 endereços que serviram de ponto de partida (seeds).
Os conteúdos foram recolhidos antes e após as eleições, entre 21 e 28 de janeiro de 2016.
Mais informação:
A recolha pré-eleitoral correponde à coleção especial EAWP9 que um volume de 7 Gigabytes (ver https://arquivo.pt/collections/).
Notícia no site informativo do Arquivo.pt:
- https://arquivo.pt/wayback/20170224220059/http://sobre.arquivo.pt/noticias/recolhemos-os-sites-das-eleicoes-presidenciais-de
67% Qualidade dos metadados
0
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
Street art: recolha temática de páginas web para preservação no Arquivo.pt
Neste conjunto encontra a lista de endereços (URLs) sobre street art, com o foco em Portugal e nos artistas portugueses, mas incluindo conteúdos internacionais.
Em Agosto de 2023, o Arquivo.pt começou por identificar páginas existentes na Web sobre a temática "Street Art" para posterior gravação e preservação no Arquivo.pt. O objetivo é enriquecer o acervo preservado sobre este tema e promover entre os investigadores o estudo de conteúdos antigos da Web. Lisboa é por vezes apelidada de capital da "Street Art" e um pouco por todo o país esta manifestação cultural está presente.
Para identificar os conteúdos o Arquivo.pt experimentou diversas técnicas, começando pela utilização manual de motores de busca até à utilização de ferramentas automáticas, tais como o serviço Bing Search API. Esta prática foi utilizada em coleções temáticas realizadas anteriormente, como por exemplo, nas Eleições Europeias 2019 e na coleção de páginas sobre o 25 de Abril.
English:
In this set you will find a list of addresses (URLs) on street art, with a focus on Portugal and Portuguese artists, but including international content.
In August 2023, Arquivo.pt began identifying existing web pages on the subject of "Street Art" for subsequent recording and preservation at Arquivo.pt. The aim is to enrich the preserved collection on this topic and promote the study of old web content among researchers. Lisbon is sometimes called the capital of "Street Art" and this cultural manifestation is present all over the country.
In order to identify the content, Arquivo.pt experimented with various techniques, starting with the manual use of search engines to the use of automatic tools, such as the Bing Search API service. This practice has been used in previous thematic collections, such as the 2019 European Elections and the collection of pages on April 25th.
100% Qualidade dos metadados
0
0
0
0
mais de 2 anosArquivo.pt - pesquise páginas do passado
Websites do Governo Regional dos Açores e histórico de versões no Arquivo.pt
A listagem dos websites do Governo Regional dos Açores tem por objetivo melhorar as recolhas do Arquivo.pt dos conteúdos publicados.
O Arquivo.pt, serviço público de preservação da Web operado pela Fundação para a Ciência e a Tecnologia, I.P, realiza recolhas periódicas (trimestrais) para memória histórica e uso na investigação.
Quanto mais específicos forem os endereços dos websites mais fácil será recolhê-los. Por exemplo, o portal azores.gov.pt contém outros subsites e conjuntos de páginas dedicadas a diferentes entidades. Estas secções e subdivisões por vezes escapam à recolha feita pelo Arquivo.pt, a qual é limitada a uma "profundidade" menor do que a que seria necessário para percorrer todo o portal.
Para cada endereço da lista criou-se uma ligação para ver se há um histórico no Arquivo.pt. Em alguns casos pode verificar-se que não há.
Identificar todos os endereços é uma forma de assegurar que o Arquivo.pt vai passar por todos os websites para tentar gravar os seus conteúdos.
A presente lista foi iniciada em 2019, na sequência das Jornadas FCCN realizadas na Universidade dos Açores, onde se sensibilizou para a questão da preservação. Foi depois objeto de uma revisão em agosto de 2021.
A lista requer revisão de modo a incluir todos os endereços de websites relativos ao Governo dos Açores, mesmo com outros domínios além do azores.gov.pt.
78% Qualidade dos metadados
1
0
0
0
8 mesesArquivo.pt - pesquise páginas do passado
Partidos políticos em Portugal: websites e histórico no Arquivo.pt
Este documento contém a lista dos partidos políticos em atividade em outubro de 2025, os seus websites oficiais e as redes sociais que indicam.
A identificação dos endereços dos websites e redes sociais foi feita pelo arquivo.pt para incluir na gravação de conteúdos, principalmente em datas próximas a eventos eleitorais.
Nota acerca das redes sociais. A redes sociais são pouco preserváveis no arquivo.pt, na medida em que acabamos por não conseguir reproduzir o conteúdo no ambiente arquivo da Web. Os conteúdos estão atrás de login, são dinâmicos e algumas plataformas dificultam a sua captura.
Recomenda-se às entidades que publicam os conteúdos que publiquem uma cópia dos mesmos conteúdos numa secção do website, em formatos abertos ou conhecidos (imagens, texto e vídeo). Dessa forma será possível preservar esses conteúdos para acesso futuro no arquivo da Web.
Fonte para a lista dos Partidos, em outubro de 2025: Comissão Nacional de Eleições, https://www.cne.pt/content/partidos-politicos-1
A primeira versão desta lista foi feita a partir dos dados disponibilizados no website da Comissão Nacional de Eleições, em setembro de 2021 (https://arquivo.pt/wayback/20210923155125/https://www.cne.pt/content/partidos-politicos-1).
100% Qualidade dos metadados
327
0
0
0
3 anosArquivo.pt - pesquise páginas do passado
Websites referenciados nos relatórios de projetos financiados pela FCT. Recolha para preservação no Arquivo.pt
Este documento contém os endereços dos conteúdos Web (URLs) referidos pelos investigadores nos relatórios dos projetos financiados pela Fundação para a Ciência e a Tecnologia, desde junho de 2020.
Denominam-se "seeds" (sementes) estes endereços, pois são o ponto de partida para a gravação dos conteúdos dos Websites. As listas de endereços foram obtidas periodicamente a partir da base de dados da FCT.
Os endereços obtidos apontam para recursos online tais como os websites dos projetos, unidades de I&D, notícias nos media, artigos em revistas científicas ou repositórios, base de dados, vídeos no Youtube ou páginas do Facebook.
Em junho de 2020, o Arquivo.pt obteve 263 endereços relacionados com 100 projetos científicos a partir dos relatórios financiados pela FCT. Grande parte dos endereços (67%) não tinha qualquer versão anteriormente preservada no Arquivo.pt.
Em julho de 2020, lançou-se uma recolha especial a partir deste conjunto de endereços que resultou em 6,9 GB de informação obtidos a partir da visita a 31 606 URLs.
Em 2021 e em 2022 voltou-se a gravar os endereços obtidos a partir da base de dados da FCT procurando as melhores técnicas para o fazer com sucesso.
Alguns conteúdos desapareceram da Web, outros são de difícil gravação e reprodução, como por exemplo, vídeos do Youtube, páginas do Facebook, sites Wix.
Mais informação:
Notícia no site informativo do Arquivo.pt [Arquivo.pt preserva websites de projectos científicos nacionais](https://sobre.arquivo.pt/pt/arquivo-pt-preserva-websites-de-projectos-cientificos-nacionais/)
Exposição online [Memória Web da investigação científica](https://memoriafct.wordpress.com/)
78% Qualidade dos metadados
5
0
0
0
5 anosArquivo.pt - pesquise páginas do passado
Websites do Governo da Regional Madeira e histórico no Arquivo.pt
A listagem dos sites do Governo Regional da Madeira tem por objetivo melhorar as recolhas do Arquivo.pt dos conteúdos publicados.
O Arquivo.pt, serviço público de preservação da Web operado pela Fundação para a Ciência e a Tecnologia, I.P, realiza recolhas periódicas (trimestrais) para memória histórica e uso na investigação.
Quanto mais específicos forem os endereços dos websites mais fácil é recolhê-los.
Por exemplo, o site madeira.gov.pt contém outros subsites. Estes por vezes escapam às recolhas do Arquivo.pt, a qual é limitada a uma "profundidade" menor do que a que seria necessário para percorrer todo o portal do Governo Regional.
Identificar todos os endereços é uma forma de assegurar que o Arquivo.pt chega também aos sites mais pequenos.
A presente lista foi feita em 2019 e ainda está incompleta.
Requer revisão e ampliação a todos os endereços de interesse público.
78% Qualidade dos metadados
2
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Editores e livreiros em Portugal: websites e histórico de versões no Arquivo.pt
Este conjunto de dados apresenta nomes de editoras e livreiros em Portugal e o histórico dos seus websites que está acessível para qualquer cidadão no Arquivo.pt.
Inclui ainda uma recolha de notícias sobre um tipo de evento realizado um pouco por todo o país ao longo do ano: a "feira do livro".
**Contexto**
O mercado editorial muda com o tempo e o mesmo acontece aos websites deste setor de atividade.
Todos os anos surgem novas editoras e desaparecem outras. Há marcas conhecidas dos portugueses que se mantêm mas que entretanto passaram a pertencer a novos projetos. O histórico dos websites espelha essas mudanças ao longo do tempo.
O Arquivo.pt é um serviço público de preservação da Web que recolhe e mantém acessíveis conteúdos publicados na Web desde 1996. Constituem um património digital para memória das empresas e instituições e para o estudo e investigação nas mais diversas áreas.
Ao identificar os websites das editoras e dos livreiros, em setembro de 2022, o Aquivo.pt pretendeu chamar a atenção para este património digital e melhorar a sua preservação.
Não se encontrou uma lista completa das editoras e livreiros e assim deve considerar-se esta lista aberta. Espera-se contributos e sugestões para aumentar esta lista através do [formulário de sugestão do Arquivo.pt](http://arquivo.pt/sugerir).
Procurou-se incluir projetos editoriais alternativos e de pequena dimensão. Os editores e livreiros para os quais não encontrámos um website ou uma página social não foram incluídos, pois o foco desta lista são os websites.
O nome para designar cada editora ou livreiro foi aquele por que é mais conhecido, em vez do nome do registo empresarial.
Espera-se, futuramente, sensibilizar as pessoas que trabalham neste setor para a importância de terem um bom histórico do seu website e de ajudarem o Arquivo.pt a fazê-lo da forma mais completa possível.
**Fontes de informação**
Associação Portuguesa de Editores e Livreiros
DGLAB - lista de editores
Rede de Livrarias Independentes Portuguesas - RELI
89% Qualidade dos metadados
2
2
0
0
8 mesesArquivo.pt - pesquise páginas do passado
Freguesias de Portugal: websites e histórico de versões no Arquivo.pt - Agosto 2021
A listagem das Freguesias de Portugal: websites e histórico de versões no Arquivo.pt tem por objetivo identificar os websites oficiais das Juntas de Freguesia e verificar se estão a ser preservados no Arquivo.pt.
Este ficheiro contém os nomes das freguesias por distrito e concelho, os endereços dos websites oficiais das juntas, a página do site municipal dedicada à freguesia, a página da freguesia no Facebook (declarada como "oficial" umas vezes, outras de caráter não oficial) e notas com referência a endereços relacionados.
A lista utilizada para este trabalho incluia 1196 endereços de sites das juntas de freguesia.
Fez-se uma atualização da lista e a lista ficou mais completa, à data de agosto de 2021. 1896 freguesias apresentam site e 85 apresentam sites inativos ou sem acesso. Na lista ficaram ainda os endereços inativos pois, embora não estejam online, têm um histórico no Arquivo.pt.
No caso de um determinado endereço não ter um histórico por não estar a ser gravado, adiconou-se esse endereço à lista de recolhas para que de futuro possa estar. Indicar o endereço dos websites institucionais nas bases de dados é uma boa prática que deve ser incentivada.
Identificou-se a página do site do município dedicada a cada freguesia. Há freguesias que não têm site nem usam redes sociais, sendo o site do município a informação institucional disponível. A informação sobre as freguesias nos sites dos municípios depende muito da estratégia de comunicação. Uns apresentam contactos, informação histórica, etc, e outros apenas uma referência.
Foram identificadas 1885 páginas de Facebook das freguesias. Nem todas se poderão dizer "oficiais". Algumas são informais mas apresentam informação da freguesia. Em muitos casos as juntas não têm site mas utilizam uma página do Facebook.
As páginas do Facebook estão foram do âmbito das recolhas habituais do Arquivo.pt. São de difícil gravação e reprodução pelos arquivos da Web e provavelmente não se encontram no Arquivo.pt. Adicionámos os seus endereços a esta lista, porque pode ser útil para comparar o que é publicado em acesso aberto na Web com o que é publicado em plataformas fechadas como o Facebook.
100% Qualidade dos metadados
5
3
0
0
6 mesesArquivo.pt - pesquise páginas do passado
Rede de Bibliotecas Escolares: blogs e websites preservados no Arquivo.pt
Neste conjunto de dados encontra-se informação acerca das bibliotecas escolares.
Os dados estão publicamente acessíveis no website da Rede de Bibliotecas Escolares, https://rbe.mec.pt/np4/sitios.html.
O Arquivo.pt queria realizar uma recolha especial com o objetivo de preservar os seus conteúdos e também de preservar os blogs e websites das bibliotecas escolares aí referidos.
Porém, alguns conteúdos eram apresentados num mapa interativo a que o web crawler não era capaz de aceder. Foi necessário um passo adicional, preparado pelo desenvolvedor do Arquivo.pt.
Analisando o tráfego do site, consegui-se obter o JSON com as informações todas no formato JSON.
Depois, na consola do browser, guardou-se esta informação numa variável x e correu-se os seguintes comandos:
```
keys = x.map(n => Object.keys(n)).reduce((acc,cur) => [...new Set([...acc,...cur])],[])
default_n = {}
keys.forEach(k => default_n[k] = '')
keys.join('\t') + '\n' + x.map(n => ({...default_n,...n})).map(n => {r = []; keys.forEach(k => r.push(n[k])); return r.join('\t')}).join('\n')
```
Copiou-se o output para um editor de texto e substituiu-se todos os ""\t"" por um caracter de tabulação (tab), e os ""\n"" por novas linhas. Seleccionou-se tudo e copiou-se para uma tabela.
Finalmente, para linhas que não tinham URL gerou-se o URL a partir do codIgefe quando possível.
Data da extração: 14-08-2025.
Data de gravaçao do website rbe.mec.pt: 18 a 22 de agosto de 2025.
Data de gravaçao da lista de blogs e websites das bibliotecas escolares referidos website rbe.mec.pt: 20 e 30 de novembro de 2025.
Recomenda-se a quem possui websites que disponibilizam informação com base num mapa que extraia e forneça ao Arquivo.pt os URLs de todos os conteúdos para poderem ser gravados. O Arquivo.pt não poderá fazer este passo adicional para todos os websites, mas deixa este caso de uso.
89% Qualidade dos metadados
1
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
50 anos do 25 de Abril: páginas web sobre o 25 de Abril preservadas no Arquivo.pt
Neste conjunto de dados encontra uma lista de palavras-chave ou conjunto de palavras colocadas num motor de busca a fim de obter resultados sobre o tópico "25 de Abril".
Ao pesquisar sobre este evento marcante para a história contemporânea de Portugal consideramos pessoas, lugares, aspetos sociais políticos, sociais, culturais e ainda palavras associadas ao acontecimento.
As pesquisas foram realizadas no dia 22 de março de 2024 utilizando o Bing Search API, um serviço de pesquisa automática que devolve resultados de acordo com critérios de relevância do próprio serviço Bing e de outros configurados por nós.
Assim, obtivemos listas dos 10 primeiros resultados, depois ampliámos para os 20, 50 e 100 primeiros resultados. Pretendeu-se obter o maior número possível de páginas disponíveis resultados com referência ao 25 de Abril.
Quanto maior é o número de resultados menor é a precisão em relação ao tópico que se pretende. Neste caso, é possível que os últimos resultados numa lista até 100 tenham pouco a ver com o tema "25 de abril". Disponibilizamos aqui os resultados obtidos para quem quiser analisar esta questão.
Para a recolha e a gravação no Arquivo.pt utilizámos a lista até 100 resultados, mesmo que nem todos acertem no alvo que é o "25 de Abril".
No total foram obtidos 12.650 endereços únicos de páginas Web com esforço e recursos diminutos.
Espera-se que a gravação destas páginas seja útil para as organizações que produziram esses conteúdos, para os investigadores que pretenderem estudar a nossa história e para os cidadãos que cultivam o sentido da memória e da democracia.
EN:
In this document you will find a list of keywords, a set of words, put into a search engine in order to obtain results on the topic "25 de Abril ", the Portuguese Revolution of 1974.
When researching this landmark event in Portugal's contemporary history, we considered people, places, social, political and cultural aspects, as well as words associated with the event.
The searches were carried out on March 22, 2024, using the Bing Search API, which is an automatic search service that returns results according to the relevance criteria of the Bing service itself and others configured by us.
We obtained lists of the first 10 results, then expanded to the first 20, 50 and 100 results. The aim was to obtain the largest number of pages available on the Web with reference to April 25th.
The higher the number of results, the lower the precision in relation to the topic you want. In this case, it is possible that the last results in a list of up to 100 have little to do with the topic "25 de Abril". The results are available here for anyone who wants to analyze this issue.
For the collection and recording on Arquivo.pt we used the list of up to 100 results, even if not all of them hit the target, which is "25 de Abril".
In total, 12,650 unique web page addresses were obtained with little effort and resources.
We hope that the recording of these pages will be useful to the organizations that produced this content, to researchers studying our history and to citizens cultivating a sense of memory and democracy.
Referências | References
[https://github.com/webrecorder/browsertrix-cloud](https://github.com/webrecorder/browsertrix-cloud)
[https://beta.browsertrix.cloud/](https://beta.browsertrix.cloud/)
[https://github.com/arquivo/bing-search](https://github.com/arquivo/bing-search)
[https://arquivo.pt/50anos25abril](https://arquivo.pt/50anos25abril)
89% Qualidade dos metadados
1
0
0
0
mais de 4 anosArquivo.pt - pesquise páginas do passado
Lista de domínios do jornal Público no Arquivo.pt (1996-2019)
Este ficheiro contém a lista de domínios e subdomínios utilizados no site do jornal Público, entre 1996 e 2019.
Para cada domínio ou subdomínio apresenta o intervalo temporal em que foi utilizado, o número de versões que se encontram no Arquivo.pt e o estado (ativo ou inativo) na Web atual.
Os dados foram obtidos em 2019, a partir das páginas Web preservadas pelo Arquivo.pt.
Os conteúdos preservados pelo Arquivo.pt encontram-se acessíveis para o estudo e a investigação sobre o jornal, a recuperação da memória institucional ou a simples curiosidade pelo passado.
89% Qualidade dos metadados
73
0
0
0
mais de 4 anosArquivo.pt - pesquise páginas do passado
Agrupamentos de Escolas ou Escolas não Agrupadas: websites e histórico de versões no Arquivo.pt - Agosto 2021
A listagem de Agrupamentos de Escolas / Escolas não Agrupadas: websites e histórico de versões no Arquivo.pt - Agosto 2021 tem por objetivo identificar os websites oficiais das escolas em Portugal e verificar se estão no Arquivo.pt.
Foi utilizada como referência a listagem publicada em 2018 pela Direção Geral da Administração Escolar (DGAE) que tem 811 registos (https://www.dgae.mec.pt/download/recrutamento/outros/201819/201870423_rec_out_CodigosAEENA.pdf).
Em agosto de 2021, verificou-se se os sites estavam online na Web e se havia algum conteúdo preservado no Arquivo.pt, indicando para isso os respetivos links.
No caso de um determinado endereço não ter um histórico por não estar a ser gravado, adiconou-se esse endereço à lista de recolhas para que de futuro possa estar.
Esta listagem requer revisão, pois os sites mudam mais depressa do que as instituições que os publicam.
Outras listagens segundo o tipo de ensino:
- Escolas de ensino artístico
- Escolas de ensino profissional
78% Qualidade dos metadados
255
0
0
1