Conjuntos de dados
Explore conjuntos de dados abertos de diversas origens, temas e em diferentes formatos, e utilize-os como base para novos estudos e insights.
Exemplos: "educação", "saúde pública", "ambiente"
48 Resultados
1 mêsArquivo.pt - pesquise páginas do passado
Websites de entidades das pessoas com deficiência e histórico no Arquivo.pt
Este documento contém uma lista de websites e páginas das Organizações Não Governamentais das pessoas com deficiência com registo no Instituto Nacional para a Reabilitação e o histórico preservado pelo Arquivo.pt.
A lista tem por objetivo identificar e cuidar da preservação dos conteúdos web para servirem a memória futura, o estudo e a investigação em diversas áreas.
Fonte: https://www.dges.gov.pt/en/node/938
100% Qualidade dos metadados
5
0
0
0
3 mesesArquivo.pt - pesquise páginas do passado
Feminismo em Portugal e conteúdos Web preservados pelo Arquivo.pt
Este conjunto de dados contém a lista de iniciativas feministas em Portugal e os seus Websites e redes sociais e foi produzido no âmbito do projeto “FEMglocal – Movimentos Feministas glocais: interações e contradições”.
O Arquivo.pt, em colaboração com a equipa do projeto, acrescentou ligações para as versões históricas preservadas e algumas anotações sobre o estado da versão, como por exemplo se está completa ou se precisa de ser melhorada.
“FEMglocal – Movimentos Feministas glocais: interações e contradições” (PTDC/COM-CSS/4049/2021 / DOI 10.54499/PTDC/COM-CSS/4049/2021), projeto financiado por fundos nacionais através da FCT — Fundação para a Ciência e a Tecnologia, I.P. Com a participação do DivIntLab (CICANT). Com a participação do Projeto Exploratório DigiPlArt (2024.13064.PEX), também financiado através da FCT.
Website do projeto: https://www.femglocal.pt/
78% Qualidade dos metadados
7
2
0
1
6 mesesArquivo.pt - pesquise páginas do passado
Websites do Governo e histórico no Arquivo.pt
Este documento contém uma lista de websites governamentais do Governo XXV tendo em vista a preservação de um histórico no arquivo da Web portuguesa, o Arquivo.pt. A identificação dos websites fez-se a partir da identificação das entidades governamentais, durante o mês de agosto de 2025.
O objetivo desta lista é identificar o maior número possível de websites relativos a uma Legislatura. As entidades, por vezes, mudam de nome ou são extintas dando lugar a novas entidades e a novos endereços de websites. O que se pretende é identificá-los para serem gravados no Arquivo.pt.
Para o Arquivo.pt bastaria apenas a coluna dos endereços ou URLs. Manteve-se, porém, os outros dados para dar contexto a cada website e facilitar o processo de curadoria e preservação. Se alguma informação não estiver correta, por favor, contacte o Arquivo.pt. Há URLs repetidos uma vez que há entidades relacionadas com mais de uma tutela. Na gravação os endereços repetidos são removidos. Há entidades que não têm website.
A lista é um ponto de partida para identificar e gravar os conteúdos web e, sempre que possível, para ser melhorada.
No caso de um determinado website não ter uma versão histórica no Arquivo.pt, qualquer utilizador pode fazer a gravação utilizando o serviço https://arquivo.pt/archivepagenow ou contactar o arquivo.pt pedindo a sua gravação.
Na procura e identificação dos websites seguiu-se as áreas de governação do Governo XXV, que são as seguintes:
Estado e Negócios Estrangeiros
Estado e Finanças
Estado e Finanças
Estado e Finanças
Presidência
Economia e Coesão Territorial
Reforma do Estado
Assuntos Parlamentares
Defesa Nacional
Infrestruturas e Habitação
Justiça
Administração Interna
Educação, Ciência e Inovação
Saúde
Trabalho, Solidariedade e Segurança Social
Ambiente e Energia
Cultura Juventude e Desporto
Agricultura e Mar
Referências
https://www.portugal.gov.pt/pt/gc25
https://www.gov.pt/entidades/
100% Qualidade dos metadados
7
3
0
0
2 anosArquivo.pt - pesquise páginas do passado
Street art: recolha temática de páginas web para preservação no Arquivo.pt
Neste conjunto encontra a lista de endereços (URLs) sobre street art, com o foco em Portugal e nos artistas portugueses, mas incluindo conteúdos internacionais.
Em Agosto de 2023, o Arquivo.pt começou por identificar páginas existentes na Web sobre a temática "Street Art" para posterior gravação e preservação no Arquivo.pt. O objetivo é enriquecer o acervo preservado sobre este tema e promover entre os investigadores o estudo de conteúdos antigos da Web. Lisboa é por vezes apelidada de capital da "Street Art" e um pouco por todo o país esta manifestação cultural está presente.
Para identificar os conteúdos o Arquivo.pt experimentou diversas técnicas, começando pela utilização manual de motores de busca até à utilização de ferramentas automáticas, tais como o serviço Bing Search API. Esta prática foi utilizada em coleções temáticas realizadas anteriormente, como por exemplo, nas Eleições Europeias 2019 e na coleção de páginas sobre o 25 de Abril.
English:
In this set you will find a list of addresses (URLs) on street art, with a focus on Portugal and Portuguese artists, but including international content.
In August 2023, Arquivo.pt began identifying existing web pages on the subject of "Street Art" for subsequent recording and preservation at Arquivo.pt. The aim is to enrich the preserved collection on this topic and promote the study of old web content among researchers. Lisbon is sometimes called the capital of "Street Art" and this cultural manifestation is present all over the country.
In order to identify the content, Arquivo.pt experimented with various techniques, starting with the manual use of search engines to the use of automatic tools, such as the Bing Search API service. This practice has been used in previous thematic collections, such as the 2019 European Elections and the collection of pages on April 25th.
100% Qualidade dos metadados
3
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
50 anos do 25 de Abril: páginas web sobre o 25 de Abril preservadas no Arquivo.pt
Neste conjunto de dados encontra uma lista de palavras-chave ou conjunto de palavras colocadas num motor de busca a fim de obter resultados sobre o tópico "25 de Abril".
Ao pesquisar sobre este evento marcante para a história contemporânea de Portugal consideramos pessoas, lugares, aspetos sociais políticos, sociais, culturais e ainda palavras associadas ao acontecimento.
As pesquisas foram realizadas no dia 22 de março de 2024 utilizando o Bing Search API, um serviço de pesquisa automática que devolve resultados de acordo com critérios de relevância do próprio serviço Bing e de outros configurados por nós.
Assim, obtivemos listas dos 10 primeiros resultados, depois ampliámos para os 20, 50 e 100 primeiros resultados. Pretendeu-se obter o maior número possível de páginas disponíveis resultados com referência ao 25 de Abril.
Quanto maior é o número de resultados menor é a precisão em relação ao tópico que se pretende. Neste caso, é possível que os últimos resultados numa lista até 100 tenham pouco a ver com o tema "25 de abril". Disponibilizamos aqui os resultados obtidos para quem quiser analisar esta questão.
Para a recolha e a gravação no Arquivo.pt utilizámos a lista até 100 resultados, mesmo que nem todos acertem no alvo que é o "25 de Abril".
No total foram obtidos 12.650 endereços únicos de páginas Web com esforço e recursos diminutos.
Espera-se que a gravação destas páginas seja útil para as organizações que produziram esses conteúdos, para os investigadores que pretenderem estudar a nossa história e para os cidadãos que cultivam o sentido da memória e da democracia.
EN:
In this document you will find a list of keywords, a set of words, put into a search engine in order to obtain results on the topic "25 de Abril ", the Portuguese Revolution of 1974.
When researching this landmark event in Portugal's contemporary history, we considered people, places, social, political and cultural aspects, as well as words associated with the event.
The searches were carried out on March 22, 2024, using the Bing Search API, which is an automatic search service that returns results according to the relevance criteria of the Bing service itself and others configured by us.
We obtained lists of the first 10 results, then expanded to the first 20, 50 and 100 results. The aim was to obtain the largest number of pages available on the Web with reference to April 25th.
The higher the number of results, the lower the precision in relation to the topic you want. In this case, it is possible that the last results in a list of up to 100 have little to do with the topic "25 de Abril". The results are available here for anyone who wants to analyze this issue.
For the collection and recording on Arquivo.pt we used the list of up to 100 results, even if not all of them hit the target, which is "25 de Abril".
In total, 12,650 unique web page addresses were obtained with little effort and resources.
We hope that the recording of these pages will be useful to the organizations that produced this content, to researchers studying our history and to citizens cultivating a sense of memory and democracy.
Referências | References
[https://github.com/webrecorder/browsertrix-cloud](https://github.com/webrecorder/browsertrix-cloud)
[https://beta.browsertrix.cloud/](https://beta.browsertrix.cloud/)
[https://github.com/arquivo/bing-search](https://github.com/arquivo/bing-search)
[https://arquivo.pt/50anos25abril](https://arquivo.pt/50anos25abril)
89% Qualidade dos metadados
5
0
0
0
3 anosArquivo.pt - pesquise páginas do passado
Coleções colaborativas de conteúdos Web internacionais: IIPC Content Development Working Group
O International Internet Preservation Consortium Content Development Working Group (IIPC-CDG) tem criado coleções colaborativas sobre diversos temas e eventos, fundamentalmente a partir dos contributos dos arquivistas da Web, mas também com a colaboração pública. O [consórcio IIPC](https://netpreserve.org), de que o Arquivo.pt é membro, é a entidade principal no domínio dos arquivos da Web em todo o mundo.
As coleções foram feitas usando o [Archive-it](https://archive-it.org/home/IIPC), um serviço do Internet Archive.
Neste cojunto de dados encontra a lista de URLs ou endereços de conteúdos Web das seguintes coleções do IIPC:
2010-Winter-Olympics
2012 Summer Paralympics
2012-2012 Summer Olympics
2014 Winter Olympics
2014 Winter Paralympics
2016 Summer Olympics and Paralympics
2018 Winter Olympics and Paralympics
2020 Summer Olympics and Paralympics-held in 2021
Afghanistan Regime Change (2021) and the International Response
Artificial Intelligence
Climate Change
European Refugee Crisis
Intergovernmental Organizations
National Olympic and Paralympic Committees
IIPC-Novel Coronavirus COVID-19
IIPC-Online News Around the World
IIPC-Street Art
IIPC-War in Ukraine
IIPC-World War I Commemoration
89% Qualidade dos metadados
3
9
0
0
mais de 3 anosArquivo.pt - pesquise páginas do passado
Jornais centenários portugueses: websites e links para versões preservadas no Arquivo.pt (1996-2023)
Este documento contém a lista dos 40 jornais centenários, dados fornecidos pela Associação Portuguesa de Imprensa, em janeiro de 2023.
Aos dados do título e data da fundação acrescentou-se o endereço para o website atual (janeiro de 2023) e ainda um link para a versão preservada no Arquivo.pt.
Se o endereço do Website de um jornal mudou ao longo do tempo deve ter-se em conta também esses endereços, ao pesquisar no Arquivo.pt, para obter-se um histórico mais completo.
89% Qualidade dos metadados
1
0
0
0
2 anosArquivo.pt - pesquise páginas do passado
Turismo em Portugal: Websites e histórico de versões no Arquivo.pt
Este conjunto de dados contém uma lista de Websites e páginas Web relacionadas com o setor do turismo em Portugal e, para cada item, um link para uma versão preservada no Arquivo.pt.
A lista é o resultado da colaboração entre o [Museu Virtual do Turismo (MUVITUR)](https://muvitur.eshte.pt/), através da Biblioteca Celestino Domingues da Escola Superior de Hotelaria e Turismo do Estoril, e o Arquivo.pt.
A iniciativa tem por objetivo preservar e divulgar os conteúdos publicados na Web sobre turismo, desde 1996. A lista deve ser aumentada com novos itens.
Foram adicionados dados descritivos a cada idem. Neste conjunto encontram-se os seguintes:
- Denominação - geralmente o título do website
- Organização - a entidade a quem pertence a publicação
- Endereço do sítio Web na Internet
- Endereço para versão no Arquivo.pt
- Momento(s) para recordar
- Link para miniatura no Arquivo.pt
- Descritores
- Dados geográficos (localização, coordenadas, nome geográfico)
Estes dados serviram para criar uma [coleção de registos de sítios Web no MUVITUR](http://arquivodigital.eshte.pt/Nyron/Museum/Catalog/winlib.aspx?skey=&option=Destaques&dtype=mosaico) relacionados com o setor do turismo em Portugal.
A identificação dos Websites e das páginas Web relacionadas com o turismo ajuda o Arquivo.pt a melhorar a preservação e aos investigadores a aceder a conteúdos históricos que já não se encontram online.
78% Qualidade dos metadados
2
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Editores e livreiros em Portugal: websites e histórico de versões no Arquivo.pt
Este conjunto de dados apresenta nomes de editoras e livreiros em Portugal e o histórico dos seus websites que está acessível para qualquer cidadão no Arquivo.pt.
Inclui ainda uma recolha de notícias sobre um tipo de evento realizado um pouco por todo o país ao longo do ano: a "feira do livro".
**Contexto**
O mercado editorial muda com o tempo e o mesmo acontece aos websites deste setor de atividade.
Todos os anos surgem novas editoras e desaparecem outras. Há marcas conhecidas dos portugueses que se mantêm mas que entretanto passaram a pertencer a novos projetos. O histórico dos websites espelha essas mudanças ao longo do tempo.
O Arquivo.pt é um serviço público de preservação da Web que recolhe e mantém acessíveis conteúdos publicados na Web desde 1996. Constituem um património digital para memória das empresas e instituições e para o estudo e investigação nas mais diversas áreas.
Ao identificar os websites das editoras e dos livreiros, em setembro de 2022, o Aquivo.pt pretendeu chamar a atenção para este património digital e melhorar a sua preservação.
Não se encontrou uma lista completa das editoras e livreiros e assim deve considerar-se esta lista aberta. Espera-se contributos e sugestões para aumentar esta lista através do [formulário de sugestão do Arquivo.pt](http://arquivo.pt/sugerir).
Procurou-se incluir projetos editoriais alternativos e de pequena dimensão. Os editores e livreiros para os quais não encontrámos um website ou uma página social não foram incluídos, pois o foco desta lista são os websites.
O nome para designar cada editora ou livreiro foi aquele por que é mais conhecido, em vez do nome do registo empresarial.
Espera-se, futuramente, sensibilizar as pessoas que trabalham neste setor para a importância de terem um bom histórico do seu website e de ajudarem o Arquivo.pt a fazê-lo da forma mais completa possível.
**Fontes de informação**
Associação Portuguesa de Editores e Livreiros
DGLAB - lista de editores
Rede de Livrarias Independentes Portuguesas - RELI
89% Qualidade dos metadados
10
5
0
0
4 anosArquivo.pt - pesquise páginas do passado
Websites do Afeganistão e a queda do regime em agosto de 2021. Recolha especial em colaboração internacional
Este documento contém 1812 endereços de sites do Afeganistão, do domínio .af e 547 notícias dos media.
Os endereços, URLs ou "seeds" foram obtidos através de pesquisa automática, utilizando o Bing Search API e colocados imediatamente em gravação.
**Contexto**
No dia 15 de agosto de 2021 o palácio presidencial em Cabul foi tomado pelos Talibãs, consumando a queda do regime que vigorava há 20 anos, após os atentados do 11 de Setembro nos Estados Unidos.
Na comunidade dos arquivistas da Web foi lançado o desafio de gravar os sites afegãos, face ao risco de estes virem a desaparecer com o novo regime.
O Arquivo.pt reagiu rapidamente, lançando uma pesquisa automática focada em sites do domínio .af e outra em notícias dos media internacionais sobre os eventos em curso. No dia 17 de agosto os websites começaram a ser gravados.
Em outubro de 2021, o Content Development Working Group do International Internet Preservation Coalitium (IIPC) (https://netpreserve.org/about-us/working-groups/content-development-working-group/) lançou uma lista colaborativa onde arquivistas da Web de vários países colocaram endereços de interesse sobre a situação do Afeganistão.
O principal contributo do Arquivo.pt para a comunidade dos arquivistas da Web foi a demonstração da pesquisa automática que permite uma reação rápida na gravação de conteúdos Web em risco de se perderem.
**Mais informação:**
Os conteúdos recolhidos pelo Content Development Working Group do International Internet Preservation Coalitium estão disponíveis no serviço Archive-it, na coleção [Afghanistan Regime Change (2021) and the International Response](https://archive-it.org/collections/17622)
89% Qualidade dos metadados
2
0
0
0
3 anosArquivo.pt - pesquise páginas do passado
Viagem de Circum-Navegação. Conteúdos Web para preservação no Arquivo.pt
A [Estrutura de Missão do V Centenário da Primeira Viagem de Circum-Navegação (EMCFM)](https://magalhaes500.pt/) foi [criada pelo Conselho de Ministros em 2017](https://arquivo.pt/wayback/20190907111108/https://www.portugal.gov.pt/pt/gc21/comunicacao/noticia?i=20170119-mm-fmagalhaes).
Entre 2019 e 2022, a EMCFM desenvolveu um programa de comemorações promovendo colaborações com diversas entidades e serviços.
O Arquivo.pt (FCT, I.P.) contribuiu com a gravação de conteúdos temáticos sobre Fernão de Magalhães e a demonstração do seu uso para a memória institucional através da exposição online [Viagem no tempo com o Arquivo.pt](https://arquivo.pt/magalhaes500/).
Pretende-se aumentar os conteúdos relacionados com Fernão de Magalhães e a Viagem de Circum-navegação no acervo do Arquivo.pt de modo a servirem para a memória e para a investigação.
100% Qualidade dos metadados
5
4
0
0
3 anosArquivo.pt - pesquise páginas do passado
Websites referenciados nos relatórios de projetos financiados pela FCT. Recolha para preservação no Arquivo.pt
Este documento contém os endereços dos conteúdos Web (URLs) referidos pelos investigadores nos relatórios dos projetos financiados pela Fundação para a Ciência e a Tecnologia, desde junho de 2020.
Denominam-se "seeds" (sementes) estes endereços, pois são o ponto de partida para a gravação dos conteúdos dos Websites. As listas de endereços foram obtidas periodicamente a partir da base de dados da FCT.
Os endereços obtidos apontam para recursos online tais como os websites dos projetos, unidades de I&D, notícias nos media, artigos em revistas científicas ou repositórios, base de dados, vídeos no Youtube ou páginas do Facebook.
Em junho de 2020, o Arquivo.pt obteve 263 endereços relacionados com 100 projetos científicos a partir dos relatórios financiados pela FCT. Grande parte dos endereços (67%) não tinha qualquer versão anteriormente preservada no Arquivo.pt.
Em julho de 2020, lançou-se uma recolha especial a partir deste conjunto de endereços que resultou em 6,9 GB de informação obtidos a partir da visita a 31 606 URLs.
Em 2021 e em 2022 voltou-se a gravar os endereços obtidos a partir da base de dados da FCT procurando as melhores técnicas para o fazer com sucesso.
Alguns conteúdos desapareceram da Web, outros são de difícil gravação e reprodução, como por exemplo, vídeos do Youtube, páginas do Facebook, sites Wix.
Mais informação:
Notícia no site informativo do Arquivo.pt [Arquivo.pt preserva websites de projectos científicos nacionais](https://sobre.arquivo.pt/pt/arquivo-pt-preserva-websites-de-projectos-cientificos-nacionais/)
Exposição online [Memória Web da investigação científica](https://memoriafct.wordpress.com/)
78% Qualidade dos metadados
2
1
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2016. Recolha de conteúdos Web para preservação no Arquivo.pt
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos recolher foram obtidos a partir de lista colaborativa, um formulário aberto à participação dos cidadãos para sugestão páginas e websites.
Resultou na sugestão de 285 endereços que serviram de ponto de partida (seeds).
Os conteúdos foram recolhidos antes e após as eleições, entre 21 e 28 de janeiro de 2016.
89% Qualidade dos metadados
4
1
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2022. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 30 de janeiro de 2022 realizaram-se em Portugal as Eleições Legislativas.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Começou-se por definir uma lista de termos de pesquisa (keywords). Utilizou-se o Bing Search API para realizar as pesquisas de forma automática.
Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa. Os dados mais importantes para a recolha são os endereços (URLs), pois são o ponto de partida (seeds) para a gravação de conteúdos.
A recolha foi realizada teve duas fases:
- recolha pré-eleitoral (1)
- recolha pós-eleitoral (2)
Mais informação
"Os conteúdos gravados foram reunidos na coleção EAWP40 que tem como datas limite 2022-01-25 e 2022-02-10 e um volume de informação de 0.24 Terabytes (ver em https://arquivo.pt/collections).
A disponibilização dos conteúdos acontece, habitualmente, passado um ano sobre a recolha do Arquivo.pt."
89% Qualidade dos metadados
4
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Autárquicas 2021. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 26 de setembro de 2021 realizaram-se as Eleições Autárquicas em Portugal.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Começou-se por identificar endereços de conteúdos eleitorais para a recolha recorrendo a informação de diversas fontes:
- site EyeData de onde obteve os nomes dos candidatos e o respetivo concelho (Social Data Lab)
- página da Wikipédia dedicada às elelições
- sites dos partidos políticos
- site da Comissão Nacional de Eleições
- lista colaborativa para sugestão de conteúdos eleitorais a preservar (formulário aberto à participação de todos os cidadãos)
Utilizou-se diversos métodos:
- identificação manual e sistemática de conteúdos
- pesquisa automática sobre uma lista de termos de pesquisa utilizando o Bing Search API (motor de busca)
A gravação de conteúdos aconteceu em três momentos:
- recolha pre-eleitoral (1), primeiro ensaio, a fim de testar a pesquisa de páginas e as ferramentas de gravação
- recolha pré-eleitoral (2)
- recolha pós-eleitoral (3)
Estes endereços (URLs) foram o ponto de partida para a gravação de conteúdos eleitorais para serem preservados pelo Arquivo.pt.
Mais informação
Os conteúdos, depois de gravados, foram agregados numa coleção dedicada às eleições autárquicas, a EAWP39 (ver em https://arquivo.pt/collections).
A coleção especial EAWP tem como datas limite 2021-07-23 e 2021-10-07, recolheu 31,266,653 ficheiros, 118,440 URLs, tendo resultado em 2.7 Terabytes de informação.
89% Qualidade dos metadados
2
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2021. Recolha de conteúdos para preservação no Arquivo.pt
A 24 de janeiro de 2021 realizaram-se em Portugal as Eleições Presidenciais.
O Arquivo.pt lançou uma recolha especial de conteúdos publicados na Web relacionados com este evento. A pesquisa e identificação de conteúdos foi feita de forma automática, utilizando o serviço Bing Search API.
A partir de palavras-chave o motor de busca devolveu os resultados mais relevantes da sua lista. Os endereços (URLs) resultantes o ponto de partida para a gravação de conteúdos.
A recolha teve duas fases:
- pré-eleitoral (1)
- pós-eleitoral (2)
Mais informação
Os conteúdos gravados correspondem à coleção EAWP37 que tem como datas limite 2021-01-18 e 2021-02-11 e um volume de 0.626 Terabytes (ver em https://arquivo.pt/collections).
89% Qualidade dos metadados
1
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Legislativas 2019. Recolha de conteúdos para preservação no Arquivo.pt
No dia 6 de outubro de 2019 realizaram-se em Portugal as Eleições Legislativas. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Começou-se por definir uma lista de termos de pesquisa (keywords). Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa.
A recolha foi realizada em duas fases:
- recolha pré-eleitoral (1)
- recolha pós-eleitoral (2)
A gravação dos conteúdos em páginas de Facebook e Youtube foi feita com as ferramentas Brozzler e Browsertrix. A reprodução deste tipo de conteúdos apresenta dificuldades. Para estes conteúdos a gravação foi feita a título exploratório.
Mais informação
Os conteúdos gravados foram reunidos na coleção EAWP26. Tem como datas limite 2019-09-30 e 2019-10-31 e um volume de informação de 0.54 Terabytes (ver em https://arquivo.pt/collections).
89% Qualidade dos metadados
2
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Europeias 2019. Recolha de conteúdos Web para preservação no Arquivo.pt
No dia 26 de maio de 2019 realizaram-se as Eleições Europeias em Portugal.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais e expandiu a recolha a todos os países da União Europeia por via da língua.
Começou-se por definir uma lista de termos de pesquisa (keywords). Os termos de pesquisa foram traduzidos para 24 línguas oficiais. Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa.
Além da identificação automática de conteúdos, lançou-se uma lista colaborativa para recolher sugestões nacionais e internacionais de conteúdos eleitorais.
A recolha ou crawl teve várias etapas:
- recolha pré-eleitoral (1) - 1º crawl - testou a identificação e recolha em outras línguas além do português
- recolha pré-eleitoral (2) - 2º crawl - gerou termos nas 24 línguas oficiais da União Europeia
- recolha pós-eleitoral (3) - 3º crawl - usou uma lista de termos com a tradução revista pel Publications Office da UE
- recolha pós-eleitoral (4) - 4º crawl - uma recolha final pós-eleitoral que reune os resultados do Bing e os contributos da comunidade
Mais informação:
Os conteúdos gravados foram reunidos na coleção EAWP23 que tem como datas limite 2019-05-22 e 2019-07-17 e um volume de informação de 4.8 Terabytes (ver https://arquivo.pt/collections).
Notícia no site informativo do Arquivo.pt: https://sobre.arquivo.pt/pt/colecao-sobre-as-eleicoes-europeias-2019/
Pesquisa no Arquivo.pt: https://arquivo.pt/ee2019
89% Qualidade dos metadados
2
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Autárquicas 2017. Recolha de conteúdos Web para preservação no Arquivo.pt
Este conjunto refere-se às duas recolhas de conteúdos Web realizadas antes e depois das Eleições Autárquicas 2017, a 27 de setembro e a 10 de outubro de 2017, e contém:
- URLs da lista colaborativa que recolheu sugestões dos cidadãos de conteúdos a preservar
- URLs resultantes da pesquisa automática utilizando o Bing Search API, por concelho
Adicionou-se em cada resultado respetivo link para o Arquivo.pt.
As Eleições Autárquicas de 2017 realizaram-se no dia 1 de outubro e o Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos a gravar foram identificados a partir de duas fontes:
- lista colaborativa - formulário aberto à participação dos cidadãos para sugestãos de conteúdos a preservar
- pesquisa automática utilizando o Bing Search API
A pesquisa automática combinou palavras-chave (keywords) tais como ""autárquicas"" com o nome dos concelhos,
a fim de obter os resultados apresentados pelo motor de busca como mais relevantes, em geral os 20 primeiros.
Os URLs obtidos serviram de ponto de partida ou ""seeds"" para a gravação dos conteúdos eleitorais.
A recolha foi feita em dois momentos:
- pré-eleitoral - 27 e 28 de setembro de 2017
- pós-eleitoral - 10 e 11 de outubro de 2017
Os URLs de redes sociais, tais como o Facebook e Youtube, podem não ter sido gravados, pois usam uma tecnologia diferente dos sítios Web.
Mais informação:
A recolha pré-eleitoral correponde à coleção especial EAWP16 com um volume de 0.13 Terabytes.
A recolha pós-eleitoral correponde à coleção especial EAWP17 com um volume de 0.23 Terabytes.
Ver em https://arquivo.pt/collections/
89% Qualidade dos metadados
3
0
0
0
4 anosArquivo.pt - pesquise páginas do passado
Eleições Presidenciais 2016. Recolha de conteúdos Web para preservação no Arquivo.pt
As Eleições Presidenciais 2016 realizaram-se no dia 24 de janeiro.
O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais.
Os conteúdos recolher foram obtidos a partir de lista colaborativa, ou seja, de formulário aberto à participação dos cidadãos para sugestão páginas e websites relacionados com o evento eleitoral.
Resultou na sugestão de 284 endereços que serviram de ponto de partida (seeds).
Os conteúdos foram recolhidos antes e após as eleições, entre 21 e 28 de janeiro de 2016.
Mais informação:
A recolha pré-eleitoral correponde à coleção especial EAWP9 que um volume de 7 Gigabytes (ver https://arquivo.pt/collections/).
Notícia no site informativo do Arquivo.pt:
- https://arquivo.pt/wayback/20170224220059/http://sobre.arquivo.pt/noticias/recolhemos-os-sites-das-eleicoes-presidenciais-de
67% Qualidade dos metadados
0
0
0
0