"id";"title";"slug";"acronym";"url";"organization";"organization_id";"description";"frequency";"license";"temporal_coverage.start";"temporal_coverage.end";"spatial.granularity";"spatial.zones";"private";"featured";"created_at";"last_modified";"tags";"archived";"resources_count";"harvest.backend";"harvest.domain";"harvest.created_at";"harvest.modified_at";"quality_score";"metric.discussions";"metric.reuses";"metric.followers";"metric.views" "660155fbe0a34d026a12008d";"50 anos do 25 de Abril: páginas web sobre o 25 de Abril preservadas no Arquivo.pt";"50-anos-do-25-de-abril-paginas-web-sobre-o-25-de-abril-preservadas-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/50-anos-do-25-de-abril-paginas-web-sobre-o-25-de-abril-preservadas-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Neste conjunto de dados encontra uma lista de palavras-chave ou conjunto de palavras colocadas num motor de busca a fim de obter resultados sobre o tópico ""25 de Abril"". Ao pesquisar sobre este evento marcante para a história contemporânea de Portugal consideramos pessoas, lugares, aspetos sociais políticos, sociais, culturais e ainda palavras associadas ao acontecimento. As pesquisas foram realizadas no dia 22 de março de 2024, utilizando o Bing Search API, que é um serviço de pesquisa automática que devolve resultados de acordo com critérios de relevância do próprio serviço Bing e de outros configurados por nós. Assim, obtivemos listas dos 10 primeiros resultados, depois ampliámos para os 20, 50 e 100 primeiros resultados. Pretendeu-se obter o maior número páginas disponível na Web com referência ao 25 de Abril. Quanto maior é o número de resultados (""recall"") menor é a precisão (""precision"") em relação ao tópico que se pretende. Neste caso, é possível que os últimos resultados numa lista até 100 tenham pouco a ver com o tema ""25 de abril"". Disponibilizamos aqui os resultados obtidos para quem quiser analisar esta questão. Para a recolha e a gravação no Arquivo.pt utilizámos a lista até 100 resultados, mesmo que nem todos acertem no alvo que é o ""25 de Abril"". No total foram obtidos 12.650 endereços únicos de páginas Web com esforço e recursos diminutos. Espera-se que a gravação destas páginas seja útil às organizações que produziram esses conteúdos, aos investigadores para estudarem a nossa história e aos cidadãos para cultivarem o sentido da memória e da democracia. EN: In this document you will find a list of keywords, a set of words, put into a search engine in order to obtain results on the topic ""25 de Abril "", the Portuguese Revolution of 1974. When researching this landmark event in Portugal's contemporary history, we considered people, places, social, political and cultural aspects, as well as words associated with the event. The searches were carried out on March 22, 2024, using the Bing Search API, which is an automatic search service that returns results according to the relevance criteria of the Bing service itself and others configured by us. We obtained lists of the first 10 results, then expanded to the first 20, 50 and 100 results. The aim was to obtain the largest number of pages available on the Web with reference to April 25th. The higher the number of results (""recall""), the lower the precision (""precision"") in relation to the topic you want. In this case, it is possible that the last results in a list of up to 100 have little to do with the topic ""25 de Abril"". The results are available here for anyone who wants to analyze this issue. For the collection and recording on Arquivo.pt we used the list of up to 100 results, even if not all of them hit the target, which is ""25 de Abril"". In total, 12,650 unique web page addresses were obtained with little effort and resources. We hope that the recording of these pages will be useful to the organizations that produced this content, to researchers studying our history and to citizens cultivating a sense of memory and democracy. Referências | References [https://github.com/webrecorder/browsertrix-cloud](https://github.com/webrecorder/browsertrix-cloud) [https://beta.browsertrix.cloud/](https://beta.browsertrix.cloud/) [https://github.com/arquivo/bing-search](https://github.com/arquivo/bing-search) [https://arquivo.pt/50anos25abril](https://arquivo.pt/50anos25abril) ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2024-03-25";"country";"Portugal";False;False;"2024-03-25T10:46:19.087000";"2024-03-25T16:22:05.843000";"25-de-abril,arquivo-da-web,comemoracoes,preservacao-digital";False;1;"";"";"";"";"1.00";0;0;0;0 "64fedc3b305f9764a9b37f6c";"Coleções colaborativas de conteúdos Web internacionais: IIPC Content Development Working Group ";"colecoes-colaborativas-de-conteudos-web-internacionais-iipc-content-development-working-group";"";"https://dados.gov.pt/pt/datasets/colecoes-colaborativas-de-conteudos-web-internacionais-iipc-content-development-working-group/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"O International Internet Preservation Consortium Content Development Working Group (IIPC-CDG) tem criado coleções colaborativas sobre diversos temas e eventos, fundamentalmente a partir dos contributos dos arquivistas da Web, mas também com a colaboração pública. O [consórcio IIPC](https://netpreserve.org), de que o Arquivo.pt é membro, é a entidade principal no domínio dos arquivos da Web em todo o mundo. As coleções foram feitas usando o [Archive-it](https://archive-it.org/home/IIPC), um serviço do Internet Archive. Neste cojunto de dados encontra a lista de URLs ou endereços de conteúdos Web das seguintes coleções do IIPC: 2010-Winter-Olympics 2012 Summer Paralympics 2012-2012 Summer Olympics 2014 Winter Olympics 2014 Winter Paralympics 2016 Summer Olympics and Paralympics 2018 Winter Olympics and Paralympics 2020 Summer Olympics and Paralympics-held in 2021 Afghanistan Regime Change (2021) and the International Response Artificial Intelligence Climate Change European Refugee Crisis Intergovernmental Organizations National Olympic and Paralympic Committees IIPC-Novel Coronavirus COVID-19 IIPC-Online News Around the World IIPC-Street Art IIPC-War in Ukraine IIPC-World War I Commemoration ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2010-09-01";"2023-09-11";"country-group";"";False;False;"2023-09-11T10:22:03.125000";"2023-09-11T11:31:57.623000";"arquivos-da-web,internet,preservacao-digital";False;19;"";"";"";"";"1.00";0;0;0;0 "64ef12e13b16afe4db7a4ed4";"2019 European Parliamentary Elections - CoNLL-U texts";"2019-european-parliamentary-elections-conll-u-texts";"";"https://dados.gov.pt/pt/datasets/2019-european-parliamentary-elections-conll-u-texts/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"This dataset is composed of the automatically parsed texts present in the ""2019 European Parliamentary Elections - Raw texts"" collection. The texts were automatically annotated using the UDify tool with its multilingual model. (2023-04-27) Related publications: Diego Alves,Computational typological analysis of syntactic structures in European languages, Doctoral thesis, Zagreb University, 2023. Daniel Gomes, Secondments@Arquivo.pt and new research tools available, Cleopatra project, May 2023, Hannover.";"punctual";"Creative Commons CCZero";"2019-05-22";"2019-07-17";"country";"European Union";False;False;"2023-08-30T10:58:57.870000";"2023-08-30T17:56:08.142000";"dependency-parsing,european-parliamentary-elections,multilingualism,social-sciences";False;5;"";"";"";"";"1.00";0;0;0;0 "64ef0f213b16afe4db7a4ed3";"2019 European Parliamentary Elections - Raw texts";"2019-european-parliamentary-elections-raw-texts";"";"https://dados.gov.pt/pt/datasets/2019-european-parliamentary-elections-raw-texts/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"This corpus is composed of raw texts extracted from the EAWP23 collection of the Arquivo.pt which is composed of internet websites about the 2019 European Parliamentary Elections for all 24 European Union official languages. (2023-04-27) This data set was created by Diego Alves and was also published at [Harvest Dataverse](https://doi.org/10.7910/DVN/WCGNHU). Related publications: Diego Alves,[Computational typological analysis of syntactic structures in European languages](https://repozitorij.unizg.hr/islandora/object/ffzg:8462), Doctoral thesis, Zagreb University, 2023. Daniel Gomes, [Secondments@Arquivo.pt and new research tools available](https://sobre.arquivo.pt/wp-content/uploads/arquivo-pt-secondment-cleopatra-daniel-gomes-diego-alves.pdf), Cleopatra project, May 2023, Hannover. ";"punctual";"Creative Commons CCZero";"2019-05-22";"2019-07-16";"country";"European Union";False;False;"2023-08-30T10:42:57.599000";"2023-08-30T10:50:49.182000";"european-parliamentary-elections,multilingualism,raw-text,social-sciences";False;1;"";"";"";"";"1.00";0;0;0;0 "64ee072ff1b5a534ce7a4ed3";"A n-grams collection extracted from the Portuguese Web";"a-n-grams-collection-extracted-from-the-portuguese-web";"";"https://dados.gov.pt/pt/datasets/a-n-grams-collection-extracted-from-the-portuguese-web/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"The n-grams collection was extracted from the collected documents whose identified language was Portuguese. We extracted word n-grams up to the fifht order (5-grams). A set of regular expressions to tokenize the text were applied. After the extraction, all n-grams with tokens having more than 32 characters were discarded. N-grams with frequencies below 5 were discarded as well. The n-grams collection is available as a set of UTF-8 encoded files, containing the n-grams and their frequencies (2010-11-10). This collection was build by David Batista, winner of the [2nd place of the Arquivo.pt award 2021](https://arquivo.pt/winners2021) with the work [Politiquices.pt](https://www.politiquices.pt/). Related publication: https://www.davidsbatista.net/assets/documents/publications/WPT05_fala2010.pdf Also published at [Harvard Dataverse](https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/ZSXC55)";"punctual";"Creative Commons CCZero";"1996-01-01";"2022-12-02";"country";"Portugal";False;False;"2023-08-29T15:56:47.976000";"2023-08-29T16:12:02.062000";"n-grams-portuguese";False;1;"";"";"";"";"1.00";0;0;0;0 "6425669a07819071002e170b";"Arquivo do Parlamento: notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt";"arquivo-do-parlamento-noticias-e-artigos-de-opiniao-extraidos-do-arquivo-pt-com-base-nos-dados-abertos-do-parlamento-pt";"";"https://dados.gov.pt/pt/datasets/arquivo-do-parlamento-noticias-e-artigos-de-opiniao-extraidos-do-arquivo-pt-com-base-nos-dados-abertos-do-parlamento-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"[Arquivo do Parlamento](https://arquivo-parlamento.pt/) é uma aplicação Web que agrega e categoriza notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt. Este trabalho, da autoria de Tiago Santos, foi [1º classificado do Prémio Arquivo.pt 2022](https://arquivo.pt/vencedores2022). Este conjunto de dados contém 217 mil artigos e notícias, desde 1996, que alimentam a aplicação [Arquivo do Parlamento](https://arquivo-parlamento.pt/), à data de 18 de maio de 2022. Cada linha tem os seguintes dados: data, título da notícia, link para a Web, link para a versão arquivada. A base de dados será atualizada com novas notícias, à medida que estiverem acessíveis no Arquivo.pt. Mais informação: https://arquivo.pt/vencedores2022";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2023-01-23";"country";"Portugal";False;False;"2023-03-30T11:38:18.198000";"2023-03-30T12:09:05.434000";"arquivo,arquivo-da-web,cidadania,parlamento,politica";False;2;"";"";"";"";"1.00";0;0;0;0 "63c81a270781901a1fb0b18a";"Jornais centenários portugueses: websites e links para versões preservadas no Arquivo.pt (1996-2023)";"jornais-centenarios-portugueses-websites-e-links-para-versoes-preservadas-no-arquivo-pt-1996-2023";"";"https://dados.gov.pt/pt/datasets/jornais-centenarios-portugueses-websites-e-links-para-versoes-preservadas-no-arquivo-pt-1996-2023/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este documento contém a lista dos 40 jornais centenários, dados fornecidos pela Associação Portuguesa de Imprensa, em janeiro de 2023. Aos dados do título e data da fundação acrescentou-se o endereço para o website atual (janeiro de 2023) e ainda um link para a versão preservada no Arquivo.pt. Se o endereço do Website de um jornal mudou ao longo do tempo deve ter-se em conta também esses endereços, ao pesquisar no Arquivo.pt, para obter-se um histórico mais completo.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2023-01-18";"country";"Portugal";False;False;"2023-01-18T16:11:19.477000";"2023-01-30T12:15:46.426000";"arquivo-da-web,arquivo-digital,imprensa,jornais-online-portugueses,preservacao-digital";False;1;"";"";"";"";"1.00";0;0;0;126 "63b308050781908b3b2f29f7";"Turismo em Portugal: Websites e histórico de versões no Arquivo.pt";"turismo-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/turismo-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este conjunto de dados contém uma lista de Websites e páginas Web relacionadas com o setor do turismo em Portugal e, para cada item, um link para uma versão preservada no Arquivo.pt. A lista é o resultado da colaboração entre o [Museu Virtual do Turismo (MUVITUR)](https://muvitur.eshte.pt/), através da Biblioteca Celestino Domingues da Escola Superior de Hotelaria e Turismo do Estoril, e o Arquivo.pt. A iniciativa tem por objetivo preservar e divulgar os conteúdos publicados na Web sobre turismo, desde 1996. A lista deve ser aumentada com novos itens. Foram adicionados dados descritivos a cada idem. Neste conjunto encontram-se os seguintes: - Denominação - geralmente o título do website - Organização - a entidade a quem pertence a publicação - Endereço do sítio Web na Internet - Endereço para versão no Arquivo.pt - Momento(s) para recordar - Link para miniatura no Arquivo.pt - Descritores - Dados geográficos (localização, coordenadas, nome geográfico) Estes dados serviram para criar uma [coleção de registos de sítios Web no MUVITUR](http://arquivodigital.eshte.pt/Nyron/Museum/Catalog/winlib.aspx?skey=&option=Destaques&dtype=mosaico) relacionados com o setor do turismo em Portugal. A identificação dos Websites e das páginas Web relacionadas com o turismo ajuda o Arquivo.pt a melhorar a preservação e aos investigadores a aceder a conteúdos históricos que já não se encontram online.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2023-01-02";"country";"Portugal";False;False;"2023-01-02T16:36:21.937000";"2023-01-02T16:41:07.101000";"arquivo-da-web,curadoria-digital,preservacao-digital,turismo,turismo-de-portugal,websites";False;1;"";"";"";"";"0.89";0;0;0;32 "631cf1eb078190631e80cf28";"Editores e livreiros em Portugal: websites e histórico de versões no Arquivo.pt";"editores-e-livreiros-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/editores-e-livreiros-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este conjunto de dados apresenta nomes de editoras e livreiros em Portugal e o histórico dos seus websites que está acessível para qualquer cidadão no Arquivo.pt. Inclui ainda uma recolha de notícias sobre um tipo de evento realizado um pouco por todo o país ao longo do ano: a ""feira do livro"". **Contexto** O mercado editorial muda com o tempo e o mesmo acontece aos websites deste setor de atividade. Todos os anos surgem novas editoras e desaparecem outras. Há marcas conhecidas dos portugueses que se mantêm mas que entretanto passaram a pertencer a novos projetos. O histórico dos websites espelha essas mudanças ao longo do tempo. O Arquivo.pt é um serviço público de preservação da Web que recolhe e mantém acessíveis conteúdos publicados na Web desde 1996. Constituem um património digital para memória das empresas e instituições e para o estudo e investigação nas mais diversas áreas. Ao identificar os websites das editoras e dos livreiros, em setembro de 2022, o Aquivo.pt pretendeu chamar a atenção para este património digital e melhorar a sua preservação. Não se encontrou uma lista completa das editoras e livreiros e assim deve considerar-se esta lista aberta. Espera-se contributos e sugestões para aumentar esta lista através do [formulário de sugestão do Arquivo.pt](http://arquivo.pt/sugerir). Procurou-se incluir projetos editoriais alternativos e de pequena dimensão. Os editores e livreiros para os quais não encontrámos um website ou uma página social não foram incluídos, pois o foco desta lista são os websites. O nome para designar cada editora ou livreiro foi aquele por que é mais conhecido, em vez do nome do registo empresarial. Espera-se, futuramente, sensibilizar as pessoas que trabalham neste setor para a importância de terem um bom histórico do seu website e de ajudarem o Arquivo.pt a fazê-lo da forma mais completa possível. **Fontes de informação** Associação Portuguesa de Editores e Livreiros DGLAB - lista de editores Rede de Livrarias Independentes Portuguesas - RELI ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2022-09-10";"country";"Portugal";False;False;"2022-09-10T21:22:03.172000";"2022-09-12T11:02:24.334000";"arquivos-da-web,editoras,leitura,livreiros,preservacao-digital";False;2;"";"";"";"";"1.00";0;0;0;24 "6311ea74078190df2168ae62";"Websites do Afeganistão e a queda do regime em agosto de 2021. Recolha especial em colaboração internacional";"websites-do-afeganistao-e-a-queda-do-regime-em-agosto-de-2021-recolha-especial-em-colaboracao-internacional";"";"https://dados.gov.pt/pt/datasets/websites-do-afeganistao-e-a-queda-do-regime-em-agosto-de-2021-recolha-especial-em-colaboracao-internacional/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este documento contém 1812 endereços de sites do Afeganistão, do domínio .af e 547 notícias dos media. Os endereços, URLs ou ""seeds"" foram obtidos através de pesquisa automática, utilizando o Bing Search API e colocados imediatamente em gravação. **Contexto** No dia 15 de agosto de 2021 o palácio presidencial em Cabul foi tomado pelos Talibãs, consumando a queda do regime que vigorava há 20 anos, após os atentados do 11 de Setembro nos Estados Unidos. Na comunidade dos arquivistas da Web foi lançado o desafio de gravar os sites afegãos, face ao risco de estes virem a desaparecer com o novo regime. O Arquivo.pt reagiu rapidamente, lançando uma pesquisa automática focada em sites do domínio .af e outra em notícias dos media internacionais sobre os eventos em curso. No dia 17 de agosto os websites começaram a ser gravados. Em outubro de 2021, o Content Development Working Group do International Internet Preservation Coalitium (IIPC) (https://netpreserve.org/about-us/working-groups/content-development-working-group/) lançou uma lista colaborativa onde arquivistas da Web de vários países colocaram endereços de interesse sobre a situação do Afeganistão. O principal contributo do Arquivo.pt para a comunidade dos arquivistas da Web foi a demonstração da pesquisa automática que permite uma reação rápida na gravação de conteúdos Web em risco de se perderem. **Mais informação:** Os conteúdos recolhidos pelo Content Development Working Group do International Internet Preservation Coalitium estão disponíveis no serviço Archive-it, na coleção [Afghanistan Regime Change (2021) and the International Response](https://archive-it.org/collections/17622)";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2021-08-15";"2022-09-02";"country";"";False;False;"2022-09-02T12:35:16.549000";"2022-09-02T12:41:47.970000";"afeganistao,arquivo-da-web,preservacao-digital";False;1;"";"";"";"";"0.89";0;0;0;8 "6310859b078190b1467a231d";"Viagem de Circum-Navegação. Conteúdos Web para preservação no Arquivo.pt";"viagem-de-circum-navegacao-conteudos-web-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/viagem-de-circum-navegacao-conteudos-web-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A [Estrutura de Missão do V Centenário da Primeira Viagem de Circum-Navegação (EMCFM)](https://magalhaes500.pt/) foi [criada pelo Conselho de Ministros em 2017](https://arquivo.pt/wayback/20190907111108/https://www.portugal.gov.pt/pt/gc21/comunicacao/noticia?i=20170119-mm-fmagalhaes). Entre 2019 e 2022, a EMCFM desenvolveu um programa de comemorações promovendo colaborações com diversas entidades e serviços. O Arquivo.pt (FCT, I.P.) contribuiu com a gravação de conteúdos temáticos sobre Fernão de Magalhães e a demonstração do seu uso para a memória institucional através da exposição online [Viagem no tempo com o Arquivo.pt](https://arquivo.pt/magalhaes500/). Pretende-se aumentar os conteúdos relacionados com Fernão de Magalhães e a Viagem de Circum-navegação no acervo do Arquivo.pt de modo a servirem para a memória e para a investigação. ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2017-01-09";"2022-09-01";"country-group";"World";False;False;"2022-09-01T11:12:43.159000";"2023-03-30T18:09:00.583000";"arquivo-da-web,circum-navegacao,fernao-de-magalhaes,preservacao-digital";False;2;"";"";"";"";"1.00";0;0;0;26 "630fa344078190f0052839a0";"Websites referenciados nos relatórios de projetos financiados pela FCT. Recolha para preservação no Arquivo.pt";"websites-referenciados-nos-relatorios-de-projetos-financiados-pela-fct-recolha-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/websites-referenciados-nos-relatorios-de-projetos-financiados-pela-fct-recolha-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este documento contém os endereços dos conteúdos Web (URLs) referidos pelos investigadores nos relatórios dos projetos financiados pela Fundação para a Ciência e a Tecnologia, desde junho de 2020. Denominam-se ""seeds"" (sementes) estes endereços, pois são o ponto de partida para a gravação dos conteúdos dos Websites. As listas de endereços foram obtidas periodicamente a partir da base de dados da FCT. Os endereços obtidos apontam para recursos online tais como os websites dos projetos, unidades de I&D, notícias nos media, artigos em revistas científicas ou repositórios, base de dados, vídeos no Youtube ou páginas do Facebook. Em junho de 2020, o Arquivo.pt obteve 263 endereços relacionados com 100 projetos científicos a partir dos relatórios financiados pela FCT. Grande parte dos endereços (67%) não tinha qualquer versão anteriormente preservada no Arquivo.pt. Em julho de 2020, lançou-se uma recolha especial a partir deste conjunto de endereços que resultou em 6,9 GB de informação obtidos a partir da visita a 31 606 URLs. Em 2021 e em 2022 voltou-se a gravar os endereços obtidos a partir da base de dados da FCT procurando as melhores técnicas para o fazer com sucesso. Alguns conteúdos desapareceram da Web, outros são de difícil gravação e reprodução, como por exemplo, vídeos do Youtube, páginas do Facebook, sites Wix. Mais informação: Notícia no site informativo do Arquivo.pt [Arquivo.pt preserva websites de projectos científicos nacionais](https://sobre.arquivo.pt/pt/arquivo-pt-preserva-websites-de-projectos-cientificos-nacionais/) Exposição online [Memória Web da investigação científica](https://memoriafct.wordpress.com/) ";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2020-06-09";"2022-08-31";"country";"Portugal";False;False;"2022-08-31T19:07:00.266000";"2023-09-09T16:30:45.768000";"arquivo-da-web,ciencia,investigacao,preservacao-digital";False;2;"";"";"";"";"1.00";0;0;0;5 "630e26b6078190a36e7a85bb";"Eleições Presidenciais 2016. Recolha de conteúdos Web para preservação no Arquivo.pt";"eleicoes-presidenciais-2016-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt-1";"";"https://dados.gov.pt/pt/datasets/eleicoes-presidenciais-2016-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt-1/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Os conteúdos recolher foram obtidos a partir de lista colaborativa, um formulário aberto à participação dos cidadãos para sugestão páginas e websites. Resultou na sugestão de 285 endereços que serviram de ponto de partida (seeds). Os conteúdos foram recolhidos antes e após as eleições, entre 21 e 28 de janeiro de 2016.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2016-01-21";"2016-01-28";"country";"Portugal";False;False;"2022-08-30T16:03:18.717000";"2022-08-30T16:06:44.127000";"arquivos-da-web,eleicoes,politica,preservacao-digital";False;1;"";"";"";"";"1.00";0;0;0;4 "630ca2bf078190af9594f6ae";"Eleições Legislativas 2022. Recolha de conteúdos Web para preservação no Arquivo.pt";"eleicoes-legislativas-2022-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-legislativas-2022-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"No dia 30 de janeiro de 2022 realizaram-se em Portugal as Eleições Legislativas. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Começou-se por definir uma lista de termos de pesquisa (keywords). Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa. Os dados mais importantes para a recolha são os endereços (URLs), pois são o ponto de partida (seeds) para a gravação de conteúdos. A recolha foi realizada teve duas fases: - recolha pré-eleitoral (1) - recolha pós-eleitoral (2) Mais informação ""Os conteúdos gravados foram reunidos na coleção EAWP40 que tem como datas limite 2022-01-25 e 2022-02-10 e um volume de informação de 0.24 Terabytes (ver em https://arquivo.pt/collections). A disponibilização dos conteúdos acontece, habitualmente, passado um ano sobre a recolha do Arquivo.pt."" ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2022-01-25";"2022-02-10";"country";"Portugal";False;False;"2022-08-29T12:27:59.342000";"2022-08-29T12:31:23.800000";"arquivo-da-web,eleicoes,politica,preservacao-digital";False;3;"";"";"";"";"1.00";0;0;0;6 "630c9f6d07819095550a486f";"Eleições Autárquicas 2021. Recolha de conteúdos Web para preservação no Arquivo.pt";"eleicoes-autarquicas-2021-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-autarquicas-2021-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"No dia 26 de setembro de 2021 realizaram-se as Eleições Autárquicas em Portugal. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Começou-se por identificar endereços de conteúdos eleitorais para a recolha recorrendo a informação de diversas fontes: - site EyeData de onde obteve os nomes dos candidatos e o respetivo concelho (Social Data Lab) - página da Wikipédia dedicada às elelições - sites dos partidos políticos - site da Comissão Nacional de Eleições - lista colaborativa para sugestão de conteúdos eleitorais a preservar (formulário aberto à participação de todos os cidadãos) Utilizou-se diversos métodos: - identificação manual e sistemática de conteúdos - pesquisa automática sobre uma lista de termos de pesquisa utilizando o Bing Search API (motor de busca) A gravação de conteúdos aconteceu em três momentos: - recolha pre-eleitoral (1), primeiro ensaio, a fim de testar a pesquisa de páginas e as ferramentas de gravação - recolha pré-eleitoral (2) - recolha pós-eleitoral (3) Estes endereços (URLs) foram o ponto de partida para a gravação de conteúdos eleitorais para serem preservados pelo Arquivo.pt. Mais informação Os conteúdos, depois de gravados, foram agregados numa coleção dedicada às eleições autárquicas, a EAWP39 (ver em https://arquivo.pt/collections). A coleção especial EAWP tem como datas limite 2021-07-23 e 2021-10-07, recolheu 31,266,653 ficheiros, 118,440 URLs, tendo resultado em 2.7 Terabytes de informação. ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2021-07-23";"2021-10-07";"country";"Portugal";False;False;"2022-08-29T12:13:49.907000";"2022-08-29T12:22:59.309000";"arquivo-da-web,eleicoes,politica,preservacao-digital";False;5;"";"";"";"";"1.00";0;0;0;9 "630c9ac6078190701f88b2e1";"Eleições Presidenciais 2021. Recolha de conteúdos para preservação no Arquivo.pt";"eleicoes-presidenciais-2021-recolha-de-conteudos-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-presidenciais-2021-recolha-de-conteudos-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A 24 de janeiro de 2021 realizaram-se em Portugal as Eleições Presidenciais. O Arquivo.pt lançou uma recolha especial de conteúdos publicados na Web relacionados com este evento. A pesquisa e identificação de conteúdos foi feita de forma automática, utilizando o serviço Bing Search API. A partir de palavras-chave o motor de busca devolveu os resultados mais relevantes da sua lista. Os endereços (URLs) resultantes o ponto de partida para a gravação de conteúdos. A recolha teve duas fases: - pré-eleitoral (1) - pós-eleitoral (2) Mais informação Os conteúdos gravados correspondem à coleção EAWP37 que tem como datas limite 2021-01-18 e 2021-02-11 e um volume de 0.626 Terabytes (ver em https://arquivo.pt/collections). ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2021-01-18";"2021-02-11";"country";"Portugal";False;False;"2022-08-29T11:53:58.088000";"2022-08-29T12:00:10.551000";"arquivo-da-web,eleicoes,politica,preservacao-digital";False;3;"";"";"";"";"1.00";0;0;0;3 "630c9760078190550e41da2b";"Eleições Legislativas 2019. Recolha de conteúdos para preservação no Arquivo.pt";"eleicoes-legislativas-2019-recolha-de-conteudos-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-legislativas-2019-recolha-de-conteudos-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"No dia 6 de outubro de 2019 realizaram-se em Portugal as Eleições Legislativas. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Começou-se por definir uma lista de termos de pesquisa (keywords). Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa. A recolha foi realizada em duas fases: - recolha pré-eleitoral (1) - recolha pós-eleitoral (2) A gravação dos conteúdos em páginas de Facebook e Youtube foi feita com as ferramentas Brozzler e Browsertrix. A reprodução deste tipo de conteúdos apresenta dificuldades. Para estes conteúdos a gravação foi feita a título exploratório. Mais informação Os conteúdos gravados foram reunidos na coleção EAWP26. Tem como datas limite 2019-09-30 e 2019-10-31 e um volume de informação de 0.54 Terabytes (ver em https://arquivo.pt/collections). ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2019-09-30";"2019-10-31";"country";"Portugal";False;False;"2022-08-29T11:39:28.402000";"2022-08-29T11:49:23.812000";"arquivo-da-web,eleicoes,politica,preservacao-digital";False;3;"";"";"";"";"1.00";0;0;0;3 "630c91ad07819028088b6452";"Eleições Europeias 2019. Recolha de conteúdos Web para preservação no Arquivo.pt";"eleicoes-europeias-2019-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-europeias-2019-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"No dia 26 de maio de 2019 realizaram-se as Eleições Europeias em Portugal. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais e expandiu a recolha a todos os países da União Europeia por via da língua. Começou-se por definir uma lista de termos de pesquisa (keywords). Os termos de pesquisa foram traduzidos para 24 línguas oficiais. Utilizou-se o Bing Search API para realizar as pesquisas de forma automática. Como resultado, obteve-se uma lista com os primeiros resultados para cada termo de pesquisa. Além da identificação automática de conteúdos, lançou-se uma lista colaborativa para recolher sugestões nacionais e internacionais de conteúdos eleitorais. A recolha ou crawl teve várias etapas: - recolha pré-eleitoral (1) - 1º crawl - testou a identificação e recolha em outras línguas além do português - recolha pré-eleitoral (2) - 2º crawl - gerou termos nas 24 línguas oficiais da União Europeia - recolha pós-eleitoral (3) - 3º crawl - usou uma lista de termos com a tradução revista pel Publications Office da UE - recolha pós-eleitoral (4) - 4º crawl - uma recolha final pós-eleitoral que reune os resultados do Bing e os contributos da comunidade Mais informação: Os conteúdos gravados foram reunidos na coleção EAWP23 que tem como datas limite 2019-05-22 e 2019-07-17 e um volume de informação de 4.8 Terabytes (ver https://arquivo.pt/collections). Notícia no site informativo do Arquivo.pt: https://sobre.arquivo.pt/pt/colecao-sobre-as-eleicoes-europeias-2019/ Pesquisa no Arquivo.pt: https://arquivo.pt/ee2019 ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2019-05-22";"2019-07-17";"country";"European Union";False;False;"2022-08-29T11:15:09.978000";"2022-08-29T11:32:02.046000";"arquivo-da-web,eleicoes,europa,politica,preservacao-digital";False;5;"";"";"";"";"1.00";0;0;0;3 "630c89b6078190e886cd4d3a";"Eleições Autárquicas 2017. Recolha de conteúdos Web para preservação no Arquivo.pt";"eleicoes-autarquicas-2017-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-autarquicas-2017-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este conjunto refere-se às duas recolhas de conteúdos Web realizadas antes e depois das Eleições Autárquicas 2017, a 27 de setembro e a 10 de outubro de 2017, e contém: - URLs da lista colaborativa que recolheu sugestões dos cidadãos de conteúdos a preservar - URLs resultantes da pesquisa automática utilizando o Bing Search API, por concelho Adicionou-se em cada resultado respetivo link para o Arquivo.pt. As Eleições Autárquicas de 2017 realizaram-se no dia 1 de outubro e o Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Os conteúdos a gravar foram identificados a partir de duas fontes: - lista colaborativa - formulário aberto à participação dos cidadãos para sugestãos de conteúdos a preservar - pesquisa automática utilizando o Bing Search API A pesquisa automática combinou palavras-chave (keywords) tais como """"autárquicas"""" com o nome dos concelhos, a fim de obter os resultados apresentados pelo motor de busca como mais relevantes, em geral os 20 primeiros. Os URLs obtidos serviram de ponto de partida ou """"seeds"""" para a gravação dos conteúdos eleitorais. A recolha foi feita em dois momentos: - pré-eleitoral - 27 e 28 de setembro de 2017 - pós-eleitoral - 10 e 11 de outubro de 2017 Os URLs de redes sociais, tais como o Facebook e Youtube, podem não ter sido gravados, pois usam uma tecnologia diferente dos sítios Web. Mais informação: A recolha pré-eleitoral correponde à coleção especial EAWP16 com um volume de 0.13 Terabytes. A recolha pós-eleitoral correponde à coleção especial EAWP17 com um volume de 0.23 Terabytes. Ver em https://arquivo.pt/collections/ ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2017-09-27";"2017-10-11";"country";"Portugal";False;False;"2022-08-29T10:41:10.934000";"2022-08-29T10:47:28.497000";"arquivos-da-web,eleicoes,politica,preservacao-digital";False;1;"";"";"";"";"1.00";0;0;0;8 "630c81a6078190a768892bbf";"Eleições Legislativas 2015. Recolha de conteúdos Web para preservação no Arquivo.pt";"eleicoes-legislativas-2015-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/eleicoes-legislativas-2015-recolha-de-conteudos-web-para-preservacao-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este conjunto contém uma lista de 125 endereços (URLs) sobre a as Eleições Legislativas 2015. As Eleições Legislativas 2015 realizaram-se no dia 4 de outubro de 2015. O Arquivo.pt lançou uma recolha especial de conteúdos eleitorais. Os conteúdos a recolher foram obtidos a partir de uma lista colaborativa, através de um formulário aberto à participação dos cidadãos para sugestão páginas e websites relacionados com o evento eleitoral. A recolha realizou-se antes e após as eleições, entre setembro e dezembro de 2015. A recolha correponde à coleção especial EAWP7, que tem um volume de 0.27 Terabytes (ver https://arquivo.pt/collections/). Mais informação: Notícia no site informativo do Arquivo.pt: - https://arquivo.pt/wayback/20170224234941/http://sobre.arquivo.pt/news/recolhas-legislativas-2015 - https://sobre.arquivo.pt/wp-content/uploads/arquivo-das-eleicoes-2015.pdf ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2015-09-22";"2015-12-08";"country";"Portugal";False;False;"2022-08-29T10:06:46.956000";"2022-08-29T10:13:12.945000";"arquivos-da-web,eleicoes,politica,preservacao-digital";False;1;"";"";"";"";"1.00";0;0;0;4 "6203cf9d078190db35f3f061";"Dados relacionados com Criptomoedas (Maio 2022)";"dados-relacionados-com-criptomoedas-maio-2022";"Cripto";"https://dados.gov.pt/pt/datasets/dados-relacionados-com-criptomoedas-maio-2022/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"**[English version below]** 1)**Coingecko.com** Datasets contendo a listagem das moedas presentes no site Coingecko.com. Este dataset for gerado em Maio de 2022 através da [Coingecko API](https://www.coingecko.com/en/api) e contém as seguintes informações: ID (o ID da moeda dentro do ecossistema do coingecko.com) Name (Nome da moeda) Symbol (Símbolo da moeda) URLs_HomePage (Website(s) de cada moedas) Categories (Categorias em que a moeda se enquadra) Platforms (Plataformas em que a moeda se enquadra) Github (Link para o Github, caso exista) Twitter (Link para o Twitter, caso exista) Facebook (Link para o Facebook, caso exista) Reddit (Link para o Reddit, caso exista) Archived_URLs_Homepage (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Github (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Twitter (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Facebook (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Reddit (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) 2)**Coinmarketcap.com** Datasets contendo a listagem das moedas presentes no site Coinmarketcap.com. Este dataset foi gerado em Maio de 2022 através da [Coinmarketcap API](https://coinmarketcap.com/api) e contém as seguintes informações: ID (o ID da moeda dentro do ecossistema do coinmarketcap.com) Name (Nome da moeda) Symbol (Símbolo da moeda) Description (Descrição do projecto) Logo (Logo do projecto) Date_Added (Data quando o projecto foi adicionado) Date_Lauched (Data quando o projecto foi lançado) URLs_HomePage (Website(s) de cada moedas) Categories (Categorias em que a moeda se enquadra) Contract_Address (O ""Contract Adress"" do projecto dentro da Blockchain) Platforms (Plataformas em que a moeda se enquadra) Github (Link para o Github, caso exista) Twitter (Link para o Twitter, caso exista) Facebook (Link para o Facebook, caso exista) Reddit (Link para o Reddit, caso exista) Archived_URLs_Homepage (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Github (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Twitter (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Facebook (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Reddit (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) 3)**Opeansea.io** Dataset contendo a listagem dos activos presentes no site Opeansea.io. Este dataset foi gerado em Maio 2022 através da [Opeansea API](https://docs.opensea.io/reference/api-overview) e contém as seguintes informações: Name (Nome da coleção) Created_date (Data da criação) URLs_Homepage (Website(s) de cada coleção) Banner Image (Banner do URL) Description (Descrição da coleção) Discord (Link para o Discord, caso exista) Image (Link para o Image, caso exista) Telegram (Link para o Telegram, caso exista) Instagram (Link para o Instagram, caso exista) Archived_URLs_Homepage (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Discord (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Telegram (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Archived_Instagram (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) 4)**Donated Seeds** Dataset contendo a listagem webistes doados. Este dataset foi gerado em Fevereiro 2022 e contém as seguintes informações: URL (URL doado) Label (Nota relacionada com o conteúdo do URL, caso exista) Archived_URL (Link com a versão preservada pelo [Arquivo.pt](https://arquivo.pt/)) Estas listagens requerem revisão, pois os sites mudam mais depressa do que as instituições que os publicam. O dataset foi descarregado em Maio de 2022. Pode aceder a versão [Google Sheet](https://docs.google.com/spreadsheets/d/1r3rS3KwpalJI1qjftUQweEAwo_ZFGTDQlnCK5dgxbkA/edit?usp=sharing) **[English simplified version]** 1)**Coingecko.com** Datasets containing the listing of coins present on the coingecko.com website. This dataset was generated in May 2022 via Coingecko API (https://www.coingecko.com/en/api) 2)**Coinmarketcap.com** Datasets containing the listing of coins present on the coinmarketcap.com website. This dataset was generated in May 2022 via Coinmarketcap API (https://coinmarketcap.com/api). 3)**Opeansea.io** Dataset containing a listing of the assets present on the Opeansea.io website. This dataset was generated in May 2022 via the Opeansea API (https://docs.opensea.io/reference/api-overview). 4)**Donated Seeds** Dataset containing the listing of donated webistes. This dataset was generated in May 2022. These listings require revision. You can acesss [Google Sheet](https://docs.google.com/spreadsheets/d/1r3rS3KwpalJI1qjftUQweEAwo_ZFGTDQlnCK5dgxbkA/edit?usp=sharing) ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"country-group";"";False;False;"2022-02-09T14:28:45.540000";"2022-05-18T16:43:34.293000";"arquivo-da-web,arquivo-pt,bitcoin,blockchain,btc,coingecko,coinmarketcap,criptomoeda,crypto,cryptocurrencies,cryptocurrency,eth,inovacao,investigacao,nft,opeansea,preservacao-digital";False;1;"";"";"";"";"0.89";0;0;0;36 "6202b17307819098c8a3f83e";"Lista de domínios do jornal Público no Arquivo.pt (1996-2019)";"lista-de-dominios-do-jornal-publico-no-arquivo-pt-1996-2019";"";"https://dados.gov.pt/pt/datasets/lista-de-dominios-do-jornal-publico-no-arquivo-pt-1996-2019/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este ficheiro contém a lista de domínios e subdomínios utilizados no site do jornal Público, entre 1996 e 2019. Para cada domínio ou subdomínio apresenta o intervalo temporal em que foi utilizado, o número de versões que se encontram no Arquivo.pt e o estado (ativo ou inativo) na Web atual. Os dados foram obtidos em 2019, a partir das páginas Web preservadas pelo Arquivo.pt. Os conteúdos preservados pelo Arquivo.pt encontram-se acessíveis para o estudo e a investigação sobre o jornal, a recuperação da memória institucional ou a simples curiosidade pelo passado.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2019-12-31";"other";"Portugal";False;False;"2022-02-08T18:07:47.533000";"2022-02-08T18:09:25.420000";"imprensa,jornais-online-portugueses";False;1;"";"";"";"";"1.00";0;0;0;73 "62024883078190eee8a920ce";"Galerias e artistas: preservação de conteúdos no Arquivo.pt";"galerias-e-artistas-preservacao-de-conteudos-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/galerias-e-artistas-preservacao-de-conteudos-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Neste conjunto encontra os seguintes conteúdos: - lista de endereços de Websites de galerias e artistas Arquivo.pt - recolha de Websites, realizada entre 29 de abril e 4 de maio de 2021 - lista de blogs Blogspot de galerias e artistas para preservação no Arquivo.pt - recolha iniciada em maio de 2021 - lista de endereços de posts de galerias e artistas no Blogspot para preservação no Arquivo.pt - realizada no dia 5 de dezembro de 2021 - lista de endereços de posts de galerias e artistas no Twitter para preservação no Arquivo.pt - realizada no dia 5 de dezembro de 2021 - lista de outros canais de artistas: Facebook, Instragram, Linkedin, Pinterest, Tumblr, vídeos no Youtube ou Vimeo Os dados disponíveis neste documento resultam do projeto PARA SEMPRE. PARA SEMPRE é um projeto de curadoria digital aplicada à informação disponibilizada na web pelos diversos agentes da cena artística portuguesa contemporânea (artistas, galerias e locais híbridos). Este tem como finalidade principal contribuir para a preservação/reutilização das páginas do passado e do futuro, assegurar a preservação da memória digital da arte portuguesa actual disponível no Arquivo.pt e promover o conhecimento sobre esta temática, apresentando-a de forma sistematizada e estruturada. A sua criação resulta do encontro de missões de duas organizações: uma que pretende assegurar a preservação da web portuguesa, o [Arquivo.pt](http://sobre.arquivo.pt), e outra que se assume como um agente no desenvolvimento do conhecimento e do saber sobre a arte portuguesa contemporânea, a [Biblioteca de Arte da Fundação Calouste Gulbenkian](https://gulbenkian.pt/biblioteca-arte/). O projeto foi desenvolvido no âmbito da plataforma [ROSSIO - Infraestrutura de Investigação na área das Ciências Sociais, Artes e Humanidades](https://rossio.fcsh.unl.pt/). Referências: https://youtu.be/mFgYc1RkWW8 https://sobre.arquivo.pt/pt/memoria-de-festivais-e-eventos-de-arte-para-sempre/";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-12-31";"2021-12-31";"other";"Portugal";False;False;"2022-02-08T10:40:03.653000";"2022-02-08T13:14:27.747000";"art-galleries,arte,artistas,curadoria-digital,preservacao-digital,websites";False;1;"";"";"";"";"1.00";0;0;0;29 "618bdafa0781901701f544b5";"Cordis-h2020organizationsComplementedByArquivoPT.xlsx";"cordis-h2020organizationscomplementedbyarquivopt-xlsx";"";"https://dados.gov.pt/pt/datasets/cordis-h2020organizationscomplementedbyarquivopt-xlsx/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Dataset contendo a listagem das organizações dos projetos financiados pelo programa H2020 (Horizon 2020 - European Commission). Este dataset foi feito em colcaboração com [European Comission](https://cordis.europa.eu/) e contem as seguintes informações: - projectRcn - projectID (ID do projecto) - projectAcronym (Acrónimo do projecto) - role (Função da organização) - id (ID da organização) - name (Nome da organização) - shortName (Nome curto da organização) - activityType (Tipo de Actividade) - endOfParticipation - ecContribution - country (País) - street (Rua) - city (Cidade) - postCode (Código-Postal) - organizationUrl (URL da organização) - vatNumber - contactForm, contactType, contactTitle, contactFirstNames, contactLastNames, contactFunction, contactTelephoneNumber, contactFaxNumber (Contactos se existir) - archivedOrganizationUrl (Link com a versão preservada pelo Arquivo.pt) Esta listagem requer revisão, pois os sites mudam mais depressa do que as instituições que os publicam. O dataset foi descarregado em Dezembro de 2020.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-11-10T14:45:14.983000";"2021-11-10T14:45:54.199000";"arquivo-da-web,europa,h2020,inovacao,investigacao,investigadores,preservacao-digital,projectos-de-investigacao,projetos";False;1;"";"";"";"";"0.78";0;0;0;8 "618bd43b078190f82dad8c00";"Cordis-h2020reportsComplementedByArquivoPT.xlsx";"cordis-h2020reportscomplementedbyarquivopt-xlsx";"";"https://dados.gov.pt/pt/datasets/cordis-h2020reportscomplementedbyarquivopt-xlsx/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Dataset contendo a listagem dos relatórios dos projetos financiados pelo programa H2020 (Horizon 2020 - European Commission). Este dataset foi feito em colcaboração com European Comission e contem as seguintes informações: - rcn - language (Idioma do relatório) - title (Título do relatório) - teaser (Teaser do relatório) - summary (Resumo do relaório) - workPerformed (Descrição do trabalho feito) - finalResults (Resultado Final) - lastUpdateDate (Data da última alteração) - country (País) - projectID (ID do projecto) - projectAcronym (Acrónimo do projecto) - programme (Programa dentro do H2020) - topics (Tópicos do relatório) - relatedFile (Ficheiro relacionado) - url (URL da entrega) - archivedUrl (Link com a versão preservada pelo Arquivo.pt) Esta listagem requer revisão, pois os sites mudam mais depressa do que as instituições que os publicam. O dataset foi descarregado em Dezembro de 2020.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-11-10T14:16:27.157000";"2021-11-10T14:16:41.645000";"arquivo-da-web,europa,h2020,inovacao,investigacao,investigadores,preservacao-digital,projectos-de-investigacao,projetos";False;1;"";"";"";"";"0.78";0;0;0;2 "618bb2ca0781906f6a878dbe";"Cordis-h2020projectsComplementedByArquivoPT.xlsx";"cordis-h2020projectscomplementedbyarquivopt-xlsx";"";"https://dados.gov.pt/pt/datasets/cordis-h2020projectscomplementedbyarquivopt-xlsx/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Dataset contendo a listagem dos projetos investigação financiados pelo programa H2020 (Horizon 2020 - European Commission). Este dataset foi feito em colaboração com [European Comission](https://cordis.europa.eu/). Dos 31 129 projetos listados, 16 743 apresentam um URL para um site ou uma página de projeto, dos quais 379 são repetidos. Assim, existem 16 364 URLs únicos para recolher o que é cerca de 53.79% dos projectos agregados ao H2020. De forma a preservar o conteúdo deste projeto, foi executada uma abordagem semelhante à descrita no paper por “D.Bicho, D. Gomes (2016) - Preserving Websites Of Research & Development Projects”, em que foi executado a heurística: “+Acronym +Title -Cordis -EC +Common-Terms” (i.e., foram feitas queries ao bing search api com o acrónimo do projecto, o titulo retiramos dos restulados os sites _cordis.europa.eu_, _ec.europa.eu_ e adicionamos um termo adicional). Por exemplo, MARmaED MARine MAnagement and Ecosystem Dynamics under climate change project -site:cordis.europa.eu -site:ec.europa.eu. Contem as seguintes informações: rcn, id, acronym, status, programme, topics, frameworkProgramme, title, startDate, endDate, projectUrl, objective, totalCost, ecMaxContribution, call, fundingScheme, coordinator, coordinatorCountry, participants, participantCountries, subjects, URLsBingSearch, ArchivedProjectURLs. Adicionalmente ao dataset disponibilizado [European Comission](https://cordis.europa.eu/) foi adicionado a coluna _URLsBingSearch_ que contem os top 10 resultados para as queries sobre o bing search api, apenas quando não existe um URL para o projecto de investigação e a coluna _ArchivedProjectURLs_ com o link para a versão persevado no Arquivo.pt. Esta listagem requer revisão, pois os sites mudam mais depressa do que as instituições que os publicam. O dataset foi descarregado em Dezembro de 2020.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-11-10T11:53:46.641000";"2021-11-10T11:55:20.346000";"arquivo-da-web,europa,h2020,inovacao,inovacao-e-conhecimento,investigacao,investigadores,preservacao-digital,projectos-de-investigacao,projetos";False;1;"";"";"";"";"0.78";0;0;0;8 "618baba80781905154b20d55";"Cordis-h2020projectDeliverablesComplementedByArquivoPT.xlsx";"cordis-h2020projectdeliverablescomplementedbyarquivopt-xlsx";"";"https://dados.gov.pt/pt/datasets/cordis-h2020projectdeliverablescomplementedbyarquivopt-xlsx/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Dataset contendo a listagem das entregas dos projetos financiados pelo programa H2020 (Horizon 2020 - European Commission). Este dataset foi feito em colcaboração com [European Comission](https://cordis.europa.eu/) e contem as seguintes informações: - rcn - title (Título da entrega) - projectID (ID do projecto) - projectAcronym (Acrónimo do projecto) - programme (Programa dentro do H2020) - description (Descrição da entrega) - deliverableType (Tipo de documento\recurso) - url (URL da entrega) - lastUpdateDate (Data da última alteração) - archivedUrl (Link com a versão preservada pelo Arquivo.pt) Esta listagem requer revisão, pois os sites mudam mais depressa do que as instituições que os publicam. O dataset foi descarregado em Dezembro de 2020.";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-11-10T11:23:20.690000";"2021-11-10T11:28:39.461000";"arquivo-da-web,europa,h2020,inovacao,investigacao,investigadores,preservacao-digital,projectos-de-investigacao,projetos";False;1;"";"";"";"";"0.78";0;0;0;5 "614250100781903bfc612d67";"Partidos políticos em Portugal: websites e histórico no Arquivo.pt";"partidos-politicos-em-portugal-websites-e-historico-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/partidos-politicos-em-portugal-websites-e-historico-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A listagem de ""Partidos políticos em Portugal: websites e histórico no Arquivo.pt"" tem por objetivo identificar os websites dos partidos, no caso de estes terem um Website, e verificar se estão incluídos nas recolhas periódicas realizadas pelo Arquivo.pt Quanto aos partidos extintos, que estiveram em atividade principalmente até ao ano 2000, não chegaram a ter um Website. No entanto, podemos encontrar referências aos mesmos publicadas na Web. Por isso, na lista de partidos extintos fornece-se uma ligação para pesquisar no Arquivo.pt por conteúdos relacionados. Identificou-se também o endereço para páginas nas redes sociais dos partidos, limitando-nos às principais, nomeadamente Facebook, Twitter, Instagram e Youtube. Julgou-se útil juntar esta informação, quanto mais não seja para evidenciar a importância que as organizações políticas dão a estes canais. As redes sociais são de difícil gravação e reprodução e, por essa razão, não estão no âmbito das recolhas habituais do Arquivo.pt. Ocasionalmente poderá recolher alguns conteúdos utilizando tecnologias adequadas. Esta lista foi feita a partir dos dados disponibilizados no website da Comissão Nacional de Eleições, em setembro de 2021 (https://www.cne.pt/content/partidos-politicos-1).";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-09-15";"country";"Portugal";False;False;"2021-09-15T20:57:04.432000";"2022-02-10T13:39:09.364000";"arquivo-da-web,curadoria-digital,partidos-politicos,presenca-online,preservacao-digital,websites";False;1;"";"";"";"";"1.00";0;0;0;327 "612e1792078190d8de20af69";"Websites dos projetos de Investigação & Desenvolvimento financiados pela Comissão Europeia: FP4, FP5, FP6, FP7";"websites-dos-projetos-de-investigacao-desenvolvimento-financiados-pela-comissao-europeia-fp4-fp5-fp6-fp7";"";"https://dados.gov.pt/pt/datasets/websites-dos-projetos-de-investigacao-desenvolvimento-financiados-pela-comissao-europeia-fp4-fp5-fp6-fp7/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Este conjunto de dados contém as listas de Websites de projetos de investigação dos Progamas-Quadro 4º, 5º 6º e 7º ou Framework Programms FP4, FP5, FP6, FP7, financiados pela Comissão Europeia. Em 2016, constatou-se que a informação online relativa a projetos de I&D não estava a ser exaustivamente documentada. Por exemplo, a informação referente aos endereços dos websites dos projetos financiados no programa 7º Programa-Quadro (FP7) disponibilizada através do Portal de Dados Abertos da União Europeia (EU Open Data Portal) estava omissa para 92% dos projetos. O Arquivo.pt desenvolveu uma metodologia para identificar automaticamente endereços Web em falta relativos a esses projetos de investigação e, em seguida, recolheu e disponbilizou os seus conteúdos. O Software e conjuntos de dados experimentais para identificar automaticamente sites de I&D está acessível em https://github.com/arquivo/Research-Websites-Preservation Para saber mais detalhes sobre a metodologia utilizada e os resultados obtidos, ver: https://sobre.arquivo.pt/pt/arquivo-pt-preservou-sites-sobre-projetos-de-investigacao-desenvolvimento-financiados-pela-comissao-europeia/";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2004-01-01";"2013-12-31";"country-group";"European Union";False;False;"2021-08-31T12:50:42.675000";"2021-08-31T13:42:51.018000";"arquivo-da-web,ciencia-aberta,comunidade-europeia,preservacao-digital,programas-quadro";False;4;"";"";"";"";"1.00";0;0;0;29 "6128d94c0781908b45938d8e";"Páginas do Governo de Portugal nas redes sociais e histórico de versões no Arquivo.pt";"paginas-do-governo-de-portugal-nas-redes-sociais-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/paginas-do-governo-de-portugal-nas-redes-sociais-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Em 2019, fez-se uma identificação manual das páginas Twitter do Governo de Portugal. Limitou-se a lista às entidades principais de que resultaram 20 endereços. Foi feita uma gravação dos conteúdos expostos na Web pelo Twitter, gravando-os de fora para dentro, sem fazer login. Não se seguem as ligações de cada publicação no Twitter nem se reproduzem conteúdos vídeo. As redes sociais não são o foco das recolhas do Arquivo.pt. No entanto, tratando-se de conteúdos públicos, considera-se importante guardar deles algum registo para o futuro. A lista requer atualização, pois os endereços mudam ao longo do tempo. Considera-se a possibilidade de alargar a lista a outras entidades e a outras redes sociais.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2019-01-01";"2021-08-27";"country";"Portugal";False;False;"2021-08-27T13:23:40.462000";"2021-08-30T18:26:51.753000";"curadoria-digital,governo-de-portugal,preservacao-digital,redes-sociais";False;1;"";"";"";"";"0.89";0;0;0;9 "6127d6c3078190da9f82d3db";"Websites do Governo Regional dos Açores e histórico de versões no Arquivo.pt";"websites-do-governo-regional-dos-acores-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/websites-do-governo-regional-dos-acores-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A listagem dos websites do Governo Regional dos Açores tem por objetivo melhorar as recolhas do Arquivo.pt dos conteúdos publicados. O Arquivo.pt, serviço público de preservação da Web operado pela Fundação para a Ciência e a Tecnologia, I.P, realiza recolhas periódicas (trimestrais) para memória histórica e uso na investigação. Quanto mais específicos forem os endereços dos websites mais fácil será recolhê-los. Por exemplo, o portal azores.gov.pt contém outros subsites e conjuntos de páginas dedicadas a diferentes entidades. Estas secções e subdivisões por vezes escapam à recolha feita pelo Arquivo.pt, a qual é limitada a uma ""profundidade"" menor do que a que seria necessário para percorrer todo o portal. Para cada endereço da lista criou-se uma ligação para ver se há um histórico no Arquivo.pt. Em alguns casos pode verificar-se que não há. Identificar todos os endereços é uma forma de assegurar que o Arquivo.pt vai passar por todos os websites para tentar gravar os seus conteúdos. A presente lista foi iniciada em 2019, na sequência das Jornadas FCCN realizadas na Universidade dos Açores, onde se sensibilizou para a questão da preservação. Foi depois objeto de uma revisão em agosto de 2021. A lista requer revisão de modo a incluir todos os endereços de websites relativos ao Governo dos Açores, mesmo com outros domínios além do azores.gov.pt.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-08-26";"country";"Portugal";False;False;"2021-08-26T19:00:35.100000";"2024-02-20T18:12:42.662000";"arquivo-da-web,curadoria-digital,governo-dos-acores,governo-eletronico,modernizacao-administrativa,preservacao-digital,servicos-publicos,websites";False;1;"";"";"";"";"1.00";0;0;0;35 "61268e37078190fdc90b7d45";"Websites do Governo da Regional Madeira e histórico no Arquivo.pt";"websites-do-governo-da-regional-madeira-e-historico-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/websites-do-governo-da-regional-madeira-e-historico-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A listagem dos sites do Governo Regional da Madeira tem por objetivo melhorar as recolhas do Arquivo.pt dos conteúdos publicados. O Arquivo.pt, serviço público de preservação da Web operado pela Fundação para a Ciência e a Tecnologia, I.P, realiza recolhas periódicas (trimestrais) para memória histórica e uso na investigação. Quanto mais específicos forem os endereços dos websites mais fácil é recolhê-los. Por exemplo, o site madeira.gov.pt contém outros subsites. Estes por vezes escapam às recolhas do Arquivo.pt, a qual é limitada a uma ""profundidade"" menor do que a que seria necessário para percorrer todo o portal do Governo Regional. Identificar todos os endereços é uma forma de assegurar que o Arquivo.pt chega também aos sites mais pequenos. A presente lista foi feita em 2019 e ainda está incompleta. Requer revisão e ampliação a todos os endereços de interesse público.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-08-25";"country";"Madeira";False;False;"2021-08-25T19:38:47.964000";"2021-09-02T15:44:50.620000";"arquivo-da-web,curadoria-digital,governo-regional-da-madeira,patrimonio-digital,preservacao-digital,websites";False;1;"";"";"";"";"0.89";0;0;0;15 "61265d0d07819019d41b0b8d";"Websites da Administração Pública no portal eportugal.gov.pt";"websites-da-administracao-publica-no-portal-eportugal-gov-pt";"";"https://dados.gov.pt/pt/datasets/websites-da-administracao-publica-no-portal-eportugal-gov-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"O portal eportugal.gov.pt apresenta aos cidadãos informação sobre os serviços públicos disponíveis e seus respetivos websites e aplicações. O Arquivo.pt extraiu a informação relativa aos websites e aplicações do portal para poder incluir os seus endereços nas listas de recolhas periódicas sempre que o não estejam. Para cada endereço na Web criou-se uma ligação para o respetivo histórico no Arquivo.pt. Os conteúdos gravados têm as limitações próprias dos arquivos da Web, os quais gravam os conteúdos públicos e em formato normalizado, ficando por recolher conteúdos que existem serviços mais complexos, como por exemplo os de informação geográfica, streaming, Apps etc. Pode acontecer que algumas páginas ainda não estejam no Arquivo.pt pois é habitual guardar 1 ano de embargo. A presente listagem foi feita em 17 de março de 2021 e requer atualização para incluir novas entradas no portal eportugal.gov.pt. As listas de websites acompanhadas com o seu histórico no Arquivo.pt são úteis para estudar o uso que as instituições públicas fazem da Web e, em geral, para a memória institucional.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-08-25";"country";"Portugal";False;False;"2021-08-25T16:09:01.450000";"2021-08-26T19:14:11.314000";"administracao-publica,curadoria-digital,modernizacao-administrativa,preservacao-digital,servicos-publicos,web-archive,websites";False;1;"";"";"";"";"0.89";0;0;0;170 "6123f1280781900eee3cf0d6";"Freguesias de Portugal: websites e histórico de versões no Arquivo.pt - Agosto 2021";"freguesias-de-portugal-websites-e-historico-de-versoes-no-arquivo-pt-agosto-2021";"";"https://dados.gov.pt/pt/datasets/freguesias-de-portugal-websites-e-historico-de-versoes-no-arquivo-pt-agosto-2021/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A listagem das Freguesias de Portugal: websites e histórico de versões no Arquivo.pt tem por objetivo identificar os websites oficiais das Juntas de Freguesia e verificar se estão a ser preservados no Arquivo.pt. Este ficheiro contém os nomes das freguesias por distrito e concelho, os endereços dos websites oficiais das juntas, a página do site municipal dedicada à freguesia, a página da freguesia no Facebook (declarada como ""oficial"" umas vezes, outras de caráter não oficial) e notas com referência a endereços relacionados. A lista utilizada para este trabalho incluia 1196 endereços de sites das juntas de freguesia. Fez-se uma atualização da lista e a lista ficou mais completa, à data de agosto de 2021. 1896 freguesias apresentam site e 85 apresentam sites inativos ou sem acesso. Na lista ficaram ainda os endereços inativos pois, embora não estejam online, têm um histórico no Arquivo.pt. No caso de um determinado endereço não ter um histórico por não estar a ser gravado, adiconou-se esse endereço à lista de recolhas para que de futuro possa estar. Indicar o endereço dos websites institucionais nas bases de dados é uma boa prática que deve ser incentivada. Identificou-se a página do site do município dedicada a cada freguesia. Há freguesias que não têm site nem usam redes sociais, sendo o site do município a informação institucional disponível. A informação sobre as freguesias nos sites dos municípios depende muito da estratégia de comunicação. Uns apresentam contactos, informação histórica, etc, e outros apenas uma referência. Foram identificadas 1885 páginas de Facebook das freguesias. Nem todas se poderão dizer ""oficiais"". Algumas são informais mas apresentam informação da freguesia. Em muitos casos as juntas não têm site mas utilizam uma página do Facebook. As páginas do Facebook estão foram do âmbito das recolhas habituais do Arquivo.pt. São de difícil gravação e reprodução pelos arquivos da Web e provavelmente não se encontram no Arquivo.pt. Adicionámos os seus endereços a esta lista, porque pode ser útil para comparar o que é publicado em acesso aberto na Web com o que é publicado em plataformas fechadas como o Facebook.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-08-23";"pt:freguesia";"Portugal";False;False;"2021-08-23T20:04:08.183000";"2022-02-10T16:51:21.075000";"administracao-local,arquivo-da-web,autarquias,curadoria-digital,freguesias,preservacao-digital,websites";False;1;"";"";"";"";"0.89";0;0;0;1284 "6123eca1078190f85a660ea9";"Agrupamentos de Escolas ou Escolas não Agrupadas: websites e histórico de versões no Arquivo.pt - Agosto 2021";"agrupamentos-de-escolas-ou-escolas-nao-agrupadas-websites-e-historico-de-versoes-no-arquivo-pt-agosto-2021";"";"https://dados.gov.pt/pt/datasets/agrupamentos-de-escolas-ou-escolas-nao-agrupadas-websites-e-historico-de-versoes-no-arquivo-pt-agosto-2021/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"A listagem de Agrupamentos de Escolas / Escolas não Agrupadas: websites e histórico de versões no Arquivo.pt - Agosto 2021 tem por objetivo identificar os websites oficiais das escolas em Portugal e verificar se estão no Arquivo.pt. Foi utilizada como referência a listagem publicada em 2018 pela Direção Geral da Administração Escolar (DGAE) que tem 811 registos (https://www.dgae.mec.pt/download/recrutamento/outros/201819/201870423_rec_out_CodigosAEENA.pdf). Em agosto de 2021, verificou-se se os sites estavam online na Web e se havia algum conteúdo preservado no Arquivo.pt, indicando para isso os respetivos links. No caso de um determinado endereço não ter um histórico por não estar a ser gravado, adiconou-se esse endereço à lista de recolhas para que de futuro possa estar. Esta listagem requer revisão, pois os sites mudam mais depressa do que as instituições que os publicam. Outras listagens segundo o tipo de ensino: - Escolas de ensino artístico - Escolas de ensino profissional ";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-08-23";"pt:concelho";"Portugal";False;False;"2021-08-23T19:44:49.807000";"2022-02-10T18:17:40.166000";"curadoria-digital,educacao,ensino,escolas,ministerio-da-educacao,preservacao-digital,websites";False;3;"";"";"";"";"0.89";0;0;0;255 "610581fe07819098a3e2edea";"Festivais de música em Portugal: websites e histórico de versões no Arquivo.pt";"festivais-de-musica-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/festivais-de-musica-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista de websites dos festivais de música ou de páginas relativas à sua divulgação online. Identificou-se os websites dos festivais de música e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de servir para aferir a preservação dos websites relativos ao domínio das artes e do espetáculo, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-31";"country";"";False;False;"2021-07-31T18:01:50.842000";"2022-02-10T18:52:52.328000";"arquivo-da-web,cultura,curadoria-digital,espetaculos,festivais,musica,preservacao-digital,websites";False;1;"";"";"";"";"0.89";0;0;0;113 "61057fe60781908e041c79df";"Televisão em Portugal: websites e histórico de versões no Arquivo.pt";"televisao-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/televisao-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista de websites dos canais de televisão em Portugal ou de páginas relativas à transmissão através da Internet. Identificou-se os websites dos canais de televisão e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de servir para aferir a preservação dos websites dos média portugueses, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-31";"country";"";False;False;"2021-07-31T17:52:54.384000";"2022-02-10T16:54:02.673000";"arquivo-da-web,curadoria-digital,media,presenca-online,preservacao-digital,televisao,websites";False;1;"";"";"";"";"0.89";0;0;0;12 "61057e2a078190853a2b8dfb";"Rádios em Portugal: websites e histórico de versões no Arquivo.pt";"radios-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/radios-em-portugal-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista de websites das rádios em Portugal ou de páginas relativas à transmissão através da Internet. Identificou-se os websites das rádios e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de servir para aferir a preservação dos websites das rádios, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-31";"country";"Portugal";False;False;"2021-07-31T17:45:30.397000";"2022-02-09T13:38:40.341000";"arquivo-da-web,curadoria-digital,internet,media,presenca-online,preservacao-digital,radio,sitios-web,websites";False;1;"";"";"";"";"0.89";0;0;0;17 "61057c0f0781907aa36141cb";"Publicações periódicas portuguesas (jornais e revistas): websites e histórico de versões no Arquivo.pt";"publicacoes-periodicas-portuguesas-jornais-e-revistas-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/publicacoes-periodicas-portuguesas-jornais-e-revistas-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista de websites de publicações periódicas portuguesas ou de páginas relativas à sua difusão. Identificou-se os websites das publicações com registo na Entidade Reguladora da Comunicação (ERC) e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de servir para aferir a preservação dos websites da imprensa portuguesa, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado.";"unknown";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-31";"country";"Portugal";False;False;"2021-07-31T17:36:31.869000";"2023-01-12T10:17:32.516000";"arquivo-da-web,curadoria-digital,imprensa,jornais,presenca-online,preservacao-digital,publicacoes-periodicas,publicacoes-portuguesas,revistas,websites";False;1;"";"";"";"";"0.78";0;0;0;789 "6105765c0781905dedf707d3";"Municípios portugueses: websites e histórico de versões no Arquivo.pt";"municipios-portugueses-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/municipios-portugueses-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista de websites dos 308 municípios portugeses e adicionalmente as páginas oficiais do Facebook utilizadas por cada município. Identificou-se os websites destas instituições e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de servir para aferir a preservação de conteúdos de interesse público, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-31";"country";"";False;False;"2021-07-31T17:12:12.850000";"2022-02-10T17:45:48.047000";"arquivo-da-web,camaras-municipais,curadoria-digital,municipios,preservacao-digital,sitios-web,websites";False;2;"";"";"";"";"0.89";0;0;0;26 "6104507e078190ba316eee90";"Unidades de Investigação e Desenvolvimento FCT 2019: websites e histórico de versões no Arquivo.pt";"unidades-de-investigacao-e-desenvolvimento-fct-2019-websites-e-historico-de-versoes-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/unidades-de-investigacao-e-desenvolvimento-fct-2019-websites-e-historico-de-versoes-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista dos websites das Unidades de Investigação e Desenvolvimento com financiamento da FCT (dados de 2019). Identificou-se os websites das unidades e dos centros de investigação e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de uma ferramenta para aferir a preservação de conteúdos de interesse público, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado.";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-30";"country";"Portugal";False;False;"2021-07-30T20:18:22.679000";"2021-07-30T20:19:50.911000";"arquivo-da-web,centros-de-investigacao,ciencia-aberta,curadoria-digital,preservacao-digital,websites";False;1;"";"";"";"";"0.89";0;0;0;7 "61044516078190824c49105a";"Universidades e de Institutos Politécnicos: websites e histórico no Arquivo.pt";"universidades-e-de-institutos-politecnicos-websites-e-historico-no-arquivo-pt";"";"https://dados.gov.pt/pt/datasets/universidades-e-de-institutos-politecnicos-websites-e-historico-no-arquivo-pt/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Lista de websites das Universidades e dos Institutos Politécnicos dos setores público e privado. Identificou-se os websites destas instituições e verificou-se se já existe um histórico de versões no Arquivo.pt fornecendo para isso uma ligação. Além de uma ferramenta para aferir a preservação de conteúdos de interesse público, a lista é útil para qualquer pessoa que queira fazer um estudo recorrendo aos websites atuais ou do passado. ";"annual";"Creative Commons Attribution 4.0 - CC BY 4.0";"1996-01-01";"2021-07-30";"country";"Portugal";False;False;"2021-07-30T19:29:42.397000";"2021-07-30T20:08:29.540000";"curadoria-digital,ensino-superior,politecnico,preservacao-digital,sitios-web,universidades,web-archive";False;1;"";"";"";"";"0.89";0;0;0;39 "60ffdaf7078190fe3e0dd6bc";"Websites dos projetos de Investigação & Desenvolvimento financiados pela Comissão Europeia: H2020";"websites-dos-projetos-de-investigacao-desenvolvimento-financiados-pela-comissao-europeia-h2020";"";"https://dados.gov.pt/pt/datasets/websites-dos-projetos-de-investigacao-desenvolvimento-financiados-pela-comissao-europeia-h2020/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"O Programa-Quadro de Pesquisa e Inovação Horizonte 2020 (H2020), implementado pela Comissão Europeia a partir de 2014, financiou milhares de projetos (31 116 projetos, dados de dezembro de 2020). Destes, apenas 16 744 (46 %) mencionaram um Website relacionado com o projeto. O Arquivo.pt utilizou a informação disponibilizada no portal CORDIS (https://cordis.europa.eu/projects) para identificar, recolher e disponibilizar para fins de investigação os Websites e outros conteúdos relativos aos projetos. Além disso, o Arquivo.pt prosseguiu com a identificação de Websites relativos aos projetos que não mencionaram endereços Web. As atividades, os resultados e outras publicações relativas a projetos encontram-se publicadas na Web, mesmo que os seus autores não as refiram. Através de uma metodologia automática, aplicada em 2016 aos Programas-Quadro, foram identificados novos conteúdos Web do H2020 e recolhidos no primeiro trimestre de 2021. ";"punctual";"Creative Commons Attribution 4.0 - CC BY 4.0";"2014-01-01";"2021-08-31";"country-group";"European Union";False;False;"2021-07-27T11:07:51.442000";"2023-04-13T14:56:35.254000";"h2020,inovacao,investigacao,investigadores,projectos-de-investigacao,projetos";False;2;"";"";"";"";"1.00";0;0;0;267 "60ffda95078190fc34cff72a";"API de Pesquisa de Imagens v1.1 (beta)";"api-de-pesquisa-de-imagens-v1-1-beta";"";"https://dados.gov.pt/pt/datasets/api-de-pesquisa-de-imagens-v1-1-beta/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"The ImageSearch API allows keyword to image search and access to preserved web content and related metadata. API returns a JSON object. EndPoint: [https://arquivo.pt/imagesearch](https://arquivo.pt/imagesearch) Full documentation: [https://github.com/arquivo/pwa-technologies/wiki/ImageSearch-API-v1.1-(beta)](https://github.com/arquivo/pwa-technologies/wiki/ImageSearch-API-v1.1-(beta))";"continuous";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-07-27T11:06:12.911000";"2021-07-27T11:08:53.225000";"";False;1;"";"";"";"";"0.78";0;0;0;12 "60f546740781908bf5936429";"Memento API (URL search)";"memento-api-url-search";"";"https://dados.gov.pt/pt/datasets/memento-api-url-search/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Arquivo.pt supports [Memento Protocol](https://tools.ietf.org/html/rfc7089) natively, because it uses [pywb ](https://github.com/ikreymer/pywb)for the replay of the archived Webpages. ""Memento API helps you find and view versions of web pages that existed at some time in the past"" Arquivo.pt provides the following Memento endpoints: - TimeGate: https://arquivo.pt/wayback/{url} - TimeMap: https://arquivo.pt/wayback/timemap/{type}/{url} The **type ** parameter can be any of the following: - **link**: returns an application/link-format as required by the Memento specification. - **cdxj**: returns a timemap in the native CDXJ format. - **json**: returns the timemap as newline-delimited JSON lines (NDJSON) format. Memento API only allows URL Search. For more informations visit: https://github.com/arquivo/pwa-technologies/wiki/Memento--API ";"continuous";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-07-19T10:31:32.731000";"2021-07-20T18:59:23.901000";"arquivo,arquivo-da-web,web-archive";False;2;"";"";"";"";"0.78";0;0;0;10 "60f5458407819087380eff84";"CDX server API (URL search)";"cdx-server-api-url-search";"";"https://dados.gov.pt/pt/datasets/cdx-server-api-url-search/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"Arquivo.pt supports CDX Server API. CDX-server API allows automatic access in order to list, sort, and filter preserved pages from a given URL. The only mandatory parameter to the CDX-server API is the URL, for example: https://arquivo.pt/wayback/cdx?url=dados.gov.pt will return a list of captures for 'dados.gov.pt' Full documentation at: * https://github.com/arquivo/pwa-technologies/wiki/URL-search:-CDX-server-API";"continuous";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-07-19T10:27:32.240000";"2021-07-20T18:54:06.901000";"arquivo,arquivo-da-web,web-archive";False;1;"";"";"";"";"0.78";0;0;0;19 "60f5447b07819082300778fe";"Arquivo.pt API (Full-text & URL search)";"arquivo-pt-api-full-text-url-search";"arquivo.pt-api";"https://dados.gov.pt/pt/datasets/arquivo-pt-api-full-text-url-search/";"Arquivo.pt - pesquise páginas do passado";"6087fbf7454ae34be8d6ce4e";"The TextSearch API allows full-text search and access preserved web content and related metadata. It is also possible to search by URL, accessing all versions of preserved web content. This API returns a JSON object. EndPoint: https://arquivo.pt/textsearch Note: a text search query returns a maximum of 2000 response results Full documentation: https://github.com/arquivo/pwa-technologies/wiki/Arquivo.pt-API";"continuous";"Creative Commons Attribution 4.0 - CC BY 4.0";"";"";"";"";False;False;"2021-07-19T10:23:07.505000";"2021-07-20T19:00:40.220000";"arquivo";False;1;"";"";"";"";"0.67";0;11;0;54