Desarquivo - dataset 04 grafo de ligações entre entidades Neo4j dataset04

Descrição

Grafo de ligações entre entidades e notícias (neste caso não foi preparado o comando com o neo4j-import mas aconselha-se esse face à opção LOAD CSV para datasets grandes) os dados são os mesmos do dataset 03 b mas, ao importar, são reorganizados de outra forma gerando um nó no grafo para cada notícia.

instruções de importação para neo4j:

USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///people.csv' AS row
MERGE (e:PER {_id: row._id, text: row.text});
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///orgs.csv' AS row
MERGE (e:ORG {_id: row._id, text: row.text});
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///locations.csv' AS row
MERGE (e:LOC {_id: row._id, text: row.text});
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///misc.csv' AS row
MERGE (e:MISC {_id: row._id, text: row.text});



USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///news.csv' AS row
MERGE (n:NEWS {_id: row._id, title: row.title});



USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///connections_1.csv' AS row
MERGE (e1 {_id: row._id1})
MERGE (e2 {_id: row._id2})
WITH row, e1, e2
MERGE (e1)-[:rel{weight: toInteger(row.weight)}]-(e2);

Para mais informações ver: https://github.com/msramalho/desarquivo/blob/master/DATASETS.md

Autor

Este conjunto de dados foi publicado por iniciativa e sob a responsabilidade de Miguel Sozinho Ramalho.

Última atualização

31 de agosto de 2021

Licença

Creative Commons Attribution 4.0 - CC BY 4.0

Qualidade dos metadados
100.0/100

Ainda não existem discussões para este conjunto de dados.

Ainda não existem recursos comunitários para este conjunto de dados.

Partilhe os seus recursos Saiba mais sobre a comunidade

Informação

Temporalidade

Criação

31 de agosto de 2021

Frequência

Punctual

Cobertura temporal

2000 à 2019

Última atualização

31 de agosto de 2021

Cobertura espacial

Granularidade da cobertura territorial

Países

Acções

Embutir

Estatísticas do ano

Reuses of this dataset

1

Subscritores

0